যেভাবে তৈরি হলো চ্যাটজিপিটি

ফয়সাল কবির 

OpenAI এর সাথে পর্দার অন্তরালের কথোপকথন

মূল লেখকঃ উইল ডগলাস হ্যাভেন

ভাষান্তরঃ ফয়সাল কবির 

২০২২ সালের নভেম্বরের শেষের দিকে OpenAI যখন চ্যাটজিপিটি চালু করে  তখন এই সান ফ্রান্সিসকো-ভিত্তিক কৃত্রিম-বুদ্ধিমত্তা কোম্পানিটির কাছে কারো তেমন কিছু প্রত্যাশাই ছিলনা। এটা ঠিক যে, OpenAI এর কেউই এরকম একটা ভাইরাল মেগা হিট এর জন্যে প্রস্তুত ছিলো না। 

এরকম একটা সফলতাকে পুঁজি করে এখন ফার্মটি উঠে পড়ে লেগেছে তার সাফল্য ধরে রাখতে।

OpenAI-এর নীতিনৈতিকতার উপর কাজ করা সন্ধিনী আগরওয়াল বলেছেন, এটিকে OpenAI এর অভ্যন্তরীণ গবেষণার একটি রূপরেখা হিসেবেই চিন্তা করা হয়েছিলো মাত্র। মূলত বছর দুই আগের পুরানো প্রযুক্তিকে ঘষামাজা করে এর সাথে জনসাধারণের কাছ থেকে প্রতিক্রিয়া সংগ্রহ করে এর ত্রুটিগুলি মেরামত করেই চ্যাটজিপিটি কে চালু করা হয়েছিলো। 

“আমরা এটিকে একটি বড় মৌলিক অগ্রগতি হিসাবে আগ বাড়িয়ে বলতে চাইনি,” কথাটি Liam Fedus, নামে OpenAI-এর একজন বিজ্ঞানীর  যিনি ChatGPT-তে কাজ করেছেন৷

চ্যাটবটটির পেছনের গল্পটি শুনতে, যেমন কীভাবে এটি তৈরি করা হয়েছে, কীভাবে OpenAI এটিকে প্রকাশের পর থেকে আপডেট করছে, এবং এর নির্মাতারাই বা এর সাফল্য সম্পর্কে কেমন অনুভব করছেন – এসবই জানতে আমি এ পর্যন্ত চারজনের সাথে কথা বলেছি যারা এটি তৈরি করতে সাহায্য করেছে যা বর্তমানে সবচেয়ে জনপ্রিয় ইন্টারনেট অ্যাপগুলির মধ্যে একটি হয়ে উঠেছে।

এজন্যে আগরওয়াল এবং ফেডাস ছাড়াও, আমি OpenAI-এর সহ-প্রতিষ্ঠাতা জন শুলম্যান এবং OpenAI-এর অ্যালাইনমেন্ট টিমের নেতা জন লেইকের সঙ্গে কথা বলেছি, এই টিমটি AI-এর ব্যবহারকারীরা AI কে দিয়ে যা করাতে চায় (এবং এর বেশি কিছু যেন ডেলিভারি না দেয়) এই ধরণের চ্যালেঞ্জ নিয়ে কাজ করে।

এদের সবার সাথে কথা বলে আমার যা মনে হয়েছে  তা হল যে OpenAI এখনও তার গবেষণার রূপরেখার সাফল্যের দ্বারা বিমোহিত, কিন্তু সেই সাথে এই প্রযুক্তিটিকে এগিয়ে নিয়ে যাওয়ার সুযোগটিও গ্রহণ করেছে, বিশেষ করে লক্ষ লক্ষ মানুষ কীভাবে এটি ব্যবহার করছে এবং এই ব্যবহারের মধ্যে সবচেয়ে খারাপ সমস্যাগুলি সমাধান করার চেষ্টা করছে।

নভেম্বর থেকে, OpenAI ইতিমধ্যে বেশ কয়েকবার ChatGPT আপডেট করেছে। গবেষকরা চ্যাটজিপিটিকে এর ব্যবহারকারীদের দ্বারা ধোঁকা খেয়ে উদ্ভট আচরণ করা (জেলব্রেকিং নামে পরিচিত) থেকে বিরত রাখতে  প্রতিপক্ষ প্রশিক্ষণ নামে একটি কৌশল ব্যবহার করছেন। এই প্রশিক্ষণ একাধিক চ্যাটবটকে একে অপরের বিরুদ্ধে দাঁড় করিয়ে দেয় যেখানে একটি চ্যাটবট প্রতিপক্ষের ভূমিকা পালন করে এবং অন্য চ্যাটবটকে টেক্সট তৈরি করে আক্রমণ করে যাতে এটি তার স্বাভাবিক সীমাবদ্ধতাগুলির বাইরে এসে অবাঞ্ছিত প্রতিক্রিয়া তৈরি করতে বাধ্য হয়। সফল আক্রমণগুলি ChatGPT-এর প্রশিক্ষণ ডেটাতে যোগ করা হয় এই আশায় যে ChatGPT এগুলো উপেক্ষা করতে শিখবে। 

OpenAI মাইক্রোসফটের সাথে মাল্টিবিলিয়ন ডলারের চুক্তিতেও স্বাক্ষর করেছে এবং বেইনের সাথে একটি জোট ঘোষণা করেছে, একটি বৈশ্বিক ব্যবস্থাপনা পরামর্শক সংস্থা, যেটি কোকা-কোলা সহ তার ক্লায়েন্টদের জন্য বিপণন প্রচারাভিযানে OpenAI এর জেনারেটিভ এআই মডেলগুলি ব্যবহার করার পরিকল্পনা করেছে৷ OpenAI-এর বাইরে, গুঞ্জন শোনা যাচ্ছে যে, বিশ্বব্যাপী ChatGPT ভাষার large model গুলি ঘিরে কোম্পানি এবং বিনিয়োগকারীদের বিপুল অর্থে  নিরলস কাজ করছে৷

মাত্র এই তিন মাসেই  অনেক প্রচারণা পেয়েছে ChatGPT ।  কিন্তু ChatGPT কোথা থেকে এসেছে? এটি মুক্তির জন্য কতটাই বা প্রস্তুতি ছিল বা  OpenAI কী পদক্ষেপ নিয়েছে? এবং তাদের পরবর্তী গন্তব্য কোথায়?

দৈর্ঘ্য এবং প্রাঞ্জলতার জন্য নিম্নলিখিত সাক্ষাতকারটি সম্পাদনা করা হয়েছে।

জ্যান লেইক: এটা তাজ্জব বানিয়েছে আমাদের, আমরা সত্যিই অবাক হয়েছি, এবং আমরা এই আগ্রহ ধরে রাখার চেষ্টা করছি।

জন শুলম্যান: মুক্তির পরের দিনগুলিতে আমি বারবার টুইটার চেক করছিলাম, এবং এই সময় ক্রেজ এমন ছিল যেখানে আমার ফিডটি চ্যাটজিপিটি স্ক্রিনশট দিয়ে ভরা ছিলো। আমি আশা করেছিলাম এটি মানুষের জন্য সহজাত হবে, এবং আমি আরো আশা করেছিলাম এটিকে মানুষ অনুসরণ করবে, কিন্তু আমি এটি মূলধারার জনপ্রিয়তার এই স্তরে পৌঁছবে বলে কখনোই ধারণা করিনি৷

সন্ধিনী আগরওয়াল: আমি মনে করি এটি আমাদের সকলের জন্য একটি বিস্ময়কর বিষয় ছিল যে এত এত লোকে এটি ব্যবহার করতে শুরু করবে। আসলে আমরা এই মডেলগুলিতে এত বেশি কাজ করি, আমরা ভুলে যাই যে তারা কখনও কখনও বাইরের বিশ্বের জন্য কতটা আশ্চর্যজনক হতে পারে।

লিয়াম ফেডাস: আমরা অবশ্যই অবাক হয়েছি যে এটি কতটা ভালভাবে গ্রহণ করা হয়েছিল। একটি সাধারণ-কাজের চ্যাটবট-এর জন্যে এর আগে এত বেশি প্রচেষ্টা করা হয়েছে যে আমি জানতাম যে আমাদের বিরুদ্ধে প্রতিকূলতা স্তূপ করা আছে। যাইহোক, আমাদের ব্যক্তিগত বেটা ভার্সন আমাদের আত্মবিশ্বাস দিয়েছে যে আমাদের কাছে এমন কিছু আছে যা লোকেরা সত্যিই উপভোগ করতে পারে।

জ্যান লেইক: আমি আরও ভালভাবে বুঝতে চাই যে কী আসলে এই ক্রেজ কে চালিত করছে- কী কারণে এত ভাইরাল হচ্ছে। সত্যিই, আমরা বুঝতে পারছি না। আমরা এখনো জানি না।

এই টীমের ধাঁধার একটি অংশ এই সত্য থেকে আসে যে ChatGPT-এর ভিতরের বেশিরভাগ প্রযুক্তি একদম নতুন নয়। চ্যাটজিপিটি হল GPT-3.5-এর একটি সূক্ষ্মতর সংস্করণ, একটি ভাষাভিত্তিক মডেলের একটি বড় পরিবার যা ওপেনএআই চ্যাটবটের বেশ আগে আত্মপ্রকাশ করেছিল। GPT-3.5 নিজেই GPT-3- এর একটি আপডেটেড সংস্করণ, যা 2020 সালে প্রকাশিত হয়েছিল৷ কোম্পানি এই মডেলগুলিকে তার ওয়েবসাইটে অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস বা API হিসাবে সহজলভ্য করে, যা অন্যান্য সফ্টওয়্যার ডেভেলপারদের পক্ষে তাদের নিজস্ব কোডে মডেলগুলি প্লাগইন করা সহজ করে তোলে। OpenAI 2022 সালের জানুয়ারিতে GPT-3.5-এর একটি পূর্ববর্তী সূক্ষ্মতর সংস্করণ প্রকাশ করেছে, যাকে InstructGPT বলা হয় । কিন্তু প্রযুক্তির এই পূর্ববর্তী সংস্করণগুলির একটিও জনসাধারণের কাছে সহজলভ্য করা হয়নি।

লিয়াম ফেডাস: ChatGPT মডেলটি InstructGPT-এর মতো একই ভাষার মডেল থেকে ফাইনটিউন করা হয়েছে, এবং আমরা এটিকে ফাইনটিউন করার জন্য একই পদ্ধতি ব্যবহার করেছি। আমরা কিছু কথোপকথন ডেটা যোগ করেছি এবং প্রশিক্ষণ প্রক্রিয়াটিকে কিছুটা সুরক্ষিত করেছি। তাই আমরা এটিকে একটি বড় মৌলিক অগ্রগতি হিসাবে oversell করতে চাইনি। বরং দেখা গিয়েছে যে, কথোপকথনের যে  ডেটা রয়েছে তা ChatGPT-এ একটি বড় ইতিবাচক প্রভাব ফেলেছে।

জন শুলম্যান: মডেলগুলোতে প্রযুক্তিগত যে কারিগরী, মানদণ্ডের বিচারে আসলে সেগুলির মধ্যে উল্লেখযোগ্য কোন পার্থক্য কিন্তু নেই! তবে হ্যা ChatGPT আরও সহজলভ্য এবং ব্যবহারযোগ্য।

জ্যান লেইক: এক অর্থে আপনি ChatGPT কে একটি AI সিস্টেমের সংস্করণ হিসাবে ভাবতে পারেন যা আমরা বেশ কিছুকাল ধরে ডেভেলপ করেছি। এটি আমাদের আগে যা ছিল তার চেয়ে মৌলিকভাবে বেশি সক্ষম মডেল নয়। ChatGPT বের হওয়ার আগে প্রায় এক বছর ধরে একই মৌলিক মডেলগুলি API-তে সহজলভ্য ছিল। অন্য অর্থে, মানুষ এটির সাথে যা করতে চায় তার সাথে আমরা এটিকে আরও সংযুক্ত করেছি। এটি আপনার সাথে সংলাপে কথা বলে, এটি একটি চ্যাট ইন্টারফেসের মাধ্যমে সহজেই অ্যাক্সেসযোগ্য, এটি আপনাকে সাহায্য করতেও চেষ্টা করে। এটি আশ্চর্যজনক অগ্রগতি, এবং আমি মনে করি যে লোকেরা তা উপলব্ধি করছে।

জন শুলম্যান: এটি আরও সহজে ব্যবহারকারীর মনের অভিপ্রায় অনুমান করে। এবং ব্যবহারকারীরা যা চান তা পেতে পারেন।

ChatGPT-কে InstructGPT-এর অনুরূপভাবে প্রশিক্ষণ দেওয়া হয়েছিল, মানব প্রতিক্রিয়া থেকে রিইনফোর্সমেন্ট লার্নিং (RLHF) নামে একটি কৌশল ব্যবহার করে। এটি ChatGPT এর বলা যেতে পারে সিক্রেট ইগ্রেডিয়েন্ট। মূল ধারণাটি হল একটি বড় ভাষা মডেল নেওয়ার ক্ষমতা সাথে এই প্রবণতা যে ব্যবহারকারী যা যা চায় তা ছুঁড়ে দেয়া (খাটি বাংলায় ফিক্কা মার স্টাইল!)। এই ক্ষেত্রে, শুধু ভার্সন টি ছিলো GPT-3.5—এবং মানব ব্যবহারকারীরা আসলে কী ধরনের প্রতিক্রিয়া পছন্দ করে তা শেখানোর মাধ্যমে এটিকে টিউন করা।

জান লেইক: আমাদের একটা বড়সড় ফিডব্যাক গোষ্ঠী ছিলো যারা ChatGPT প্রম্পট এবং প্রতিক্রিয়াগুলি পড়েছিল, এবং তারপর বলে দিতো যে একটি প্রতিক্রিয়া অন্য প্রতিক্রিয়ার চেয়ে পছন্দের ছিল কিনা। এই সমস্ত ডেটা তখন একটা প্রশিক্ষণ রানে একত্রিত করা হতো। আমরা InstructGPT এর সাথে যা করেছি তার বেশিরভাগই একই ধরণের জিনিস। কারণ একজন ডেভেলপার হিসেবে আপনি চান এটি আপনার সাহায্যকারী  হোক, সত্যবাদী হোক, আপনি এটিকে এক কথায় বানাতে চান  এক্কেবারে নিরাপদ ও অক্ষতিকারক। এছাড়াও এমন কিছু জিনিস রয়েছে যা সংলাপ তৈরি করতে এবং সংলাপ চালিয়ে যেতে সংযোজন করা খুব দরকারী। ধরেন জিনিসগুলি এমন, যে ব্যবহারকারীর প্রশ্নটি পরিষ্কার না হলে, যেনো চ্যাটবট আরো ফলো-আপ প্রশ্ন জিজ্ঞাসা করে। সেই সংগে এটাও স্পষ্ট করা উচিত যে এটি একটি AI সিস্টেম। এটির ব্যাপারে এমন একটি পরিচয় ধরে নেওয়া উচিত নয় যা এর নেই! বা এটির এমন ক্ষমতা রয়েছে ধারণা করা যা আসলেই এটির কাছে নেই, এবং যখন কোনও ব্যবহারকারী তাকে এমন কাজ করতে বলে যা এটি করার কথা নয়, তখন এটিকে প্রত্যাখ্যান বার্তা লিখে সেটা জানিয়ে দিতে হবে।

এই প্রশিক্ষণে যে লাইনগুলি আবির্ভূত হয়েছিল তার মধ্যে একটি ছিল “ওপেনএআই দ্বারা প্রশিক্ষিত একটি ভাষা মডেল হিসাবে …” এটি স্পষ্টভাবে আসলে APIতে রাখা হয়নি। তবে এটি এমন একটি জিনিস যা মানব রেটাররা বেশ উচ্চ র‍্যাঙ্ক দিয়েছে।

সন্ধিনী আগরওয়াল: হ্যাঁ, আমার মনে হয় তাই হয়েছে। বিভিন্ন মানদণ্ডের একটি তালিকা ছিল যা মানব রেটারদের মডেলটিকে সত্যতার মতো সাবজেক্ট নিয়েও র‌্যাঙ্ক করতে বলেছিলো। কিন্তু তারা এমন জিনিসগুলিকেও পছন্দ করতে শুরু করে যেগুলিকে তারা ভাল অনুশীলন বলে মনে করে, যেমন এমন কিছু হওয়ার ভান না করা যা আপনি নন। 

যেহেতু OpenAI এর আগে যে কৌশলগুলি ব্যবহার করেছিল সেই কৌশলগুলি ব্যবহার করে ChatGPT তৈরি করা হয়েছিল, তাই এই মডেলটি জনসাধারণের কাছে প্রকাশ করার প্রস্তুতির সময় দলটি আলাদা কিছু করেনি। তারা ধারণা করেছিল যে তারা পূর্ববর্তী মডেলগুলির জন্য যে মানদণ্ড  তারা সেট করেছিল তা যথেষ্ট ছিল।       

সন্ধিনী আগরওয়াল: আমরা যখন অবমুক্তির জন্য প্রস্তুতি নিচ্ছিলাম, তখন আমরা এই মডেলটিকে সম্পূর্ণ নতুন ঝুঁকি হিসেবে ভাবিনি। GPT-3.5 বিশ্বে ছিল, এবং আমরা জানি যে এটি ইতিমধ্যেই যথেষ্ট নিরাপদ। এবং মানুষের পছন্দের উপর ChatGPT-এর প্রশিক্ষণের মাধ্যমে, মডেলটি স্বয়ংক্রিয়ভাবে প্রত্যাখ্যান করার আচরণ শিখেছে, যেখানে এটি অনেক অনুরোধ প্রত্যাখ্যান করে।

জান লেইক: আমরা ChatGPT-এর জন্য কিছু অতিরিক্ত “রেড-টিমিং” করেছি, যেখানে OpenAI-এর সবাই বসে মডেলটি ভাঙার চেষ্টা করেছে। এবং আমরা বাইরের একটি গ্রুপ নিয়োগ করেও একই ধরনের জিনিস করিয়েছি। আমাদের বিশ্বস্ত ব্যবহারকারীদের জন্যে একটি আর্লি-অ্যাক্সেস প্রোগ্রামও ছিল, যার মাধ্যমে তারা ফিডব্যাক দিয়েছেন।

সন্ধিনী আগরওয়াল: আমরা খুঁজে পেয়েছি যে এটি কিছু অবাঞ্ছিত আউটপুট তৈরি করেছে, কিন্তু সেগুলি এমন সব জিনিস যা GPT-3.5ও তৈরি করে। তাই ঝুঁকির কথা বলতে গেলে, একটি গবেষণা পূর্ব রূপরেখা হিসাবে এটিকে ভালোই মনে হচ্ছিলো আমাদের।

জন শুলম্যান: আপনার সিস্টেমটি প্রকাশ করার জন্য নিখুঁত হওয়া পর্যন্ত আপনি আসলে অপেক্ষা করতে পারবেন না। আমরা কয়েক মাস ধরে আগের সংস্করণগুলি বিটা-পরীক্ষা করছিলাম, এবং বিটা পরীক্ষকদের পণ্যের ইতিবাচক প্রভাব ছিল। আমাদের সবচেয়ে বড় উদ্বেগ ছিল বাস্তবতাকে ঘিরে, কারণ মডেলটি ফেইক জিনিস তৈরি করতে পছন্দ করে। কিন্তু InstructGPT এবং অন্যান্য বৃহৎ ভাষার মডেলগুলি ইতিমধ্যেই রয়েছে, তাই আমরা ভেবেছিলাম যে যতক্ষণ না চ্যাটজিপিটি বাস্তবতা এবং নিরাপত্তার অন্যান্য বিষয়গুলির দিক থেকে তাদের চেয়ে ভাল করে, ততক্ষণ এটির প্রকাশ না হওয়া ভালো। অবমুক্তির আগে আমরা নিশ্চিত করেছি যে আমাদের সীমিত মূল্যায়ন অনুসারে মডেলগুলি অন্য মডেলের তুলনায় একটু বেশি বাস্তব এবং নিরাপদ বলে মনে হয়েছে, তাই আমরা প্রকাশের সাথে এগিয়ে যাওয়ার সিদ্ধান্ত নিয়েছি।

OpenAI, ChatGPT  লঞ্চের পর থেকে লোকেরা কীভাবে ChatGPT ব্যবহার করে তা দেখছে, প্রথমবারের মতো লক্ষ লক্ষ ব্যবহারকারীদের হাতে তুলে দিলে কীভাবে একটি বড় ভাষাভিত্তিক মডেলের ব্যবহার হয়, যারা এর সীমা পরীক্ষা করতে এবং এর ত্রুটিগুলি খুঁজতে অনেক সময় ব্যয় করেছে। দলটি ChatGPT কী তৈরি করতে পারে তার ভিতরে সবচেয়ে সমস্যাসংকুল চ্যালেঞ্জ গুলিতে ঝাঁপিয়ে পড়ার চেষ্টা করেছে — ধর্ষক পুরোহিতদের প্রতি ঈশ্বরের ভালবাসার গান থেকে শুরু করে ক্রেডিট কার্ড নম্বর চুরি করে এমন ম্যালওয়্যার কোড পর্যন্ত—এবং মডেলের ভবিষ্যত সংস্করণগুলিতে লাগাম লাগাতে সেগুলি ব্যবহার করে চলেছে।

সন্ধিনী আগরওয়াল: আমাদের অনেক পরবর্তী পদক্ষেপ রয়েছে। আমি নিশ্চিতভাবে মনে করি যে ChatGPT যেভাবে ভাইরাল হয়েছে তা অনেকগুলি সমস্যা তৈরি করেছে যা আমরা কিছুটা আঁচ করতে পেরেছিলাম। তবে সমস্যাগুলি এখন সমালোচনামূখর হয়ে উঠেছে—যেগুলি আমরা যত তাড়াতাড়ি সম্ভব সমাধান করতে চাই। যেমন, আমরা জানি মডেলটি এখনও খুব পক্ষপাতদুষ্ট। এবং হ্যাঁ, ChatGPT খারাপ অনুরোধগুলি প্রত্যাখ্যান করার ক্ষেত্রে খুব ভাল, কিন্তু প্রম্পটগুলি লেখার জন্য এটিকে বেশ সহজ করায় এটিকে আমরা যা প্রত্যাখ্যান করা শেখাতে চেয়েছিলাম তার সবই প্রত্যাখ্যান করবে এমন এখনো হয়ে ওঠেনি।

লিয়াম ফেদুস: ব্যবহারকারীদের কাছে বৈচিত্র্যময় এবং সৃজনশীল অ্যাপ্লিকেশনগুলি দেখতে রোমাঞ্চকর মনে হয়েছে, কিন্তু আমরা সবসময় উন্নতি করার ক্ষেত্রগুলিতে মনোনিবেশ করি৷ আমরা মনে করি যে একটি পুনরাবৃত্তিমূলক প্রক্রিয়ার মাধ্যমে যেখানে আমরা প্রকাশ করি, প্রতিক্রিয়া পাই এবং পরিমার্জন করি, সেখানে আমরা সুচারু এবং সক্ষম প্রযুক্তি তৈরি করতে পারি। আমাদের প্রযুক্তির বিকাশের সাথে সাথে নতুন সমস্যাগুলি অনিবার্যভাবে আবির্ভূত হয়।

সন্ধিনী আগরওয়াল: লঞ্চের কয়েক সপ্তাহের মধ্যে, আমরা কিছু ভয়ানক উদাহরণ দেখেছি যা লোকেরা খুঁজে পেয়েছিল, লোকেরা যেন বুনো পরিবেশে মধ্যে ভুতুড়ে কিছু দেখেছিল। আমরা তাদের প্রত্যেকের মূল্যায়ন করেছি এবং কীভাবে এটি ঠিক করা উচিত সে সম্পর্কে কথা বলেছি।

জান লেইক: কখনও কখনও এটি এমন কিছু যা টুইটারে ভাইরাল হয়েছে, কিন্তু আমাদের কাছে কিছু লোক   চুপচাপ যোগাযোগ করেও ফিডব্যাক দিয়েছে। 

সন্ধিনী আগরওয়াল: আমরা জেলব্রেক করার মতো অনেক কিছু খুঁজে পেয়েছি, এগুলা অবশ্যই বড় সমস্যা যা আমাদের ঠিক করতে হবে। কিন্তু মডেলটিকে খারাপ কিছু বলার জন্য ব্যবহারকারীদের এই জটিল পদ্ধতি চেষ্টা করতে হবে, এটি এমন কিছু নয় যা আমরা সম্পূর্ণভাবে মিস করেছি, বা এমন কিছু নয় যা আমাদের জন্য খুব আশ্চর্যজনক ছিল। তবুও, এটি এমন কিছু যা সারিয়ে তুলতে আমরা এখন সক্রিয়ভাবে কাজ করছি। যখন আমরা জেলব্রেকগুলি খুঁজে পাই, আমরা সেগুলিকে আমাদের প্রশিক্ষণ এবং পরীক্ষার ডেটাতে যুক্ত করি। আমরা যে সমস্ত ডেটা দেখছি তা আসলে একটি ভবিষ্যত মডেলে ফিড করা হচ্ছে।

জান লেইক:  প্রতিবার আমাদের কাছে একটি ভাল মডেল তৈরি হলে, আমরা এটি প্রকাশ করতে এবং এটি পরীক্ষা করতে চাই। আমরা খুব আশাবাদী যে কিছু টার্গেটেড প্রতিপক্ষ প্রশিক্ষণ জেলব্রেকিং সহ পরিস্থিতির অনেক উন্নতি করতে পারে। এই সমস্যাগুলি সম্পূর্ণভাবে চলে যাবে কিনা তা স্পষ্ট নয়, তবে আমরা মনে করি আমরা অনেক জেলব্রেকিংকে আরও কঠিন করে তুলতে পারবো। আবার, তাই বলে এটা এমন নয় যে অবমুক্তির আগে যে জেলব্রেকিং সম্ভব ছিল তা আমরা একেবারেই জানতাম না। আমি মনে করি আপনি একবার এই সিস্টেমগুলি মোতায়েন করার পরে প্রকৃত নিরাপত্তা সমস্যাগুলি কী কী হতে চলেছে তা সত্যিই অনুমান করা খুব কঠিন। তাই লোকেরা কীসের জন্য সিস্টেম ব্যবহার করছে তা নিরীক্ষণের উপর আমরা অনেক জোর দিচ্ছি, কী ঘটছে তা দেখছি এবং তারপরে প্রতিক্রিয়া জানাচ্ছি। এটি বলার অপেক্ষা রাখে না যে আমরা যখন সমস্যাগুলি প্রত্যাশা করি তখন আমাদের সক্রিয়ভাবে নিরাপত্তা সমস্যাগুলি প্রশমিত করা উচিত নয়। কিন্তু হ্যাঁ, যখন একটি সিস্টেম বাস্তব জগতে আঘাত হানবে তখন যা ঘটবে তার সবকিছুই ভবিষ্যদ্বাণী করা খুব কঠিন।

জানুয়ারিতে, মাইক্রোসফ্ট বিং চ্যাট প্রকাশ করেছে, একটি অনুসন্ধান চ্যাটবট যা অনেকেই OpenAI-এর আনুষ্ঠানিকভাবে অঘোষিত GPT-4-এর একটি সংস্করণ বলে ধরে নেয়। (OpenAI বলে: “বিং আমাদের পরবর্তী প্রজন্মের একটি মডেল দ্বারা চালিত যা মাইক্রোসফ্ট বিশেষভাবে অনুসন্ধানের জন্য কাস্টমাইজ করেছে৷ এটি ChatGPT এবং GPT-3.5-এর অগ্রগতিগুলিকে অন্তর্ভুক্ত করে৷”) নিরাপত্তা নিশ্চিত করে বহু টেক জায়ান্টদের দ্বারা চ্যাটবট ব্যবহার বেশ আগে থেকেই সৃষ্টি হয়েছে যা অন্তর্নিহিত মডেল নির্মাণের দায়িত্বপ্রাপ্তদের জন্য নতুন চ্যালেঞ্জ।

সন্ধিনী আগরওয়াল: এই মডেলগুলির সাথে স্পষ্টতই একটি জিনিস যা সত্যিই গুরুত্বপূর্ণ তা হল সেগুলি যে প্রেক্ষাপটে ব্যবহার করা হচ্ছে। গুগল এবং মাইক্রোসফ্টের মতো, এমনকি একটি জিনিস বাস্তবসম্মত না হওয়াও এত বড় সমস্যা হয়ে দাঁড়িয়েছে কারণ সেগুলিকে সার্চ ইঞ্জিন হিসেবেই তৈরি করা হয়েছে। অনুসন্ধানের মতো কিছুর জন্য একটি বৃহৎ ভাষার মডেলের প্রয়োজনীয় আচরণ এমন কিছুর চেয়ে খুব আলাদা যা কেবল একটি খেলার চ্যাটবট হিসাবে ব্যবহৃত হয়৷ আমরা এই সমস্ত ভিন্ন ভিন্ন ব্যবহারের মধ্যে লাইন ধরে কীভাবে হাঁটছি তা ভেবে বের করতে হবে। মোদ্দাকথা এমন কিছু তৈরি করা যা বিভিন্ন প্রেক্ষাপট জুড়ে মানুষের জন্য দরকারী, যেখানে পছন্দসই আচরণ সত্যিই পরিবর্তিত হতে পারে। এটি আরও চাপ যোগ করে আমাদের উপর। কারণ আমরা এখন জানি যে আমরা এই মডেলগুলি তৈরি করছি যাতে সেগুলিকে পণ্যে পরিণত করা যায়। চ্যাটজিপিটি এখন একটি পণ্য যার এপিআই আমাদের কাছে রয়েছে। আমরা এই সাধারণ-উদ্দেশ্য নিমিত্তে প্রযুক্তি তৈরি করছি এবং আমাদের নিশ্চিত করতে হবে যে এটি সবকিছুতে ভালভাবে কাজ করে। এটা আমরা এই মুহূর্তে মূল চ্যালেঞ্জগুলির মধ্যে একটি।

জন শুলম্যান: লোকেরা ChatGPT-তে রাজনীতির বিষয়ে কতটা অনুসন্ধান ও খোঁজ নেবে তা আমি অবমূল্যায়ন করেছি। প্রশিক্ষণের ডেটা সংগ্রহ করার সময় আমরা সম্ভাব্যভাবে আরো কিছু ভাল সিদ্ধান্ত নিতে পারতাম, যা এই সমস্যাটিকে কমিয়ে দিতে পারতো। আমরা এখন এটা নিয়ে কাজ করছি।

জান লেইক: আমার দৃষ্টিকোণ থেকে, চ্যাটজিপিটি অনেকক্ষেত্রেই ব্যর্থ—এখানে অনেক কিছু করার আছে। আমরা এই সমস্যাগুলি সমাধান করেছি বলে মনে হয় না। প্রযুক্তির সীমাবদ্ধতা সম্পর্কে আমাদের সকলকে নিজেদের এবং অন্যদের কাছে খুব স্পষ্ট হতে হবে। আমি বলতে চাচ্ছি, ভাষাভিত্তিক মডেলগুলি এখন কিছুদিন হলো চালু রয়েছে, তবে এটি এখনও প্রাথমিক দিকেই রয়েছে। তাদের সব সমস্যার কথা আমরা জানি। আমি মনে করি আমাদেরকে খুব অগ্রগামী হতে হবে, এবং প্রত্যাশাগুলি পরিচালনা করতে হবে এবং এটি পরিষ্কার করে দিতে হবে যে এটি একটি সম্পূর্ণ সমাপ্ত পণ্য নয়।

ফয়সাল কবিরের সকল আর্টিকেল দেখুন এখানে…

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Reviews

Popular Articles