ChatGPT چگونه کار می کند؟ و چگونه می تواند به سوالات پاسخ دهد؟
ممکن است تا الان از ChatGPT برای پاسخ دادن به سؤالی استفاده کردهاید، اما سوال اینجاست که چگونه به آنچه که از آن پرسیده می شود، پاسخ میدهد؟
ChatGPT ربات هوش مصنوعی OpenAI است که بازی را به نفع خود تغییر می دهد و دنیای اینترنت را شگفت زده می کند. برخلاف تمام گرایشهای تکنولوژیک، مدت زیادی طول نکشید که ChatGPT راه خود را تقریباً در همه حوزههای زندگی دیجیتالی ما پیدا کرد.
تعداد بسیار کمی از نوآوریهای فناوری به اندازهای که ChatGPT در چنین مدت کوتاهی به آن دست یافته است، مورد توجه قرار گرفته است. به نظر میرسد هیچ وقت از ترفندهای جالب تهی نمیشود، هر روز، چیزهای هیجانانگیز جدیدی را از این ربات یاد میگیریم که تاکنون نمیدانستیم میتواند انجام دهد.
اما ChatGPT چگونه می تواند کارهایی را که می تواند انجام دهد، انجام دهد؟! یا ChatGPT چگونه کار می کند؟
فهرست مطالب
ChatGPT چگونه ساخته شد؟
برای درک نحوه عملکرد ChatGPT، ارزش آن را دارد که به منشأ آن و مغز پشت چت این ربات پیشرفته هوش مصنوعی نگاه کنید.
اولاً، همانطور که ChatGPT ممکن است جادویی به نظر برسد، درست مانند هر فناوری نرم افزاری ارزشمندی که وجود دارد، توسط انسان های نابغه ساخته شده است. OpenAI ChatGPT، شرکت تحقیق و توسعه هوش مصنوعی انقلابی را ایجاد کرد که در پشت ابزارهای قدرتمند هوش مصنوعی مانند DALL-E، InstructGPT و Codex قرار دارد.
در حالی که ChatGPT در اواخر سال 2022 ویرال زیادی شد، بسیاری از فناوریهای اساسی که ChatGPT را تقویت میکند مدت ها قبل وجود داشته است، هرچند در بین مردم شناخته نشده اند. مدل ChatGPT بر روی GPT-3 (یا به طور خاص تر، GPT-3.5) ساخته شده است. GPT مخفف “Generative Pre-trained Transformer 3” است.
GPT-3 سومین نسخه GPT از مدل های AI است و قبل از GPT-2 و GPT بود. نسخه های قبلی مدل های GPT به همان اندازه مفید هستند، اما GPT-3 و نسخه GPT-3.5 با تنظیمات دقیق، بسیار قوی تر هستند. بیشتر کارهایی که ChatGPT می تواند انجام دهد به دلیل فناوری GPT-3 است.
GPT چیست؟
بنابراین ما مشخص کردیم که ChatGPT بر اساس نسل سوم مدل GPT ساخته شده است. اما منظور از GPT چیست؟
بیایید با باز کردن کلمات اختصاری به روشی آسان برای هضم راحت تر و به دور از کلمات فنی شروع کنیم.
- “Generative” در GPT نشان دهنده توانایی آن در تولید متن زبان طبیعی انسان است.
- “Pre-trained” نشان دهنده این واقعیت است که مدل قبلاً بر روی برخی از داده های محدود آموزش داده شده است. مانند اینکه از شما خواسته شود به سؤالاتی پاسخ دهید، که قبلا یک کتاب یا چندین کتاب در مورد آن سوال ها خوانده اید.
- “Transformer” معماری زیربنایی یادگیری ماشینی را نشان می دهد که GPT را تقویت می کند.
اکنون، با کنار هم قرار دادن همه اینها، Generative Pre-trained Transformer (GPT) یک مدل زبانی است که با استفاده از داده های اینترنت با هدف تولید متن به زبان انسانی در صورت ارائه یک اعلان آموزش داده شده است. بنابراین، ما بارها گفته ایم که GPT آموزش دیده است، اما چگونه آموزش دیده است؟
ChatGPT چگونه آموزش داده شده است؟
خود ChatGPT از ابتدا آموزش ندیده بود. در عوض، این یک نسخه تنظیم شده از GPT-3.5 است که خود نسخه تنظیم شده GPT-3 است. مدل GPT-3 با حجم عظیمی از داده های جمع آوری شده از اینترنت آموزش داده شد. به ویکیپدیا، توییتر و ردیت فکر کنید؛ دادهها و متنهای انسانی که از همه ی گوشههای اینترنت جمع آوری شده بود، تغذیه میشد.
اگر تعجب می کنید که آموزش GPT چگونه کار می کند، GPT-3 با استفاده از ترکیبی از یادگیری نظارت شده و یادگیری تقویتی از طریق بازخورد انسانی (RLHF) آموزش داده شده است. یادگیری نظارت شده مرحله ای است که مدل بر روی مجموعه داده بزرگی از متن جمع آوری شده از اینترنت آموزش می بیند. مرحله یادگیری تقویتی جایی است که آموزش داده میشود تا پاسخهای بهتری تولید کند که با آنچه انسانها به عنوان گفته ی یک فرد معتبر و درست میپذیرند همسو باشد.
آموزش با یادگیری نظارت شده
برای درک بهتر اینکه چگونه یادگیری تحت نظارت و تقویتی در ChatGPT اعمال می شود، سناریویی را تصور کنید که در آن به دانش آموز نوشتن مقاله توسط معلم آموزش داده می شود. یادگیری تحت نظارت معادل این است که معلم صدها مقاله به دانش آموز بدهد تا بخواند. هدف در اینجا این است که دانش آموز با عادت کردن به لحن، واژگان و ساختار صدها مقاله یاد بگیرد که چگونه یک مقاله باید نوشته شود.
با این حال، در میان آن صدها مقاله، خوب و بد وجود خواهد داشت. از آنجایی که دانش آموز در مورد نسخه های خوب و بد آموزش دیده است، گاهی اوقات ممکن است دانش آموز مقاله بد بنویسد زیرا در مقطعی به دانش آموز انشاهای بد داده شده است. این بدان معناست که وقتی از دانشآموز خواسته میشود مقاله بنویسد، ممکن است نسخهای بنویسد که برای معلم قابل قبول یا خوب نباشد. اینجاست که یادگیری تقویتی وارد می شود.
آموزش با یادگیری تقویتی
هنگامی که معلم ثابت کرد که دانش آموز با خواندن صدها مقاله قوانین کلی مقاله نویسی را درک می کند، معلم به دانش آموز تکالیف مکرر انشا نویسی می دهد. متعاقباً، معلم در مورد تکالیف انشائی بازخورد ارائه میکند و به دانشآموزان میگوید که چه کارهایی را خوب انجام دادهاند و چه چیزی را میتوانند بهبود بخشند. دانش آموز از بازخوردها برای هدایت تکالیف انشا بعدی استفاده می کند و به دانش آموز کمک می کند در طول زمان پیشرفت کند.
این شبیه به مرحله یادگیری تقویتی آموزش مدل GPT است. پس از تغذیه با حجم زیادی متن از اینترنت، مدل می تواند به سوالات پاسخ دهد. با این حال، دقت آن به اندازه کافی خوب نخواهد بود. مربیان انسانی از مدل سوالی می پرسند و بازخورد می دهند که کدام پاسخ برای هر سوال مناسب تر است.
این مدل از بازخورد برای بهبود توانایی خود در پاسخگویی دقیق تر به سوالات و بیشتر شبیه به نحوه پاسخگویی یک انسان استفاده می کند. اینگونه است که ChatGPT میتواند پاسخهای انسانی را تولید کند که هم منسجم، هم جذاب و هم به طور کلی دقیق هستند.
ChatGPT چگونه می تواند به سوالات پاسخ دهد؟
به سایت ChatGPT مراجعه می کنید و وارد سیستم می شوید. به ChatGPT می گویید: “یک آهنگ رپ به سبک اسنوپ داگ بنویس.” این آهنگ با اشعاری به آهنگ رپ پاسخ می دهد که به طور شگفت انگیزی شبیه به آنچه اسنوپ داگ می نوشت، پاسخ می دهد. چه طور ممکن است؟
تنها دلیل این پاسخ دقیق به سوال شما، تمرین و آموزش بسیار زیاد این سیستم است.
پس از پرداختن به هر کلمه از کتاب درسی فیزیک، این احتمال وجود دارد که بتوانید به هر سؤالی که از آن برای شما طرح میشود پاسخ دهید. چرا؟ زیرا شما آن را خوانده اید و آن را یاد گرفته اید. این موضوع در مورد ChatGPT یکسان است، این سیستم یاد می گیرد. و همانطور که تمدن بشری نشان داده است، با آموزش کافی، حل تقریباً هر مشکلی امکان پذیر است.
در حالی که احتمالاً می توانید صدها کتاب را در طول زندگی خود مدیریت کنید، ChatGPT یا GPT قبلاً بخش عظیمی از اینترنت را مطالعه کرده است. این میزان بسیار زیادی از اطلاعات است. در گوشه ای از اینترنت، احتمال بسیار زیاد متن آهنگ های متعدد اسنوپ داگ وجود دارد. بنابراین، ChatGPT باید آن دیتا را قبلا دریافت و مطالعه کرده باشد (به یاد داشته باشید، از قبل آموزش داده شده است) و الگوهای موجود در اشعار اسنوپ داگ را تشخیص داده باشد. سپس از “دانش” این الگو برای “پیشبینی” اشعار آهنگی مشابه آنچه اسنوپ داگ مینویسد استفاده میکند.
در اینجا تاکید بر “پیش بینی” است. ChatGPT به سوالات مانند انسان ها پاسخ نمی دهد. به عنوان مثال، وقتی با سوالی مانند “پایتخت پرتغال چیست؟” مواجه می شوید؟ شما می توانید به طور مطمئن لیسبون را در پاسخ بگویید و آن یک “واقعیت” است و احتمالی برای آن وجود ندارد . با این حال، ChatGPT به سوالات با اطمینان 100٪ پاسخ نمی دهد. در عوض، سعی می کند با توجه به داده هایی که در مجموعه داده های آموزشی خود مصرف کرده است، پاسخ درست را پیش بینی کند.
رویکرد ChatGPT برای پاسخ دادن به سوالات
برای درک بهتر مفهوم پیشبینی پاسخها، ChatGPT را به عنوان کارآگاهی که وظیفه حل یک قتل را بر عهده دارد، تصور کنید. به کارآگاه شواهدی ارائه می شود، اما آنها نمی دانند چه کسی قتل را انجام داده و چگونه اتفاق افتاده است. با این حال، با وجود شواهد کافی، کارآگاه می تواند با دقت زیادی “پیش بینی” کند که چه کسی مسئول قتل است و چگونه جنایت انجام شده است.
پس از دریافت دادهها از اینترنت، ChatGPT دادههای اصلی را دور میاندازد و اتصالات عصبی یا الگوهایی را که از دادهها آموخته است ذخیره میکند. این اتصالات یا الگوها مانند شواهدی هستند که ChatGPT زمانی که سعی می کند به هر درخواستی پاسخ دهد آن را تجزیه و تحلیل می کند.
بنابراین، در تئوری، ChatGPT مانند یک کارآگاه بسیار خوب عمل می کند. به طور قطع نمیداند که حقایق یک پاسخ چیست، اما سعی میکند با دقت چشمگیری، دنبالهای منطقی از متن زبان انسان را پیشبینی کند که به بهترین وجه به سؤال پاسخ دهد. به این ترتیب شما پاسخ سوالات خود را دریافت می کنید.
و همچنین به همین دلیل است که برخی از این پاسخ ها بسیار قانع کننده به نظر می رسند، اما اشتباه هستند.
ChatGPT مانند یک انسان پاسخ می دهد، مانند یک ماشین فکر می کند
جزئیات فنی زیرساخت ChatGPT پیچیده است. با این حال، از یک دیدگاه ابتدایی، با یادگیری و باز آفرینی آنچه که آموخته است، درست مانند ما به عنوان انسان عمل می کند.
همانطور که ChatGPT از طریق تحقیقات تکامل می یابد، روش کار ممکن است تغییر کند. با این حال، اصول کار اساسی آن برای مدتی ثابت خواهد ماند، حداقل تا زمانی که یک فناوری جدید از راه برسد.
نظرات کاربران