مگ می | MagMe
ChatGPT چگونه کار می کند؟ و چگونه می تواند به سوالات پاسخ دهد؟
بازدید 1089
مگ می تیم 427 روز پیش
بدون دیدگاه

ChatGPT چگونه کار می کند؟ و چگونه می تواند به سوالات پاسخ دهد؟

ممکن است تا الان از ChatGPT برای پاسخ دادن به سؤالی استفاده کرده‌اید، اما سوال اینجاست که چگونه به آنچه که از آن پرسیده می شود، پاسخ می‌دهد؟

ChatGPT ربات هوش مصنوعی OpenAI است که بازی را به نفع خود تغییر می دهد و دنیای اینترنت را شگفت زده می کند. برخلاف تمام گرایش‌های تکنولوژیک، مدت زیادی طول نکشید که ChatGPT راه خود را تقریباً در همه حوزه‌های زندگی دیجیتالی ما پیدا کرد.

تعداد بسیار کمی از نوآوری‌های فناوری به اندازه‌ای که ChatGPT در چنین مدت کوتاهی به آن دست یافته است، مورد توجه قرار گرفته است. به نظر می‌رسد هیچ وقت از ترفندهای جالب تهی نمی‌شود، هر روز، چیزهای هیجان‌انگیز جدیدی را از این ربات یاد می‌گیریم که تاکنون نمی‌دانستیم می‌تواند انجام دهد.

اما ChatGPT چگونه می تواند کارهایی را که می تواند انجام دهد، انجام دهد؟! یا ChatGPT چگونه کار می کند؟

ChatGPT چگونه ساخته شد؟

برای درک نحوه عملکرد ChatGPT، ارزش آن را دارد که به منشأ آن و مغز پشت چت این ربات پیشرفته هوش مصنوعی نگاه کنید.

اولاً، همانطور که ChatGPT ممکن است جادویی به نظر برسد، درست مانند هر فناوری نرم افزاری ارزشمندی که وجود دارد، توسط انسان های نابغه ساخته شده است. OpenAI ChatGPT، شرکت تحقیق و توسعه هوش مصنوعی انقلابی را ایجاد کرد که در پشت ابزارهای قدرتمند هوش مصنوعی مانند DALL-E، InstructGPT و Codex قرار دارد.

در حالی که ChatGPT در اواخر سال 2022 ویرال زیادی شد، بسیاری از فناوری‌های اساسی که ChatGPT را تقویت می‌کند مدت ها قبل وجود داشته است، هرچند در بین مردم شناخته نشده اند. مدل ChatGPT بر روی GPT-3 (یا به طور خاص تر، GPT-3.5) ساخته شده است. GPT مخفف “Generative Pre-trained Transformer 3” است.

GPT-3 سومین نسخه GPT از مدل های AI است و قبل از GPT-2 و GPT بود. نسخه های قبلی مدل های GPT به همان اندازه مفید هستند، اما GPT-3 و نسخه GPT-3.5 با تنظیمات دقیق، بسیار قوی تر هستند. بیشتر کارهایی که ChatGPT می تواند انجام دهد به دلیل فناوری GPT-3 است.

GPT چیست؟

بنابراین ما مشخص کردیم که ChatGPT بر اساس نسل سوم مدل GPT ساخته شده است. اما منظور از GPT چیست؟

بیایید با باز کردن کلمات اختصاری به روشی آسان برای هضم راحت تر و به دور از کلمات فنی شروع کنیم.

  • “Generative” در GPT نشان دهنده توانایی آن در تولید متن زبان طبیعی انسان است.
  • “Pre-trained” نشان دهنده این واقعیت است که مدل قبلاً بر روی برخی از داده های محدود آموزش داده شده است. مانند اینکه از شما خواسته شود به سؤالاتی پاسخ دهید، که قبلا یک کتاب یا چندین کتاب در مورد آن سوال ها خوانده اید.
  • “Transformer” معماری زیربنایی یادگیری ماشینی را نشان می دهد که GPT را تقویت می کند.
همچنین مطالعه کنید :  ChatGPT Plus در مقابل Perplexity: کدام ربات چت هوش مصنوعی بهتر است؟

اکنون، با کنار هم قرار دادن همه اینها، Generative Pre-trained Transformer (GPT) یک مدل زبانی است که با استفاده از داده های اینترنت با هدف تولید متن به زبان انسانی در صورت ارائه یک اعلان آموزش داده شده است. بنابراین، ما بارها گفته ایم که GPT آموزش دیده است، اما چگونه آموزش دیده است؟

ChatGPT چگونه آموزش داده شده است؟

خود ChatGPT از ابتدا آموزش ندیده بود. در عوض، این یک نسخه تنظیم شده از GPT-3.5 است که خود نسخه تنظیم شده GPT-3 است. مدل GPT-3 با حجم عظیمی از داده های جمع آوری شده از اینترنت آموزش داده شد. به ویکی‌پدیا، توییتر و ردیت فکر کنید؛ داده‌ها و متن‌های انسانی که از همه ی گوشه‌های اینترنت جمع آوری شده بود، تغذیه می‌شد.

اگر تعجب می کنید که آموزش GPT چگونه کار می کند، GPT-3 با استفاده از ترکیبی از یادگیری نظارت شده و یادگیری تقویتی از طریق بازخورد انسانی (RLHF) آموزش داده شده است. یادگیری نظارت شده مرحله ای است که مدل بر روی مجموعه داده بزرگی از متن جمع آوری شده از اینترنت آموزش می بیند. مرحله یادگیری تقویتی جایی است که آموزش داده می‌شود تا پاسخ‌های بهتری تولید کند که با آنچه انسان‌ها به عنوان گفته ی یک فرد معتبر و درست می‌پذیرند همسو باشد.

آموزش با یادگیری نظارت شده

برای درک بهتر اینکه چگونه یادگیری تحت نظارت و تقویتی در ChatGPT اعمال می شود، سناریویی را تصور کنید که در آن به دانش آموز نوشتن مقاله توسط معلم آموزش داده می شود. یادگیری تحت نظارت معادل این است که معلم صدها مقاله به دانش آموز بدهد تا بخواند. هدف در اینجا این است که دانش آموز با عادت کردن به لحن، واژگان و ساختار صدها مقاله یاد بگیرد که چگونه یک مقاله باید نوشته شود.

با این حال، در میان آن صدها مقاله، خوب و بد وجود خواهد داشت. از آنجایی که دانش آموز در مورد نسخه های خوب و بد آموزش دیده است، گاهی اوقات ممکن است دانش آموز مقاله بد بنویسد زیرا در مقطعی به دانش آموز انشاهای بد داده شده است. این بدان معناست که وقتی از دانش‌آموز خواسته می‌شود مقاله بنویسد، ممکن است نسخه‌ای بنویسد که برای معلم قابل قبول یا خوب نباشد. اینجاست که یادگیری تقویتی وارد می شود.

همچنین مطالعه کنید :  آموزش استفاده از Paint Cocreator برای ایجاد عکس با هوش مصنوعی در ویندوز 11

آموزش با یادگیری تقویتی

هنگامی که معلم ثابت کرد که دانش آموز با خواندن صدها مقاله قوانین کلی مقاله نویسی را درک می کند، معلم به دانش آموز تکالیف مکرر انشا نویسی می دهد. متعاقباً، معلم در مورد تکالیف انشائی بازخورد ارائه می‌کند و به دانش‌آموزان می‌گوید که چه کارهایی را خوب انجام داده‌اند و چه چیزی را می‌توانند بهبود بخشند. دانش آموز از بازخوردها برای هدایت تکالیف انشا بعدی استفاده می کند و به دانش آموز کمک می کند در طول زمان پیشرفت کند.

این شبیه به مرحله یادگیری تقویتی آموزش مدل GPT است. پس از تغذیه با حجم زیادی متن از اینترنت، مدل می تواند به سوالات پاسخ دهد. با این حال، دقت آن به اندازه کافی خوب نخواهد بود. مربیان انسانی از مدل سوالی می پرسند و بازخورد می دهند که کدام پاسخ برای هر سوال مناسب تر است.

این مدل از بازخورد برای بهبود توانایی خود در پاسخگویی دقیق تر به سوالات و بیشتر شبیه به نحوه پاسخگویی یک انسان استفاده می کند. اینگونه است که ChatGPT می‌تواند پاسخ‌های انسانی را تولید کند که هم منسجم، هم جذاب و هم به طور کلی دقیق هستند.

ChatGPT چگونه می تواند به سوالات پاسخ دهد؟

به سایت ChatGPT مراجعه می کنید و وارد سیستم می شوید. به ChatGPT می گویید: “یک آهنگ رپ به سبک اسنوپ داگ بنویس.” این آهنگ با اشعاری به آهنگ رپ پاسخ می دهد که به طور شگفت انگیزی شبیه به آنچه اسنوپ داگ می نوشت، پاسخ می دهد. چه طور ممکن است؟

تنها دلیل این پاسخ دقیق به سوال شما، تمرین و آموزش بسیار زیاد این سیستم است.

پس از پرداختن به هر کلمه از کتاب درسی فیزیک، این احتمال وجود دارد که بتوانید به هر سؤالی که از آن برای شما طرح می‌شود پاسخ دهید. چرا؟ زیرا شما آن را خوانده اید و آن را یاد گرفته اید. این موضوع در مورد ChatGPT یکسان است، این سیستم یاد می گیرد. و همانطور که تمدن بشری نشان داده است، با آموزش کافی، حل تقریباً هر مشکلی امکان پذیر است.

در حالی که احتمالاً می توانید صدها کتاب را در طول زندگی خود مدیریت کنید، ChatGPT یا GPT قبلاً بخش عظیمی از اینترنت را مطالعه کرده است. این میزان بسیار زیادی از اطلاعات است. در گوشه ای از اینترنت، احتمال بسیار زیاد متن آهنگ های متعدد اسنوپ داگ وجود دارد. بنابراین، ChatGPT باید آن دیتا را قبلا دریافت و مطالعه کرده باشد (به یاد داشته باشید، از قبل آموزش داده شده است) و الگوهای موجود در اشعار اسنوپ داگ را تشخیص داده باشد. سپس از “دانش” این الگو برای “پیش‌بینی” اشعار آهنگی مشابه آنچه اسنوپ داگ می‌نویسد استفاده می‌کند.

همچنین مطالعه کنید :  MetaAI چیست؟ و آیا می تواند با چت بات های دیگر رقابت کند؟

در اینجا تاکید بر “پیش بینی” است. ChatGPT به سوالات مانند انسان ها پاسخ نمی دهد. به عنوان مثال، وقتی با سوالی مانند “پایتخت پرتغال چیست؟” مواجه می شوید؟ شما می توانید به طور مطمئن لیسبون را در پاسخ بگویید و آن یک “واقعیت” است و احتمالی برای آن وجود ندارد . با این حال، ChatGPT به سوالات با اطمینان 100٪ پاسخ نمی دهد. در عوض، سعی می کند با توجه به داده هایی که در مجموعه داده های آموزشی خود مصرف کرده است، پاسخ درست را پیش بینی کند.

رویکرد ChatGPT برای پاسخ دادن به سوالات

برای درک بهتر مفهوم پیش‌بینی پاسخ‌ها، ChatGPT را به عنوان کارآگاهی که وظیفه حل یک قتل را بر عهده دارد، تصور کنید. به کارآگاه شواهدی ارائه می شود، اما آنها نمی دانند چه کسی قتل را انجام داده و چگونه اتفاق افتاده است. با این حال، با وجود شواهد کافی، کارآگاه می تواند با دقت زیادی “پیش بینی” کند که چه کسی مسئول قتل است و چگونه جنایت انجام شده است.

پس از دریافت داده‌ها از اینترنت، ChatGPT داده‌های اصلی را دور می‌اندازد و اتصالات عصبی یا الگوهایی را که از داده‌ها آموخته است ذخیره می‌کند. این اتصالات یا الگوها مانند شواهدی هستند که ChatGPT زمانی که سعی می کند به هر درخواستی پاسخ دهد آن را تجزیه و تحلیل می کند.

بنابراین، در تئوری، ChatGPT مانند یک کارآگاه بسیار خوب عمل می کند. به طور قطع نمی‌داند که حقایق یک پاسخ چیست، اما سعی می‌کند با دقت چشمگیری، دنباله‌ای منطقی از متن زبان انسان را پیش‌بینی کند که به بهترین وجه به سؤال پاسخ دهد. به این ترتیب شما پاسخ سوالات خود را دریافت می کنید.

و همچنین به همین دلیل است که برخی از این پاسخ ها بسیار قانع کننده به نظر می رسند، اما اشتباه هستند.

ChatGPT مانند یک انسان پاسخ می دهد، مانند یک ماشین فکر می کند

جزئیات فنی زیرساخت ChatGPT پیچیده است. با این حال، از یک دیدگاه ابتدایی، با یادگیری و باز آفرینی آنچه که آموخته است، درست مانند ما به عنوان انسان عمل می کند.

همانطور که ChatGPT از طریق تحقیقات تکامل می یابد، روش کار ممکن است تغییر کند. با این حال، اصول کار اساسی آن برای مدتی ثابت خواهد ماند، حداقل تا زمانی که یک فناوری جدید از راه برسد.

برچسب‌ها:,

بخش تبلیغات

 

نظرات کاربران

  •  چنانچه دیدگاهی توهین آمیز باشد و متوجه نویسندگان و سایر کاربران باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه ی تبلیغاتی داشته باشد تایید نخواهد شد.
  •  چنانچه از لینک سایر وبسایت ها و یا وبسایت خود در دیدگاه استفاده کرده باشید تایید نخواهد شد.
  •  چنانچه در دیدگاه خود از شماره تماس، ایمیل و آیدی تلگرام استفاده کرده باشید تایید نخواهد شد.
  • چنانچه دیدگاهی بی ارتباط با موضوع آموزش مطرح شود تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *