آیا تا به حال به نحوه کار چت جی پی تی فکر کردهاید؟ با قاطعیت میتوان گفت که چت جی پی تی یکی از مهمترین برنامههایی است که در دهه گذشته عرضه شده است. در ابتدا چت جی پی تی (Chatgpt) تنها یک ربات برای مدل زبانی Open AI بود بااینحال امروزه چت جی پی تی امکانات بسیار بیشتری را در اختیار کاربرانش میگذارد. جستوجو کردن در اینترنت، ساخت عکس و حتی شعر گفتن تنها بخشی از قابلیتهایی است که Chatgpt در اختیار کاربرانش قرار داده است.
با گسترش قابلیتهای چت جی پی تی و اضافه شدن مدلهای جدید به آن، توضیح دادن نحوه کار چت جی پی تی سخت و سختتر میشود. بااینحال امروز در وبسایت فراسیب قصد داریم تا با نحوه کار چت جی پی تی بیشتر آشنا شویم. پس اگر شما هم میخواهید اطلاعات بیشتری در مورد نحوه کار چت جی پی تی به دست آورید با ما در ادامه همراه باشید.
چت جی پی تی چیست؟
بسیاری از شما با Chtagpt آشنا هستید و حتما تاکنون از آن نیز استفاده کردهاید. بااینحال بهتر است قبل از اینکه به بررسی نحوه کار چت جی پی تی بپردازیم کمی در رابطه با این برنامه و قابلیتهای آن توضیحاتی بدهیم. Chatgpt را میتوان یک رابط کاربری برای استفاده از پیشرفتهترین مدلهای هوش مصنوعی به شمار آورد. Chatgpt میتواند بهعنوان یک هوش مصنوعی با شما گفتوگو کرده و به سوالات شما پاسخ دهد.
چت جی پی تی چیست؟
برخی از مهمترین قابلیتهای Chatgpt را میتوان در موارد زیر دستهبندی کرد:
- تولید تصاویر: چت جی پی تی میتواند متن نوشته شده را به تصویر تبدیل کند.
- حل مسائل پیچیده: چت جی پی تی میتواند به شما در حل مسائل پیچیده ریاضی و غیره کمک کند.
- جستوجو در اینترنت: Chatgpt میتواند به جستوجو در اینترنت بپردازد و به سوالات شما پاسخ دهد.
- کد نویسی: چت جی پی تی میتواند کدها را در زبانهای مختلف برنامهنویسی تولید کند.
اینها تنها بخشی از قابلیتهای پیچیده این هوش مصنوعی است؛ خلاصه کردن متن، ترجمه زبانهای مختلف، کمک به نوشتن ایمیل و غیره ازجمله سایر قابلیتهای هوش مصنوعی Chatgpt به شمار میرود. البته باید بدانید که برای استفاده از بسیاری از قابلیتهای Chatgpt لازم است تا اکانت و اشتراک چت جی پی تی ChatGPT را تهیه کنید.
نحوه کار چت جی پی تی
بعدازاینکه در رابطه با اینکه چت جی پی تی چیست و چه قابلیت هایی دارد صحبت کردیم، بهتر است وقت را تلف نکرده و به موضوع اصلی مقاله یعنی نحوه کار چت جی پی تی بپردازیم. اگر در اسم Chatgpt دقت کرده باشید مطمئنا کنجکاو میشوید که معنی GPT چیست؟ GPT مخفف عبارت Generative Pre-trained Transformer به معنای ترنسفورمر تولیدگر از پیش آموزش دیده است. تا زمان عرضه مدل Open AI o1، تمام مدلهای زبانی شرکت اوپن ای آی از نامگذاری GPT استفاده میکردند. باوجوداینکه نامگذاریها تغییر کرده است ولی همچنان پایه و اساس مدلهای جدید نیز شبیه به یکدیگر است.
نحوه کار چت جی پی تی
مفاهیمی که در ادامه به بررسی آنها میپردازیم ممکن است کمی برای شما نامفهوم باشد ولی درک آنها برای دانستن نحوه کار چت جی پی تی و مدلهای زبانی به کار برده شده اهمیت زیادی دارد.
یادگیری نظارت شده در برابر یادگیری بدون نظارت (Supervised vs. unsupervised)
یکی از مهمترین بخشهای هر مدل هوش مصنوعی، «آموزش» است. حرف P در عبارت GPT مربوط به Pre-Trained یا پیش آموزش است. آموزش یکی از ارکان مهمی است که باعث میشود تا هوش مصنوعی بتواند به سوال های کاربران پاسخ دهد. در نامگذاری مدلهای جدید هوش مصنوعی دیگر خبری از حرف P نیست. مدلهای جدید هوش مصنوعی نیز پیش آموزش دیده هستند ولی به دلیل اینکه این موضوع در مورد همه هوش مصنوعیها صادق است دیگر در نامگذاریهای جدید به آن توجه نمیشود.
تا قبل از مدل هوش مصنوعی GPT-1، بهترین مدلهای هوش مصنوعی از مکانیزم یادگیری نظارت شده برای توسعه الگوریتم استفاده میکردند. در این مدلها از دادههایی با برچسبهای مشخص برای آموزش دیدن استفاده میشد. بهعنوانمثال، پایگاه دادهای از عکسهای حیوانات با توضیحات متنی مشخصی برچسبگذاری شده و با استفاده از این دادهها هوش مصنوعی آموزش داده میشد.
نحوه کار چت جی پی تی چه گونه است؟
یادگیری نظارتشده محدودیتهای خاص خود را دارد. بهعنوانمثال، دادههای مناسب که با دقت کافی برچسبگذاری شده باشند بهاندازه کافی در دسترس نیست و همچنین هزینههای تولید این دادهها نیز بسیار بالا است. در چنین حالتی در مدل GPT-1 از روش دیگری به نام پیش آموزش مولد (Generative Pre-training) استفاده شد.
مدل GPT-1 با چند قانون اصلی راهاندازی شده و سپس مقدار زیادی دادههای بدون برچسب در اختیار آن قرار داده شد. این دادهها تقریبا شامل کل فضای رایگان اینترنت میشدند. مدل GPT-1، این دادهها را پردازش و روابط بین آنها را بهطور خودکار آموخت. این مدل پایه و اساس هوش مصنوعیهای فعلی به شمار میرود.
Open AI با ادامه دادن فرآیند توسعه توانست تا مدلهای جدیدتر خود را با دادههای بیشتری ازجمله دادههای غیر متنی آموزش دهد. بهعنوانمثال، GPT-4 از همان اصول اولیه استفاده میکند با این تفاوت که علاوه بر متن، توانایی پردازش دادههای تصویری و صوتی را نیز دارند. نکتهای که در مورد یادگیری بدون نظارت وجود دارد این است که خروجی آن را نمیتوان بهصورت کامل پیشبینی کرد. معمولا در این مدلها از روشهایی استفاده میشود که با نام تنظیم دقیق (Fine-tuning) شناخته میشود. این روشها کمک میکند تا خروجی مدلها قابل پیشبینیتر شود.
معماری ترنسفورمر
در ادامه صحبت در رابطه با نحوه کار چت جی پی تی بهتر است با معماری ترنسفورمر ( Transformer architecture) نیز آشنا شویم. این معماری یک الگوریتم پیچیده و چندلایه است که از روی ساختار مغز انسان ساخته شده است. این معماری این قابلیت را به هوش مصنوعی Chatgpt میدهد تا بتواند الگوها و روابط موجود در دادههای متنی را یاد گرفته و سپس بتواند پاسخهای مشابه انسان را با پیشبینی متن بعدی در یک جمله ارائه دهد.
حرف T در عبارت GPT مخفف معماری تراسنفورمر است که در سال 2017 در یک مقاله معرفی شد. این معماری را میتوان عامل اصلی پیشرفتهای خیرهکننده هوش مصنوعی در چند سال گذشته دانست. معماری ترنسفورمر ازلحاظ فنی بسیار پیچیده است؛ ولی جالب است بدانید که این معماری توانست تا نحوه طراحی الگوریتمهای هوش مصنوعی را سادهتر کند. در این معماری، مدلها میتوانند محاسبات را بهصورت موازی انجام داده که به همین علت زمان آموزش آنها بسیار کمتر میشود. میتوان اینگونه گفت که معماری ترنسفورمر توانست تا نهتنها هوش مصنوعیها را قویتر کند بلکه تولید آنها را نیز سریعتر و ارزانتر نماید.
توکن ها در چت جی پی تی
برای اینکه با نحوه کار چت جی پی تی آشنا شویم باید بدانیم که چگونه هوش مصنوعی توانایی درک متنهای داده شده را دارد. برای درک نحوه کار چت جی پی تی باید با مفهومی به نام توکنها آشنا شویم. GPT-3 مدلی بود که تقریبا شامل 500 میلیارد توکن آموزش دیده بود. این میزان عظیم باعث میشد تا هوش مصنوعی Chatgpt بتواند معانی را بهتر تشخیص داده و متنهای بعدی را بهصورت منطقی پیشبینی کند. در مدلهای زبانی، کلمات به یک توکن تبدیل میشوند و کلمات طولانیتر یا پیچیدهتر نیز میتوانند تبدیل به چند توکن شوند. هر توکن شامل حدودا چهار کارکتر میشود.
توکن در هوش مصنوعی چیست؟
تمام توکن های متنی که در GPT-3 مورد استفاده قرار گرفته شده بود از اطلاعاتی مانند کتابها، مقالات، اسناد موجود در اینترنت و غیره به دست آورده شده است. در مدلهای جدید زبانی مثل o1، علاوه بر دادههای انسانی از دادههای مصنوعی (دادههایی که توسط هوش مصنوعی ایجاد شده است) نیز برای آموزش هوش مصنوعی استفاده میشود. بر اساس این دادههای آموزشی، شبکه عصبی GPT-3 شامل 175 میلیارد پارامتر میشود که این متغیرها این امکان را میدهند تا هوش مصنوعی بتواند ورودی را دریافت کرده و بر اساس آن خروجیای تولید کند که با درخواست شما مطابقت داشته باشد.
شرکت Open AI اطلاعاتی درباره تعداد پارامترهای نسخههای GPT-4o یا o1 منتشر نکرده است هرچند که پیشبینی میشود این تعداد از 175 میلیارد بیشتر باشد. باید توجه داشته باشید که افزایش تعداد پارامترها بهتنهایی نمیتواند عملکرد مدل را بهبود دهد بلکه روشهای آموزش مدل نیز اهمیت زیادی دارد.
یادگیری تقویتی از بازخورد انسانی (RLHF)
مفهوم بعدی که در رابطه با نحوه کار چت جی پی تی باید با آن آشنا شوید، یادگیری تقویتی از بازخورد انسانی است. مدل زبانی بزرگ (LLM) تنها زمانی قابل استفاده است که به آن آموزشهای لازم داده شود. مدل GPT در ابتدا تنها با استفاده از منابع موجود در اینترنت و بدون هیچ راهنمایی آموزش دیده است و تصور کنید که این موضوع میتوانست چه فاجعهای ایجاد کند. بنابراین برای اینکه توانایی مدل در پاسخگویی به انواع درخواستها بهصورت منسجم و منطقی بهبود یابد از تکنیکی به نام یادگیری تقویتی با بازخورد انسانی استفاده شود.
لوگو چت جی پی تی
اگر بخواهیم بهصورت خلاصه این تکنیک را توضیح دهیم میتوان گفت که OpenAI مجموعهای از دادههای نمایشی ایجاد کرد که به شبکه عصبی این امکان را میداد تا تشخیص دهد در موقعیتهای مختلف چه پاسخهایی را تولید کند. بعدازآن، یک مدل پاداش بر اساس دادههای مقایسهای ساخته شد تا مدل یاد بگیرد که در هر موقعیت بهترین پاسخ کدام است.
تصویر کنید که یک کودک در حال یادگیری حرف زدن است و در حین یادگیری ممکن است که حرفهای نامناسب و اشتباهی بزند. در چنین حالتی، بزرگترها به کودک نشان میدهند که چه جملهای درست و چه جملهای غلط است و همین موضوع باعث میشود تا کودک بتواند درست حرف زدن را یاد بگیرد. نحوه کار چت جی پی تی نیز شبیه به همین موضوع است. در مدلهای زبانی، مدل در ابتدا با حجم زیادی از دادهها آموزش داده شده و سپس با کمک انسانها میتواند بهترین پاسخها را ایجاد کند.
یادگیری تقویتی یک تکنیک ضروری برای ایمنتر کردن مدلهای هوش مصنوعی است تا این مدلها بتوانند پاسخهای درستی را ایجاد کنند.
زنجیره تفکر یا استدلال زنجیرهای (Chain of Thoughts)
تا به اینجا تا حدی با نحوه کار چت جی پی تی آشنا شدیم. در ادامه با مفهوم دیگری به نام COT یا زنجیره تفکر آشنا میشویم. مدلهای زبانی معمولا بهگونهای طراحیشدهاند که در بیشتر موارد میتوانند پاسخهای ساده و بدیهی ارائه کنند. در چنین حالتی، این مدلها ممکن است در حل مسائل پیچیده و چندمرحلهای دچار مشکل شوند. برای حل این مشکل از تکنیکی به اسم COT استفاده شده است.
مدل o1 بهگونهای تعلیم داده شده است که مسائل را به چند بخش مختلف تقسیم کند. این مدل بهجای اینکه سریعا یک پاسخ ساده و محتمل را ارائه دهد میتواند راهحلهای مختلف را بررسی کرده و امتحان کند. نکتهای که وجود دارد این است که COT نیاز به زمان و منابع محاسباتی زیادی دارد. به همین دلیل نحوه کار چت جی پی تی بدین صورت است که تنها زمانی از زنجیره تفکر استفاده میشود که درخواست کاربر به آن نیاز داشته باشد.
لوگو چت جی پی تی
پردازش زبان طبیعی (NLP)
NLP یک حوزه وسیع در هوش مصنوعی است که شامل تشخیص گفتار، ترجمه ماشینی و رباتهای چت میشود. میتوان NLP را یک فرآیند در نظر گرفت که در آن هوش مصنوعی یاد میگیرد قوانین و ساختارهای زبان را درک کرده و الگویتم های پیچیدهای را برای آن توسعه دهد. در مورد نحوه کار چت جی پی تی توضیح دادیم که توکن ها نقش مهمی در فهم درخواست شما دارند. باید بدانید که مدل هوش مصنوعی مانند سیستم پیشبینی متن در کیبورد گوشی شما عمل نمیکند. مدل هوش مصنوعی تلاش میکند تا پاسخهای کاملا منسجمی برای هر درخواست ایجاد کند.
نحوه کار چت جی پی تی بدین صورت است که در ابتدا درخواست شما را دریافت کرده و سپس آن را به توکن ها تجزیه میکند و با استفاده از شبکه عصبی مبتنی بر ترنسفورمز، مهمترین بخش درخواستها را شناسایی نموده و میفهمد که محتوای درخواست شما چیست. در مرحله بعد، شبکه عصبی فعالشده و دنباله مناسبی از توکن ها را تولید میکند.
فرض کنید از چت جی پی تی میپرسیم که وبسایت فراسیب چیست؟ در چنین حالتی پاسخدادهشده توسط هوش مصنوعی بهصورت زیر خواهد بود:
وبسایت فراسیب یک مرجع تخصصی برای کاربران محصولات اپل در ایران است. این وبسایت باهدف تسهیل دسترسی کاربران ایرانی به خدمات و محصولات اپل، همچنین ارائهی آموزشها و اخبار مرتبط، فعالیت میکند.
حال اگر سوال خودم را بهصورت وبسایت فراسیب را توصیف کن مطرح کنم باز هم مدل تشخیص میدهد که کلمه کلیدی اصلی مربوط به وبسایت فراسیب است و پاسخی مشابه تولید میکند. توجه داشته باشید که پاسخها یکسان نیست و مقداری متفاوت است تا تنوع پاسخها حفظ شود.
چندوجهی بودن (Multimodality) در ChatGPT
تا به اینجا صحبتهای زیادی در رابطه با نحوه کار چت جی پی تی انجام دادیم بااینحال باید بدانیم که چت جی پی تی یک مدل چندوجهی است. بهعبارتدیگر این مدل میتواند علاوه بر متن، تصاویر و صدا را نیز درک کند. بااینکه فرآیند مدل چندوجهی بسیار پیچیده است ولی مفاهیم آن همچنان روی مفاهیم پایهای هوش مصنوعی مثل ترنسفورمر ها، توکن ها و دادههای آموزشی استوار است.
به خاطر داشته باشید که بسیاری از قابلیت های Chatgpt تنها با خرید اشتراک چت جی پی تی در دسترس شما قرار می گیرد.
قابلیت گسترشپذیری (Extensibility) در ChatGPT
چت جی پی تی تنها یک چت بات قدرتمند با اطلاعات محدود نیست و این ابزار کاربردهای بسیار زیادی دارد که در ادامه به آنها اشاره میکنیم.
- به کمک نسخه دسکتاپ چت جی پی تی میتوانید در کامپیوتر خود بهصورت لحظهای به این هوش مصنوعی دسترسی داشته باشید. نحوه کار چت جی پی تی بدین گونه است که میتواند اطلاعات صفحهنمایش شما را تحلیل کرده و با برنامههای کد نویسی نیز به خوبی کار کند.
- نسخه موبایل Chatgpt به شما اجازه میدهد تا بهصورت صوتی با هوش مصنوعی ارتباط گرفته و عکسهای مدنظر خود را برای هوش مصنوعی ارسال کنید.
- سیستم جستوجوی Chatgpt قابلیت جستوجوی لحظهای در منابع اینترنتی را دارد.
آینده چت جی پی تی چگونه خواهد بود؟
در این مقاله با مفاهیم مرتبط با نحوه کار چت جی پی تی آشنا شدیم. OpenAI یک پلتفرم API دارد که به توسعهدهندگان برنامهها اجازه میدهد تا از چت جی پی تی در برنامههای خود استفاده کنند. با این حساب بسیاری از برنامهها در آینده میتوانند از قابلیتهای این هوش مصنوعی بهره ببرند. چت جی پی تی روی محصولات اپل نیز در دسترس است و کاربران اپل نیز میتوانند از قابلیتهای این هوش مصنوعی استفاده کنند.
OpenAI در آینده تلاش خواهد کرد مدلهای پیشرفتهتری را ارائه کند تا قدرت چت جی پی تی از چیزی که الان هست نیز فراتر رود. امیدواریم مطالعه این مطلب توانسته باشد به شما اطلاعات مناسبی در رابطه با نحوه کار چت جی پی تی داده باشد.