این مطلب «چت جی پی تی چطور کار میکند؟» چه کمکی به من میکند؟

چت جی پی تی چطور کار میکند؟ به صورت عملی توضیح میدهد چگونه از سرویس استفاده کنید. در چند دقیقه میتوانید نکات کلیدی را مرور کنید.

چه زمانی آخرین بار این مطلب بازبینی شده است؟

آخرین بازبینی: ۲۴ تیر ۱۴۰۵. بهروزرسانیهای مهم بلافاصله اعمال میشود.

اگر بعد از مطالعه هنوز سوالی داشتم چه کنم؟

از طریق پشتیبانی فراسیب (تلگرام یا چت آنلاین) سوال خود را مطرح کنید.

چت جی پی تی چطور کار می‌کند؟

آیا تا به حال به نحوه کار چت جی پی تی فکر کرده‌اید؟ با قاطعیت می‌توان گفت که چت جی پی تی یکی از مهم‌ترین برنامه‌هایی است که در دهه گذشته عرضه شده است. در ابتدا چت جی پی تی (Chatgpt) تنها یک ربات برای مدل زبانی Open AI بود بااین‌حال امروزه چت جی پی تی امکانات بسیار بیشتری را در اختیار کاربرانش می‌گذارد. جست‌وجو کردن در اینترنت، ساخت عکس و حتی شعر گفتن تنها بخشی از قابلیت‌هایی است که Chatgpt در اختیار کاربرانش قرار داده است.

با گسترش قابلیت‌های چت جی پی تی و اضافه شدن مدل‌های جدید به آن، توضیح دادن نحوه کار چت جی پی تی سخت و سخت‌تر می‌شود. بااین‌حال امروز در وب‌سایت فراسیب قصد داریم تا با نحوه کار چت جی پی تی بیشتر آشنا شویم. پس اگر شما هم می‌خواهید اطلاعات بیشتری در مورد نحوه کار چت جی پی تی به دست آورید با ما در ادامه همراه باشید.

کاربرانی که قصد دارند ChatGPT را با سایر سرویس‌های موجود مقایسه کنند، می‌توانند با بررسی گزینه‌های خرید اکانت هوش مصنوعی، ابزار مناسب خود را براساس قابلیت‌ها، محدودیت‌ها و نوع استفاده انتخاب کنند.

چت جی پی تی چیست؟

بسیاری از شما با Chtagpt آشنا هستید و حتما تاکنون از آن نیز استفاده کرده‌اید. بااین‌حال بهتر است قبل از اینکه به بررسی نحوه کار چت جی پی تی بپردازیم کمی در رابطه با این برنامه و قابلیت‌های آن توضیحاتی بدهیم. Chatgpt را می‌توان یک رابط کاربری برای استفاده از پیشرفته‌ترین مدل‌های هوش مصنوعی به شمار آورد. Chatgpt می‌تواند به‌عنوان یک هوش مصنوعی با شما گفت‌وگو کرده و به سوالات شما پاسخ دهد.

چت جی پی تی چیست؟

برخی از مهم‌ترین قابلیت‌های Chatgpt را می‌توان در موارد زیر دسته‌بندی کرد:

تولید تصاویر: چت جی پی تی می‌تواند متن نوشته ‌شده را به تصویر تبدیل کند.
حل مسائل پیچیده: چت جی پی تی می‌تواند به شما در حل مسائل پیچیده ریاضی و غیره کمک کند.
جست‌وجو در اینترنت: Chatgpt می‌تواند به جست‌وجو در اینترنت بپردازد و به سوالات شما پاسخ دهد.
کد نویسی: چت جی پی تی می‌تواند کدها را در زبان‌های مختلف برنامه‌نویسی تولید کند.

این‌ها تنها بخشی از قابلیت‌های پیچیده ‌این هوش مصنوعی است؛ خلاصه کردن متن، ترجمه زبان‌های مختلف، کمک به نوشتن ایمیل و غیره ازجمله سایر قابلیت‌های هوش مصنوعی Chatgpt به شمار می‌رود. البته باید بدانید که برای استفاده از بسیاری از قابلیت‌های Chatgpt لازم است تا به صفحه خرید اکانت ChatGPT مراجعه کنید.

اگر هنوز با محیط این سرویس، شیوه ارسال درخواست، آپلود فایل و تنظیمات حساب آشنا نیستید، مطالعه راهنمای نحوه استفاده از ChatGPT می‌تواند شروع مناسبی باشد.

نحوه کار چت جی پی تی

بعد از اینکه در رابطه با اینکه چت جی پی تی چیست و چه قابلیت هایی دارد صحبت کردیم، بهتر است وقت را تلف نکرده و به موضوع اصلی مقاله یعنی نحوه کار چت جی پی تی بپردازیم. اگر در اسم Chatgpt دقت کرده باشید مطمئنا کنجکاو می‌شوید که معنی GPT چیست؟ GPT مخفف عبارت Generative Pre-trained Transformer به معنای ترنسفورمر تولیدگر از پیش آموزش ‌دیده است. تا زمان عرضه مدل Open AI o1، تمام مدل‌های زبانی شرکت اوپن ای آی از نام‌گذاری GPT استفاده می‌کردند. با وجود اینکه نام‌گذاری‌ها تغییر کرده است ولی همچنان پایه و اساس مدل‌های جدید نیز شبیه به یکدیگر است.

نحوه کار چت جی پی تی

مفاهیمی که در ادامه به بررسی آن‌ها می‌پردازیم ممکن است کمی برای شما نامفهوم باشد ولی درک آن‌ها برای دانستن نحوه کار چت جی پی تی و مدل‌های زبانی به کار برده شده اهمیت زیادی دارد.

یادگیری نظارت شده در برابر یادگیری بدون نظارت (Supervised vs. unsupervised)

یکی از مهم‌ترین بخش‌های هر مدل هوش مصنوعی، «آموزش» است. حرف P در عبارت GPT مربوط به Pre-Trained یا پیش آموزش است. آموزش یکی از ارکان مهمی است که باعث می‌شود تا هوش مصنوعی بتواند به سوال های کاربران پاسخ دهد. در نام‌گذاری مدل‌های جدید هوش مصنوعی دیگر خبری از حرف P نیست. مدل‌های جدید هوش مصنوعی نیز پیش آموزش دیده هستند ولی به دلیل اینکه این موضوع در مورد همه هوش مصنوعی‌ها صادق است دیگر در نام‌گذاری‌های جدید به آن توجه نمی‌شود.

تا قبل از مدل هوش مصنوعی GPT-1، بهترین مدل‌های هوش مصنوعی از مکانیزم یادگیری نظارت ‌شده برای توسعه الگوریتم استفاده می‌کردند. در این مدل‌ها از داده‌هایی با برچسب‌های مشخص برای آموزش دیدن استفاده می‌شد. به‌عنوان‌مثال، پایگاه داده‌ای از عکس‌های حیوانات با توضیحات متنی مشخصی برچسب‌گذاری شده و با استفاده از این داده‌ها هوش مصنوعی آموزش داده می‌شد.

نحوه کار چت جی پی تی چه گونه است؟

یادگیری نظارت‌شده محدودیت‌های خاص خود را دارد. به‌ عنوان‌ مثال، داده‌های مناسب که با دقت کافی برچسب‌گذاری شده باشند به‌اندازه کافی در دسترس نیست و همچنین هزینه‌های تولید این داده‌ها نیز بسیار بالا است. در چنین حالتی در مدل GPT-1 از روش دیگری به نام پیش آموزش مولد (Generative Pre-training) استفاده شد.

مدل GPT-1 با چند قانون اصلی راه‌اندازی شده و سپس مقدار زیادی داده‌های بدون برچسب در اختیار آن قرار داده شد. این داده‌ها تقریبا شامل کل فضای رایگان اینترنت می‌شدند. مدل GPT-1، این داده‌ها را پردازش و روابط بین آن‌ها را به‌طور خودکار آموخت. این مدل پایه و اساس هوش مصنوعی‌های فعلی به شمار می‌رود.

Open AI با ادامه دادن فرآیند توسعه توانست تا مدل‌های جدیدتر خود را با داده‌های بیشتری ازجمله داده‌های غیر متنی آموزش دهد. به‌عنوان‌مثال، GPT-4 از همان اصول اولیه استفاده می‌کند با این تفاوت که علاوه بر متن، توانایی پردازش داده‌های تصویری و صوتی را نیز دارند. نکته‌ای که در مورد یادگیری بدون نظارت وجود دارد این است که خروجی آن را نمی‌توان به‌صورت کامل پیش‌بینی کرد. معمولا در این مدل‌ها از روش‌هایی استفاده می‌شود که با نام تنظیم دقیق (Fine-tuning) شناخته می‌شود. این روش‌ها کمک می‌کند تا خروجی مدل‌ها قابل پیش‌بینی‌تر شود.

معماری ترنسفورمر

در ادامه صحبت در رابطه با نحوه کار چت جی پی تی بهتر است با معماری ترنسفورمر ( Transformer architecture) نیز آشنا شویم. این معماری یک الگوریتم پیچیده و چندلایه است که از روی ساختار مغز انسان ساخته شده است. این معماری این قابلیت را به هوش مصنوعی Chatgpt می‌دهد تا بتواند الگوها و روابط موجود در داده‌های متنی را یاد گرفته و سپس بتواند پاسخ‌های مشابه انسان را با پیش‌بینی متن بعدی در یک جمله ارائه دهد.

حرف T در عبارت GPT مخفف معماری تراسنفورمر است که در سال 2017 در یک مقاله معرفی شد. این معماری را می‌توان عامل اصلی پیشرفت‌های خیره‌کننده هوش مصنوعی در چند سال گذشته دانست. معماری ترنسفورمر ازلحاظ فنی بسیار پیچیده است؛ ولی جالب است بدانید که این معماری توانست تا نحوه طراحی الگوریتم‌های هوش مصنوعی را ساده‌تر کند. در این معماری، مدل‌ها می‌توانند محاسبات را به‌صورت موازی انجام داده که به همین علت زمان آموزش آن‌ها بسیار کم‌تر می‌شود. می‌توان این‌گونه گفت که معماری ترنسفورمر توانست تا نه‌تنها هوش مصنوعی‌ها را قوی‌تر کند بلکه تولید آن‌ها را نیز سریع‌تر و ارزان‌تر نماید.

توکن ها در چت جی پی تی

برای اینکه با نحوه کار چت جی پی تی آشنا شویم باید بدانیم که چگونه هوش مصنوعی توانایی درک متن‌های داده شده را دارد. برای درک نحوه کار چت جی پی تی باید با مفهومی به نام توکن‌ها آشنا شویم. GPT-3 مدلی بود که تقریبا شامل 500 میلیارد توکن آموزش دیده بود. این میزان عظیم باعث می‌شد تا هوش مصنوعی Chatgpt بتواند معانی را بهتر تشخیص داده و متن‌های بعدی را به‌صورت منطقی پیش‌بینی کند. در مدل‌های زبانی، کلمات به یک توکن تبدیل می‌شوند و کلمات طولانی‌تر یا پیچیده‌تر نیز می‌توانند تبدیل به چند توکن شوند. هر توکن شامل حدودا چهار کارکتر می‌شود.

توکن در هوش مصنوعی چیست؟

تمام توکن های متنی که در GPT-3 مورد استفاده قرار گرفته شده بود از اطلاعاتی مانند کتاب‌ها، مقالات، اسناد موجود در اینترنت و غیره به دست آورده شده است. در مدل‌های جدید زبانی مثل o1، علاوه بر داده‌های انسانی از داده‌های مصنوعی (داده‌هایی که توسط هوش مصنوعی ایجاد شده است) نیز برای آموزش هوش مصنوعی استفاده می‌شود. بر اساس این داده‌های آموزشی، شبکه عصبی GPT-3 شامل 175 میلیارد پارامتر می‌شود که این متغیرها این امکان را می‌دهند تا هوش مصنوعی بتواند ورودی را دریافت کرده و بر اساس آن خروجی‌ای تولید کند که با درخواست شما مطابقت داشته باشد.

شرکت Open AI اطلاعاتی درباره تعداد پارامترهای نسخه‌های GPT-4o یا o1 منتشر نکرده است هرچند که پیش‌بینی می‌شود این تعداد از 175 میلیارد بیشتر باشد. باید توجه داشته باشید که افزایش تعداد پارامترها به‌تنهایی نمی‌تواند عملکرد مدل را بهبود دهد بلکه روش‌های آموزش مدل نیز اهمیت زیادی دارد.

یادگیری تقویتی از بازخورد انسانی (RLHF)

مفهوم بعدی که در رابطه با نحوه کار چت جی پی تی باید با آن آشنا شوید، یادگیری تقویتی از بازخورد انسانی است. مدل زبانی بزرگ (LLM) تنها زمانی قابل استفاده است که به آن آموزش‌های لازم داده شود. مدل GPT در ابتدا تنها با استفاده از منابع موجود در اینترنت و بدون هیچ راهنمایی آموزش دیده است و تصور کنید که این موضوع می‌توانست چه فاجعه‌ای ایجاد کند. بنابراین برای اینکه توانایی مدل در پاسخ‌گویی به انواع درخواست‌ها به‌صورت منسجم و منطقی بهبود یابد از تکنیکی به نام یادگیری تقویتی با بازخورد انسانی استفاده شود.

لوگو چت جی پی تی

اگر بخواهیم به‌صورت خلاصه این تکنیک را توضیح دهیم می‌توان گفت که OpenAI مجموعه‌ای از داده‌های نمایشی ایجاد کرد که به شبکه عصبی این امکان را می‌داد تا تشخیص دهد در موقعیت‌های مختلف چه پاسخ‌هایی را تولید کند. بعدازآن، یک مدل پاداش بر اساس داده‌های مقایسه‌ای ساخته شد تا مدل یاد بگیرد که در هر موقعیت بهترین پاسخ کدام است.

تصویر کنید که یک کودک در حال یادگیری حرف زدن است و در حین یادگیری ممکن است که حرف‌های نامناسب و اشتباهی بزند. در چنین حالتی، بزرگ‌ترها به کودک نشان می‌دهند که چه جمله‌ای درست و چه جمله‌ای غلط است و همین موضوع باعث می‌شود تا کودک بتواند درست حرف زدن را یاد بگیرد. نحوه کار چت جی پی تی نیز شبیه به همین موضوع است. در مدل‌های زبانی، مدل در ابتدا با حجم زیادی از داده‌ها آموزش داده شده و سپس با کمک انسان‌ها می‌تواند بهترین پاسخ‌ها را ایجاد کند.

یادگیری تقویتی یک تکنیک ضروری برای ایمن‌تر کردن مدل‌های هوش مصنوعی است تا این مدل‌ها بتوانند پاسخ‌های درستی را ایجاد کنند.

زنجیره تفکر یا استدلال زنجیره‌ای (Chain of Thoughts)

تا به اینجا تا حدی با نحوه کار چت جی پی تی آشنا شدیم. در ادامه با مفهوم دیگری به نام COT یا زنجیره تفکر آشنا می‌شویم. مدل‌های زبانی معمولا به‌گونه‌ای طراحی‌شده‌اند که در بیشتر موارد می‌توانند پاسخ‌های ساده و بدیهی ارائه کنند. در چنین حالتی، این مدل‌ها ممکن است در حل مسائل پیچیده و چندمرحله‌ای دچار مشکل شوند. برای حل این مشکل از تکنیکی به اسم COT استفاده شده است.

مدل o1 به‌گونه‌ای تعلیم داده شده است که مسائل را به چند بخش مختلف تقسیم کند. این مدل به‌جای اینکه سریعا یک پاسخ ساده و محتمل را ارائه دهد می‌تواند راه‌حل‌های مختلف را بررسی کرده و امتحان کند. نکته‌ای که وجود دارد این است که COT نیاز به زمان و منابع محاسباتی زیادی دارد. به همین دلیل نحوه کار چت جی پی تی بدین صورت است که تنها زمانی از زنجیره تفکر استفاده می‌شود که درخواست کاربر به آن نیاز داشته باشد.

لوگو چت جی پی تی

پردازش زبان طبیعی (NLP)

NLP یک حوزه وسیع در هوش مصنوعی است که شامل تشخیص گفتار، ترجمه ماشینی و ربات‌های چت می‌شود. می‌توان NLP را یک فرآیند در نظر گرفت که در آن هوش مصنوعی یاد می‌گیرد قوانین و ساختارهای زبان را درک کرده و الگویتم های پیچیده‌ای را برای آن توسعه دهد. در مورد نحوه کار چت جی پی تی توضیح دادیم که توکن ها نقش مهمی در فهم درخواست شما دارند. باید بدانید که مدل هوش مصنوعی مانند سیستم پیش‌بینی متن در کیبورد گوشی شما عمل نمی‌کند. مدل هوش مصنوعی تلاش می‌کند تا پاسخ‌های کاملا منسجمی برای هر درخواست ایجاد کند.

نحوه کار چت جی پی تی بدین صورت است که در ابتدا درخواست شما را دریافت کرده و سپس آن را به توکن ها تجزیه می‌کند و با استفاده از شبکه عصبی مبتنی بر ترنسفورمز، مهم‌ترین بخش درخواست‌ها را شناسایی نموده و می‌فهمد که محتوای درخواست شما چیست. در مرحله بعد، شبکه عصبی فعال‌شده و دنباله مناسبی از توکن ها را تولید می‌کند.

هرچه درخواست کاربر واضح‌تر باشد و اطلاعاتی مانند هدف، لحن، قالب خروجی و محدودیت‌ها در آن مشخص شود، احتمال دریافت پاسخ مرتبط‌تر افزایش پیدا می‌کند. برای آشنایی با این اصول می‌توانید مقاله نحوه صحیح نوشتن پرامپت ChatGPT (به‌روزرسانی ۲۰۲۵) را مطالعه کنید.

فرض کنید از چت جی پی تی می‌پرسیم که وب‌سایت فراسیب چیست؟ در چنین حالتی پاسخ‌داده‌شده توسط هوش مصنوعی به‌صورت زیر خواهد بود:

وب‌سایت فراسیب یک مرجع تخصصی برای کاربران محصولات اپل در ایران است. این وب‌سایت باهدف تسهیل دسترسی کاربران ایرانی به خدمات و محصولات اپل، همچنین ارائه‌ی آموزش‌ها و اخبار مرتبط، فعالیت می‌کند.

حال اگر سوال خودم را به‌صورت وب‌سایت فراسیب را توصیف کن مطرح کنم باز هم مدل تشخیص می‌دهد که کلمه کلیدی اصلی مربوط به وب‌سایت فراسیب است و پاسخی مشابه تولید می‌کند. توجه داشته باشید که پاسخ‌ها یکسان نیست و مقداری متفاوت است تا تنوع پاسخ‌ها حفظ شود.

چندوجهی بودن (Multimodality) در ChatGPT

تا به اینجا صحبت‌های زیادی درباره نحوه کار چت جی پی تی انجام دادیم؛ بااین‌حال باید بدانیم که ChatGPT یک سرویس چندوجهی است. به‌عبارت‌دیگر، این ابزار می‌تواند علاوه‌بر متن، تصاویر و صدا را نیز درک کند.

کاربرانی که به یک سرویس واحد برای تولید محتوا، تحقیق، تحلیل فایل، برنامه‌نویسی، ترجمه و ساخت تصویر نیاز دارند، می‌توانند گزینه‌های خرید اکانت هوش مصنوعی همه کاره را نیز بررسی کنند.

قابلیت گسترش‌پذیری (Extensibility) در ChatGPT

چت جی پی تی تنها یک چت بات قدرتمند با اطلاعات محدود نیست و این ابزار کاربردهای بسیار زیادی دارد که در ادامه به آن‌ها اشاره می‌کنیم.

امکانات، مدل‌های قابل‌دسترسی و محدودیت استفاده در همه پلن‌های این سرویس یکسان نیست. برای انتخاب گزینه متناسب با نیاز خود می‌توانید مطلب تفاوت نسخه‌های مختلف ChatGPT را مطالعه کنید.

به کمک نسخه دسکتاپ چت جی پی تی می‌توانید در کامپیوتر خود به‌صورت لحظه‌ای به این هوش مصنوعی دسترسی داشته باشید. نحوه کار چت جی پی تی بدین گونه است که می‌تواند اطلاعات صفحه‌نمایش شما را تحلیل کرده و با برنامه‌های کد نویسی نیز به خوبی کار کند.
نسخه موبایل Chatgpt به شما اجازه می‌دهد تا به‌صورت صوتی با هوش مصنوعی ارتباط گرفته و عکس‌های مدنظر خود را برای هوش مصنوعی ارسال کنید.
سیستم جست‌وجوی Chatgpt قابلیت جست‌وجوی لحظه‌ای در منابع اینترنتی را دارد.

نسخه رایگان و Plus از نظر محدودیت پیام، دسترسی به مدل‌ها، تحلیل فایل و برخی قابلیت‌های پیشرفته تفاوت دارند. برای بررسی جزئیات این پلن‌ها می‌توانید مقاله تفاوت ChatGPT Free و Plus در ۲۰۲۵ را مطالعه کنید.

آینده چت جی پی تی چگونه خواهد بود؟

در این مقاله با مفاهیم مرتبط با نحوه کار چت جی پی تی آشنا شدیم. OpenAI یک پلتفرم API دارد که به توسعه‌دهندگان برنامه‌ها اجازه می‌دهد تا از چت جی پی تی در برنامه‌های خود استفاده کنند. با این حساب بسیاری از برنامه‌ها در آینده می‌توانند از قابلیت‌های این هوش مصنوعی بهره ببرند. چت جی پی تی روی محصولات اپل نیز در دسترس است و کاربران اپل نیز می‌توانند از قابلیت‌های این هوش مصنوعی استفاده کنند.

OpenAI در آینده تلاش خواهد کرد مدل‌های پیشرفته‌تری را ارائه کند تا قدرت چت جی پی تی از چیزی که الان هست نیز فراتر رود. امیدواریم مطالعه این مطلب توانسته باشد به شما اطلاعات مناسبی در رابطه با نحوه کار چت جی پی تی داده باشد.