ChatGPT چیست و چگونه از آن استفاده کنیم

ChatGPT چیست و چگونه از آن استفاده کنیم

در این مقاله در بخش سئو سایت می خواهیم بدانیم که ChatGPT چیست و اینکه چرا ممکن است مهمترین ابزار برای موتورهای جستجوی مدرن باشد را ارزیابی می کنیم.

ChatGPT چیست و چه کاربردی دارد؟

شرکت OpenAI یک هوش مصنوعی پاسخگوی سوالات طولانی به نام ChatGPT معرفی کرد که به سوالات پیچیده به صورت مکالمه پاسخ می دهد.

ChatGPT یک فناوری انقلابی است، زیرا آموزش داده شده است تا بفهمد انسان هنگام پرسیدن به دنبال کدام پاسخ می باشد.

بسیاری از کاربران از توانایی ChatGPT در ارائه پاسخ های با کیفیت انسانی شگفت زده شده اند و این احساس را به انسان القا می کند که ممکن است در نهایت قدرت ایجاد اختلال در نحوه تعامل انسان ها با رایانه ها و تغییر نحوه بازیابی اطلاعات را داشته باشد.

ChatGPT چیست؟

ChatGPT یک چت بات chatbot مدل زبانی بزرگ (large language model) است که توسط شرکت بزرگ OpenAI بر اساس GPT-3.5 توسعه یافته است.

توانایی قابل توجهی در تعامل و گفتگو در قالب گفتگوی محاوره ای و ارائه پاسخ هایی دارد که می تواند به طرز شگفت آوری انسان را متعجب کند.

مدل های زبانی بزرگ (large language model) پیش بینی کلمه بعدی را در یک سری کلمات انجام می دهند.

یادگیری تقویتی با بازخورد انسانی (Reinforcement Learning with Human Feedback (RLHF)) یک لایه آموزشی اضافی است که از بازخورد انسانی برای کمک به ChatGPT برای یادگیری توانایی پیروی از دستورالعمل‌ها و ایجاد پاسخ‌های رضایت‌بخش برای انسان استفاده می‌کند.

چه کسی ChatGPT را ساخت؟

ChatGPT توسط شرکت هوش مصنوعی OpenAI مستقر در سانفرانسیسکو (San Francisco) ایجاد شده است.

شرکت OpenAI شرکت خصوصی و هولدینگ OpenAI LP است.

شرکت OpenAI بیشتر با سیستمی به نام DALL·E که یک مدل یادگیری عمیق است، که تصاویر را از دستورالعمل های متنی به نام prompt تولید می کند، مشهور شده است.

مدیرعامل شرکت OpenAI آقایی به نام سام آلتمن (Sam Altman) است که قبلاً رئیس شرکت Y Combinator بوده است.

شرکت مایکروسافت (Microsoft) به مبلغ 1 میلیارد دلار شریک و سرمایه گذار این پروژه شده است. آنها به طور مشترک پلتفرم هوش مصنوعی Azure را توسعه دادند.

مدل های زبان بزرگ (Large Language Models)

ChatGPT یک مدل زبانی بزرگ (large language model (LLM)) است.

مدل‌های زبانی بزرگ (Large Language Models (LLMs)) با مقادیر انبوهی از داده‌ها آموزش داده می‌شوند تا دقیقاً پیش‌بینی کنند چه کلمه‌ای در یک جمله قرار می‌گیرد.

مشخص شد که افزایش مقدار داده، توانایی مدل های زبان را برای انجام کارهای بیشتر افزایش می دهد.

GPT-3 دارای 175 میلیارد پارامتر است و بر روی 570 گیگابایت متن آموزش داده شده است. برای مقایسه، GPT-2، بیش از 100 برابر کوچکتر با 1.5 میلیارد پارامتر بود.

این افزایش مقیاس رفتار مدل را به شدت تغییر می‌دهد.

GPT-3 قادر است کارهایی مانند ترجمه جملات از انگلیسی به فرانسوی، با نمونه‌های آموزشی کم یا بدون نمونه را انجام دهد که به صراحت روی آن‌ها آموزش داده نشده است.

این رفتار بیشتر در GPT-2 وجود نداشت. علاوه بر این، برای برخی از کارها، GPT-3 از مدل هایی که به صراحت برای حل آن وظایف آموزش داده شده بودند، بهتر عمل می کند، اگرچه در کارهای دیگر کوتاهی می کند.

دانشگاه استنفورد

LLMs ها کلمه بعدی را در یک سری از جملات در یک جمله و پاراگراف های بعدی را پیش بینی می کنند – به نوعی مانند تکمیل خودکار (autocomplete)، اما در مقیاسی که ذهن را به چالش می کشد.

این توانایی به آنها اجازه می دهد پاراگراف ها و کل صفحات محتوا را بنویسند.

اما LLM ها از این جهت هم محدود هستند که همیشه نمی دانند یک انسان دقیقا چه می خواهد.

و دقیقا در این نقطه هستش که ChatGPT با آموزش تقویت‌کننده با بازخورد انسانی (Reinforcement Learning with Human Feedback (RLHF)) پیشرفت می‌کند.

ChatGPT چگونه آموزش داده شد؟

GPT-3.5 بر روی حجم عظیمی از داده‌ها در مورد کد و اطلاعات از اینترنت، از جمله منابعی مانند بحث‌های Reddit، آموزش داده شد تا به ChatGPT در یادگیری گفتگو و دستیابی به سبک انسانی پاسخ‌دهی کمک کند.

ChatGPT همچنین با استفاده از بازخورد انسانی human feedback (تکنیکی به نام یادگیری تقویتی با بازخورد انسانی) آموزش داده شد تا هوش مصنوعی متوجه شود که انسان ها هنگام پرسیدن سوال چه انتظاراتی دارند.

آموزش LLM به این روش انقلابی فراتر از آموزش ساده LLM بوده که پیش بینی کلمه بعدی را میسر می کند.

“هدف ما از این کار آموزش این سیستم برای تاثیر مثبت مدل های زبانی بزرگ (large language models) برای بهبود تاثیر آن و فراهم آوردن شرایطی برای انجام کارهای انسانی بوده است.  

به‌طور پیش‌فرض، مدل‌های زبانی (language models) پیش‌بینی کلمه بعدی را بهینه می‌کنند، که تنها یک پروکسی برای کاری است که ما می‌خواهیم این مدل‌ها انجام دهند.

نتایج ما نشان می‌دهد که تکنیک‌های ما برای مفیدتر، صادق‌تر و بی‌ضررتر کردن مدل‌های زبانی نویدبخش است.

بزرگ‌تر کردن مدل‌های زبانی (language models) ذاتاً آن‌ها را در پیروی از هدف کاربر بهتر نمی‌کند.

برای مثال، مدل‌های زبانی (language models) بزرگ می‌توانند خروجی‌هایی تولید کنند که غیرواقعی، سمی یا به سادگی برای کاربر مفید نیستند.

به عبارت دیگر، این مدل ها با کاربران خود هماهنگ نیستند.»

یک مقاله تحقیقاتی در مارس 2022

مهندسانی که ChatGPT را ساختند، پیمانکارانی (به نام labelers) استخدام کردند تا خروجی‌های دو سیستم GPT-3 و InstructGPT جدید (یک مدلی به نام “sibling model” از ChatGPT) را رتبه‌بندی کنند.

Labelers به طور قابل توجهی خروجی‌های InstructGPT را بر خروجی‌های GPT-3 ترجیح می‌دهند.

مدل‌های InstructGPT نسبت به GPT-3 پیشرفت‌هایی در صداقت نشان می‌دهند.

InstructGPT بهبودهای کوچکی را در toxicity نسبت به GPT-3 نشان می دهد، اما سوگیری ندارد.

بر اساس رتبه بندی، محققان

مقاله تحقیقاتی، نتیجه می گیرد که نتایج برای InstructGPT مثبت بوده است. با این حال، همچنین اشاره کرد که جا برای بهبود وجود دارد:

“به طور کلی، نتایج ما نشان می‌دهد که تنظیم دقیق مدل‌های زبانی بزرگ (large language models) با استفاده از ترجیحات انسانی به طور قابل‌توجهی رفتار آن‌ها را در طیف وسیعی از وظایف بهبود می‌بخشد، اگرچه کارهای زیادی برای بهبود ایمنی و قابلیت اطمینان آنها باقی مانده است.»

چیزی که ChatGPT را از یک چت بات ساده متمایز می کند این است که به طور خاص برای درک مقصود انسان در یک سوال و ارائه پاسخ های مفید، واقعی و بی ضرر آموزش داده شده است.

به دلیل آن آموزش، ChatGPT ممکن است سؤالات خاصی را به چالش بکشد و بخش‌هایی از سؤال را که منطقی نیستند کنار بگذارد.

مقاله تحقیقاتی دیگری مربوط به ChatGPT نشان می دهد که چگونه آنها هوش مصنوعی را برای پیش بینی آنچه که انسان ترجیح می دهند آموزش دادند.

محققان متوجه شدند که معیارهای مورد استفاده برای رتبه‌بندی خروجی‌های پردازش زبان طبیعی هوش مصنوعی به ماشین‌هایی منجر می‌شود که امتیاز خوبی در این معیارها کسب می‌کنند، اما با آنچه انسان‌ها انتظار داشتند همسو نمی‌شوند.

روشی که محققان این مشکل را توضیح داده اند به شرح زیر است:

“بسیاری از برنامه های کاربردی یادگیری ماشین (machine learning)، معیارهای ساده ای را بهینه می کنند که تنها پروکسی های تقریبی را برای آنچه طراح در نظر داردرا فعال می کنند. اما این مسئله می‌تواند منجر به مشکلاتی مانند توصیه‌های YouTube برای ترویج click-bait شود.»

بنابراین راه حلی که آنها طراحی کردند، ایجاد یک هوش مصنوعی بود که بتواند پاسخ هایی بهینه سازی شده برای آنچه که انسان ها ترجیح می دهند، ارائه دهد.

برای انجام این کار، آنها هوش مصنوعی را با استفاده از مجموعه داده‌های مقایسه‌های انسانی بین پاسخ‌های مختلف آموزش دادند تا دستگاه در پیش‌بینی پاسخ‌های رضایت‌بخش از نظر انسان‌ها بهتر عمل کند.

این مقاله به اشتراک می‌گذارد که آموزش با جمع‌بندی پست‌های وب سایت Reddit و همچنین آزمایش بر روی خلاصه‌سازی اخبار انجام شده است.

“در این کار، ما نشان می‌دهیم که می‌توان با آموزش مدلی برای بهینه‌سازی، برای ترجیحات انسانی، کیفیت خلاصه را به طور قابل توجهی بهبود بخشید.

ما یک مجموعه داده بزرگ و با کیفیت از مقایسه‌های انسانی بین خلاصه‌ها جمع‌آوری می‌کنیم، مدلی را برای پیش‌بینی خلاصه ترجیحی انسان آموزش می‌دهیم و از آن مدل به عنوان تابع پاداش برای تنظیم دقیق خط مشی خلاصه‌سازی با استفاده از یادگیری تقویتی استفاده می‌کنیم.”

ChatGPT چه محدویت هایی دارد؟

محدودیت ChatGPT در ارائه پاسخ های سمی به انسان

ChatGPT به طور خاص برنامه ریزی شده است تا به پاسخ های سمی یا مضر هیچ اطلاعاتی را ارائه نکند. بنابراین از پاسخ دادن به این نوع سوالات اجتناب خواهد کرد.

کیفیت پاسخ های ChatGPT به کیفیت دستورالعمل ها بستگی دارد

یکی از محدودیت مهم ChatGPT این است که کیفیت خروجی به کیفیت ورودی بستگی دارد. به عبارت دیگر، دستورالعمل های متخصص (اعلانات) پاسخ های بهتری را ایجاد می کنند.

پاسخ های ChatGPT همیشه صحیح نیستند

یکی دیگر از محدودیت ها این است که چون آموزش داده شده است تا پاسخ هایی را ارائه دهد که برای انسان ها درست باشد، پاسخ ها می توانند انسان را فریب دهند که خروجی درست است.

بسیاری از کاربران متوجه شدند که ChatGPT می تواند پاسخ های نادرستی ارائه دهد، از جمله برخی از آنها که به شدت نادرست هستند.

ناظران در وب‌سایت پرسش و پاسخ برنامه‌نویسی مانند Stack Overflow ممکن است پیامدهای ناخواسته‌ای از پاسخ‌هایی که برای انسان‌ها درست است، کشف کرده باشند.

Stack Overflow مملو از پاسخ‌های کاربران ایجاد شده از ChatGPT بود که به نظر درست می‌رسیدند، اما تعداد زیادی پاسخ اشتباه بودند.

هزاران پاسخ تیم ناظر داوطلب را تحت تأثیر قرار داد و مدیران را بر آن داشت تا برای هر کاربری که پاسخ‌های ایجاد شده از ChatGPT را ارسال می‌کنند ممنوعیتی وضع کنند.

سیل پاسخ های ChatGPT منجر به پستی با عنوان  “Temporary policy: ChatGPT is banned” شد

«این یک خط‌مشی موقت است که هدف آن کاهش هجوم پاسخ‌ها و سایر محتوای ایجاد شده با ChatGPT است.

مشکل اصلی این است که در حالی که پاسخ هایی که ChatGPT تولید می کند دارای نرخ بالایی از نادرست بودن هستند، آنها معمولاً با کلماتی مانند «به نظر می رسند» یا «خوب باشد» در پاسخ ها مشاهده کنید.

تجربه گردانندگان سایت Stack Overflow با پاسخ‌های اشتباه ChatGPT که درست به نظر می‌رسند، چیزی است که OpenAI، از آن آگاه هستند و در اطلاعیه‌شان از فناوری جدید به آن هشدار داده‌اند.

OpenAI در مورد محدودیت های ChatGPT توضیح می دهد

ChatGPT گاهی اوقات پاسخ هایی با plausible-sounding اما نادرست یا بی معنی می نویسد.

رفع این مشکل چالش برانگیز است، زیرا:

  1. در طول آموزش RL، در حال حاضر هیچ منبعی از حقیقت وجود ندارد.
  2. آموزش محتاط تر بودن مدل باعث می شود که سؤالاتی که می تواند به درستی پاسخ دهد را رد کند.
  3. آموزش براساس نظارت مدل ChatGPT را گمراه می کند زیرا پاسخ ایده آل به آنچه مدل می داند بستگی دارد، نه آنچه نشان دهنده عملکرد انسانی می داند.

آیا استفاده از ChatGPT رایگان است؟

استفاده از ChatGPT در حال حاضر در زمان “research preview” رایگان است.

ربات چت در حال حاضر برای کاربران باز و رایگان است تا بتوانند پاسخ ها را امتحان کنند و بازخورد ارائه کنند تا هوش مصنوعی بتواند در پاسخ به سؤالات بهتر شود و از اشتباهات خود درس بگیرد.

در حالی که ما تلاش کرده ایم مدل درخواست های نامناسب را رد کند، گاهی اوقات به دستورالعمل های مضر پاسخ می دهد یا رفتار مغرضانه ای از خود نشان می دهد.

ما از یک API به نام Moderation برای هشدار و یا مسدود کردن انواع خاصی از محتوای ناامن استفاده می‌کنیم، اما انتظار داریم فعلاً دارای نکات منفی و مثبت کاذب باشد.

ما مشتاق جمع آوری بازخورد کاربران برای کمک به کار مداوم خود برای بهبود این سیستم هستیم.

در حال حاضر مسابقه ای با جایزه 500 دلاری در اعتبارات ChatGPT وجود دارد تا مردم را تشویق کند که به پاسخ ها امتیاز دهند.

کاربران تشویق می‌شوند تا درباره خروجی‌های مدل مشکل‌ساز از طریق UI، و همچنین در مورد موارد مثبت/منفی نادرست از فیلتر محتوای خارجی که بخشی از رابط است، بازخورد ارائه کنند.

ما به ویژه به بازخورد مربوط به خروجی‌های مضری که ممکن است در دنیای واقعی و شرایط غیر خصمانه رخ دهد، و همچنین بازخوردهایی که به ما کمک می‌کند خطرات جدید و کاهش‌های احتمالی را کشف و درک کنیم، علاقه‌مندیم.

می‌توانید انتخاب کنید که در ChatGPT Feedback Contest3 شرکت کنید تا شانس برنده شدن تا 500 دلار اعتبار API را داشته باشید.

ورودی‌ها را می‌توان از طریق فرم بازخوردی که در رابط ChatGPT پیوند داده شده است، ارسال کرد.

آیا مدل های زبانی (Language Models) می تواند جایگزین موتور جستجوی گوگل بشود؟

خود گوگل قبلاً یک ربات چت هوش مصنوعی به نام LaMDA ایجاد کرده است.

عملکرد چت بات گوگل آنقدر به مکالمه انسانی نزدیک بود که یک مهندس گوگل ادعا کرد که LaMDA خیلی حساس است.

با توجه به اینکه چگونه این مدل‌های زبانی بزرگ (large language models) می‌توانند به این همه سؤال پاسخ دهند، آیا دور از ذهن است که شرکتی مانند OpenAI، گوگل یا ماکروسافت روزی جستجوی سنتی را با یک ربات چت هوش مصنوعی جایگزین کند؟

برخی در توییتر در حال حاضر اعلام کرده اند که ChatGPT یک گوگل نسل آینده خواهد بود.

این سناریو که یک ربات چت پرسش و پاسخ ممکن است روزی جایگزین گوگل شود، برای کسانی که به عنوان متخصصان بازاریابی جستجو امرار معاش می کنند، ترسناک است.

این موضوع باعث ایجاد بحث‌هایی در جوامع بازاریابی جستجوی آنلاین شده است، مانند آزمایشگاه محبوب به نام Facebook SEO Signals که در آن شخصی می‌پرسد که آیا جستجوها ممکن است از موتورهای جستجو دور شوند و به سمت ربات‌های چت مانند ChatGPT بروند.

پس از آزمایش ChatGPT، باید قبول کنم که ترس از جایگزینی جستجو با ربات چت بی اساس نیست.

این فناوری هنوز راه درازی در پیش دارد، اما می توان یک جستجوی ترکیبی و آینده ربات چت را برای جستجو , و سئو سایت ها، تصویر سازی کرد.

اما به نظر می‌رسد اجرای کنونی ChatGPT ابزاری است که در برخی مواقع برای استفاده از آن نیاز به خرید اعتبار دارد.

چگونه می توان از ChatGPT استفاده کرد؟

ChatGPT می تواند کدهای برنامه نویسی و سئو و بهینه سازی سایت، شعر، آهنگ و حتی داستان کوتاه را به سبک یک نویسنده خاص بنویسد.

تخصص در دستورالعمل‌های زیر، ChatGPT را از یک منبع اطلاعاتی به ابزاری ارتقا می‌دهد که می‌توان از آن برای انجام یک کار درخواست کرد.

این باعث می شود که ChatGPT برای نوشتن یک مقاله تقریباً در مورد هر موضوعی مفید و کاربردی باشد.

ChatGPT می تواند به عنوان ابزاری برای ایجاد طرح کلی برای مقالات یا حتی کل رمان ها عمل کند.

تقریباً برای هر کاری که می توان با متن نوشتاری انجام داد، ChatGPT پاسخی ارائه می دهد.

نتیجه می گیریم

همانطور که قبلا ذکر شد، ChatGPT به عنوان ابزاری در نظر گرفته شده است که در نهایت، عموم باید برای استفاده از آن هزینه بپردازند و برای استفاده از آن پول پرداخت کنند.

بیش از یک میلیون کاربر برای استفاده از ChatGPT در پنج روز اول از زمان باز شدن آن برای عموم ثبت نام کرده اند.

من در انتهای بعضی مقالاتم به جهت تنوع و دوست داشتن و رفع خستگی (مطالعه مقالات) موزیکایی که دوست دارم رو میزارم که گوش کنید و حالش رو ببرید. مسلما مطالعه مستمر خیلی مفید و کاربردی نیست و لازم هستش یه مواقعی از موسیقی لذت ببرید.

امیدوارم موزیکای که میزارم رو دوست داشته باشید و اگر شما هم موزیکی دوست داشتید و به سبک من میخورد بگین که حتما در انتهای مقالات بعدی قرار بدم 🙂

موزیک Show Me How از Men I Trust

محسن زمانی هستم، برنامه نویس و طراح وب ، سئو هم بلدم . به هدف تفریح و سرگرمی این وب سایت رو طراحی کردم تا مطالبی که دوست دارم رو اینجا به اشتراک بزارم.

دیدگاه خود را بنویسید:

آدرس ایمیل شما نمایش داده نخواهد شد.