اخبارانگلیسگزارش نامه

OpenAI CriticGPT را اعلام کرد، ابزاری که خطاهای ChatGPT را پیدا می کند

OpenAI

اعلام کرده است که مدل جدید خود، CriticGPT، را معرفی کرده است که برای شناسایی خطاها در کد برنامه‌نویسی طراحی شده است. این مدل بخشی از سری GPT-4 است و برای تجزیه و تحلیل پاسخ‌های تولید شده توسط ChatGPT و کمک به کاربران برای پیدا کردن خطاها طی فرآیند آموزشی AI طراحی شده است.

مدل‌های GPT با استفاده از “یادگیری تقویتی از بازخورد انسانی” یا RLHF به آموزش می‌پردازند. این روش شامل استفاده از بازخورد انسانی برای آموزش AI به منظور تبدیل شدن به شبیه‌ساز بیشتر به انسان در طول توسعه است.

 چگونگی عملکرد RLHF در آموزش

در این فرآیند، انسان‌ها به عنوان “مربیان AI” شناخته می‌شوند. در این فرآیند، انسان‌ها پاسخ‌های مختلفی که AI به درخواست‌های آن‌ها ارائه می‌دهد را بررسی می‌کنند. سپس این پاسخ‌ها ارزیابی شده و بازخورد به دست می‌آید که آیا پاسخ خوب و دقیق بوده است یا آیا AI در پاسخ خود حالت دچار توهم بوده است.

یک مثال خوب از این آموزش می‌تواند فرآیند استفاده شما از ChatGPT باشد. بعضی اوقات، AI از شما می‌پرسد که آیا پاسخش مفید، دقیق، ناقص یا نادرست بوده است و بازخورد بر اساس آن دریافت می‌کند.

بنابراین، با دریافت مداوم این بازخورد، AI به مرور زمان یاد می‌گیرد و الگوها یا رفتارهای مشاهده شده در بازخورد مثبت را تکرار می‌کند. در مقابل، در صورت دریافت بازخورد منفی، سعی می‌کند از این الگوها دوری کند.

 چگونگی عملکرد RLHF در آموزش
چگونگی عملکرد RLHF در آموزش

هدف اصلی از ابزار CriticGPT این است که سیستم‌های هوش مصنوعی را قابل اعتماد‌تر کند، زیرا تجربه نشان داده است که اغلب فناوری‌ها از نظر دقت همیشه قابل اعتماد نیستند. “هر چقدر که پیشرفت‌هایی در استدلال و رفتار مدل‌ها انجام می‌دهیم، ChatGPT دقیق‌تر می‌شود و خطاهای آن همچنین ظریف‌تر می‌شوند. این می‌تواند باعث سخت‌تر شدن شناسایی عدم دقت‌ها توسط مربیان AI شود، که در نتیجه وظیفه مقایسه که قدرت RLHF را فراهم می‌کند، دشوارتر می‌شود.”

OpenAI در اعلام خود توضیح داده است: “این یک محدودیت اساسی RLHF است و ممکن است باعث شود که هماهنگ‌سازی مدل‌ها هنگامی که آن‌ها به تدریج دانشمندانه‌تر از هر انسانی که ممکن است بازخورد دهد، دشوارتر شود.”

ارزیابی ابزار CriticGPT

OpenAI اظهار داشته است: “ما دریافت کرده‌ایم که وقتی افراد به کمک CriticGPT برای بررسی کد ChatGPT کمک می‌شوند، در 60% از موارد بهتر از آن‌هایی که بدون کمک هستند، عملکرد می‌کنند. ما در حال شروع کار برای ادغام مدل‌های مانند CriticGPT به لوله‌کشی برچسب‌گذاری RLHF خود هستیم که به مربیان ما کمک صریح از AI را فراهم می‌کند.”

همچنین، در 63% از موارد، انتقادهای CriticGPT نسبت به آن‌هایی که توسط ChatGPT تولید شده‌اند، ترجیح داده شده است. هنگامی که خطا وجود دارد، CriticGPT خطای را مشخص می‌کند و به طور موازی نقدی ارائه می‌دهد که دلیل این خطا را شرح می‌دهد.

اگرچه این ابزار برای ارائه انتقادهای دقیق و مختصر آموزش دیده شده است، اما ثابت شده است که بسیار مفید است. این یک راه‌حل بسیار کارآمد برای ChatGPT است که به دلیل تولید خطاهای کوچک شناخته می‌شود. با این حال، OpenAI در حال کار بر روی بهبود و توسعه این ابزار است و برای حال حاضر، این یک راه‌حل مناسب برای مسئله هالوسیناسیون است که به تازگی مطرح شده است.

منبع:لینک

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا