OpenAI CriticGPT را اعلام کرد، ابزاری که خطاهای ChatGPT را پیدا می کند
OpenAI
اعلام کرده است که مدل جدید خود، CriticGPT، را معرفی کرده است که برای شناسایی خطاها در کد برنامهنویسی طراحی شده است. این مدل بخشی از سری GPT-4 است و برای تجزیه و تحلیل پاسخهای تولید شده توسط ChatGPT و کمک به کاربران برای پیدا کردن خطاها طی فرآیند آموزشی AI طراحی شده است.
مدلهای GPT با استفاده از “یادگیری تقویتی از بازخورد انسانی” یا RLHF به آموزش میپردازند. این روش شامل استفاده از بازخورد انسانی برای آموزش AI به منظور تبدیل شدن به شبیهساز بیشتر به انسان در طول توسعه است.
چگونگی عملکرد RLHF در آموزش
در این فرآیند، انسانها به عنوان “مربیان AI” شناخته میشوند. در این فرآیند، انسانها پاسخهای مختلفی که AI به درخواستهای آنها ارائه میدهد را بررسی میکنند. سپس این پاسخها ارزیابی شده و بازخورد به دست میآید که آیا پاسخ خوب و دقیق بوده است یا آیا AI در پاسخ خود حالت دچار توهم بوده است.
یک مثال خوب از این آموزش میتواند فرآیند استفاده شما از ChatGPT باشد. بعضی اوقات، AI از شما میپرسد که آیا پاسخش مفید، دقیق، ناقص یا نادرست بوده است و بازخورد بر اساس آن دریافت میکند.
بنابراین، با دریافت مداوم این بازخورد، AI به مرور زمان یاد میگیرد و الگوها یا رفتارهای مشاهده شده در بازخورد مثبت را تکرار میکند. در مقابل، در صورت دریافت بازخورد منفی، سعی میکند از این الگوها دوری کند.
هدف اصلی از ابزار CriticGPT این است که سیستمهای هوش مصنوعی را قابل اعتمادتر کند، زیرا تجربه نشان داده است که اغلب فناوریها از نظر دقت همیشه قابل اعتماد نیستند. “هر چقدر که پیشرفتهایی در استدلال و رفتار مدلها انجام میدهیم، ChatGPT دقیقتر میشود و خطاهای آن همچنین ظریفتر میشوند. این میتواند باعث سختتر شدن شناسایی عدم دقتها توسط مربیان AI شود، که در نتیجه وظیفه مقایسه که قدرت RLHF را فراهم میکند، دشوارتر میشود.”
OpenAI در اعلام خود توضیح داده است: “این یک محدودیت اساسی RLHF است و ممکن است باعث شود که هماهنگسازی مدلها هنگامی که آنها به تدریج دانشمندانهتر از هر انسانی که ممکن است بازخورد دهد، دشوارتر شود.”
ارزیابی ابزار CriticGPT
OpenAI اظهار داشته است: “ما دریافت کردهایم که وقتی افراد به کمک CriticGPT برای بررسی کد ChatGPT کمک میشوند، در 60% از موارد بهتر از آنهایی که بدون کمک هستند، عملکرد میکنند. ما در حال شروع کار برای ادغام مدلهای مانند CriticGPT به لولهکشی برچسبگذاری RLHF خود هستیم که به مربیان ما کمک صریح از AI را فراهم میکند.”
همچنین، در 63% از موارد، انتقادهای CriticGPT نسبت به آنهایی که توسط ChatGPT تولید شدهاند، ترجیح داده شده است. هنگامی که خطا وجود دارد، CriticGPT خطای را مشخص میکند و به طور موازی نقدی ارائه میدهد که دلیل این خطا را شرح میدهد.
اگرچه این ابزار برای ارائه انتقادهای دقیق و مختصر آموزش دیده شده است، اما ثابت شده است که بسیار مفید است. این یک راهحل بسیار کارآمد برای ChatGPT است که به دلیل تولید خطاهای کوچک شناخته میشود. با این حال، OpenAI در حال کار بر روی بهبود و توسعه این ابزار است و برای حال حاضر، این یک راهحل مناسب برای مسئله هالوسیناسیون است که به تازگی مطرح شده است.
منبع:لینک