مطالب مرتبط:
امتیاز کم هوش مصنوعی «اوپن ای آی» در یک آزمایش، سؤال برانگیز شد
ویدیو/ هوش مصنوعی در خدمت علم دندانپزشکی
طرح ملی هوش مصنوعی در کمیسیون صنایع مجلس تصویب شد
هوش مصنوعی و فرصت احیای حکمرانی
تصویب طرح ملی هوش مصنوعی در کمیسیون صنایع و معادن مجلس
5 + 1
یارانه ها
مسکن مهر
قیمت جهانی طلا
قیمت روز طلا و ارز
قیمت جهانی نفت
اخبار نرخ ارز
قیمت طلا
قیمت سکه
آب و هوا
بازار کار
افغانستان
تاجیکستان
استانها
ویدئو های ورزشی
طنز و کاریکاتور
بازار آتی سکه
دوشنبه، 1 اردیبهشت 1404 ساعت 11:552025-04-21بين الملل

امتیاز هوش مصنوعی اوپن ای آی دروغ از آب درآمد


اختلافی بین نتایج آزمایش مدل هوش مصنوعی o3 اوپن ای آی در بنچمارک طرف اول و ثالث سوالاتی درباره شفافیت این شرکت و روش های تست مدل های آن به وجود آورده است.

- به گزارش خبر گزاری مهر به نقل از تک کرانچ، اوپن ای آی هنگام رونمایی این مدل را در دسامبر 2024 میلادی مدعی شد o3 می تواند بیش از یک چهارم سئوالات در بنچمارک FrontierMath (مجموعه ای چالش برانگیز از مسئله های ریاضی) را پاسخ دهد.

مارک چن محقق ارشد اوپن ای آی در یک برنامه پخش زنده گفت: امروز تمام محصولات ارائه شده در بنچمارک FrontierMath کمتر از دو درصد امتیاز دارند.

ما در تست های داخلی o3 که در محیط های رایانشی با عملکرد بالا انجام شد به امتیاز بیش از 25 درصد دست یافتیم.

به نظر می رسد این رقم احتمالاً حد بالایی بود که توسط نسخه ای از o3 با محاسبات بیشتر نسبت به مدل OpenAI که هفته گذشته به طور عمومی عرضه شد به دست آمد.

انستیتو تحقیقات Epoch AI که بنچمارک FrontierMath را ارائه می کند، نتایج تست های مستقل خود از o3 را منتشر کرد.

این شرکت متوجه شد امتیاز این مدل حدود 10 درصد و بسیار پایین تر از ارقام بسیار بالای ادعا شده توسط اوپن ای آی است.

البته این بدان معنا نیست که اوپن ای آی دروغ گفته است.

نتایج تست در بنچمارک که شرکت در دسامبر 2024 منتشر کرد نشان دهنده امتیازی کمتر است که با آنچه Epoch رصد کرده مطابقت دارد.


برچسب ها: هوش مصنوعی - امتیاز - برنامه پخش زنده - مصنوعی - درصد - پخش زنده - تحقیقات
آخرین اخبار سرویس:

امتیاز هوش مصنوعی اوپن ای آی دروغ از آب درآمد

امتیاز هوش مصنوعی اوپن ای آی دروغ از آب درآمد