امتیاز هوش مصنوعی اوپن ای آی دروغ از آب درآمداختلافی بین نتایج آزمایش مدل هوش مصنوعی o3 اوپن ای آی در بنچمارک طرف اول و ثالث سوالاتی درباره شفافیت این شرکت و روش های تست مدل های آن به وجود آورده است. - به گزارش خبر گزاری مهر به نقل از تک کرانچ، اوپن ای آی هنگام رونمایی این مدل را در دسامبر 2024 میلادی مدعی شد o3 می تواند بیش از یک چهارم سئوالات در بنچمارک FrontierMath (مجموعه ای چالش برانگیز از مسئله های ریاضی) را پاسخ دهد. مارک چن محقق ارشد اوپن ای آی در یک برنامه پخش زنده گفت: امروز تمام محصولات ارائه شده در بنچمارک FrontierMath کمتر از دو درصد امتیاز دارند. ما در تست های داخلی o3 که در محیط های رایانشی با عملکرد بالا انجام شد به امتیاز بیش از 25 درصد دست یافتیم. به نظر می رسد این رقم احتمالاً حد بالایی بود که توسط نسخه ای از o3 با محاسبات بیشتر نسبت به مدل OpenAI که هفته گذشته به طور عمومی عرضه شد به دست آمد. انستیتو تحقیقات Epoch AI که بنچمارک FrontierMath را ارائه می کند، نتایج تست های مستقل خود از o3 را منتشر کرد. این شرکت متوجه شد امتیاز این مدل حدود 10 درصد و بسیار پایین تر از ارقام بسیار بالای ادعا شده توسط اوپن ای آی است. البته این بدان معنا نیست که اوپن ای آی دروغ گفته است. نتایج تست در بنچمارک که شرکت در دسامبر 2024 منتشر کرد نشان دهنده امتیازی کمتر است که با آنچه Epoch رصد کرده مطابقت دارد. برچسب ها: هوش مصنوعی - امتیاز - برنامه پخش زنده - مصنوعی - درصد - پخش زنده - تحقیقات |
آخرین اخبار سرویس: |