滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

OpenAI再夺7金，o1-preview成首个AI Kaggle特级大师！

时间：2024-10-12 21:11:58 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR】科技媒体The Decoder于昨日发布了一篇引人注目的报道，披露了OpenAI公司最新推出的MLE-bench基准。这一基准旨在评估AI智能体在开发机器学习解决方案方面的实力，覆盖了75个Kaggle竞赛，涵盖了自然语言处理、计算机视觉和信号处理等多个领域。

MLE-bench专注于两个核心领域：选择具有挑战性的任务，这些任务代表着当前机器学习的发展前沿；比较AI与人类的表现，以此评估AI在特定任务中的能力。

OpenAI在MLE-bench上测试了多个AI模型和智能体框架，其中使用AIDE框架的o1-preview模型表现尤为出色，在16.9%的比赛中至少获得了一枚铜牌，这一成绩甚至超越了Anthropic的Claude 3.5 Sonnet。

值得注意的是，MLE-bench上的任务具有现实世界的应用价值，如预测COVID-19 mRNA疫苗的降解或解码古代卷轴等。而获得5枚金牌即可评为“Grandmaster”特级大师，o1-preview模型在测试中更是获得了7枚金牌。

然而，OpenAI也承认MLE-bench存在局限性，它并未涵盖AI研究与开发的所有方面，而是主要集中在那些具有明确问题和简单评估指标的任务上。

尽管如此，MLE-bench基准的推出无疑为AI在机器学习领域的发展提供了新的推动力。该基准现已在GitHub上发布，OpenAI希望通过这一工具，进一步推动AI在机器学习领域的创新与应用。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

“王妃”炫富带货后集体消失，网友直呼：别再消耗我们的善良！

12-19

打假人王海遭品牌起诉，道歉后又要反诉，这场“打假”战何时休？

12-19

国产DDR5内存新突破！499元32GB高性价比套装来袭

12-19

重庆农企闪耀第26届中洽会，百余款精品农产品引领农业新风尚！

12-19

微众银行董事长呼吁全员加班，裁员增多，员工加班严重引热议

三言科技12月19日消息，近日，微众银行董事长顾敏在内部会议上的发言曝光，直言希望全体员工“卷起来”，提早上班时间，推迟下班时间。知情人士称，微众银行每年优化无利润业务，但今年裁员数量多于以往，还关闭校招和实…

12-19

严禁利用融券变相T+0交易，券商再行动，市场融券已极度缩量

12-19

《金融产品网络营销管理办法》或发布涉及贷款、理财、支付等领域

12-19

芜湖造心脏，驱动国家级无人直升机救援平台展雄风！

12-19

神策智能运营新升级，如何助力企业实现高效精准营销？

12-19

顺丰控股11月收入稳健增长6.73%，供应链及国际业务增速亮眼

三言科技12月19日消息，今日，顺丰控股公告，2024年11月公司速运物流业务及供应链和国际业务合计收入为251.96亿元，较2023年同期236.08亿元增长6.73%。其中，速运物流业务收入为188.02…

12-19

荣耀股东变动引关注，官方称系股权架构调整

三言科技12月19日消息，近日，多则网传荣耀新一轮股改已完成。据媒体报道，荣耀的股东名单已经发生变更，有国资背景的股东显示退出。信息显示，9月刚刚加入的新股东杭州微同股权投资合伙企业（有限合伙），于11月退出…

12-19

顺丰航空引领！国内全货机首次SAF商业飞行成功落地

12-19

中央经济工作会议力推哪些新兴经济模式？

12-19

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

12-19

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

12-19

点击查看更多 +

全站最新

“王妃”炫富带货后集体消失，网友直呼：别再消耗我们的善良！

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

打假人王海遭品牌起诉，道歉后又要反诉，这场“打假”战何时休？

余承东透露：鸿蒙智行受车厂热捧，资源有限难以满足所有合作需求

余承东回忆：与北汽合作始于2017年一张PPT开启华为汽车梦

荣耀Magic7 RSR保时捷设计：100倍AI长焦，样张细节震撼曝光！

热门内容

本栏最新

“王妃”炫富带货后集体消失，网友直呼：别再消耗我们的善良！

打假人王海遭品牌起诉，道歉后又要反诉，这场“打假”战何时休？

国产DDR5内存新突破！499元32GB高性价比套装来袭

重庆农企闪耀第26届中洽会，百余款精品农产品引领农业新风尚！

严禁利用融券变相T+0交易，券商再行动，市场融券已极度缩量

《金融产品网络营销管理办法》或发布涉及贷款、理财、支付等领域

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.