ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AAAI 2024竞赛：大模型数学推理突破创新

时间：2023-10-12 11:40:04 来源：ITBEAR编辑：茹茹 发表评论无障碍通道

【ITBEAR科技资讯】10月12日消息，近日，国际先进AI协会(AAAI)宣布，由学而思领衔，与谷歌、暨南大学等多家科技企业和高校的专家学者合作，将联袂举办AAA 2024全球大模型数学推理竞赛。

这项竞赛分为中文数学解题和英文数学解题两个方向，竞赛所需的中英文数据集TAL-SAQ7K-CN和TAL-SAQ6K-EN由学而思提供，据悉，这些数据集包含了来自国内外多个中小学数学竞赛的真题。

据ITBEAR科技资讯了解，这次竞赛将是全球首个数学大模型解题竞赛，主办方为参赛者提供了三个参考评估基准：GPT-3.5、GPT-4和好未来自研数学大模型MathGPT。

在竞赛期间，参赛者需要运用这些大模型来生成数学题目的推理步骤和答案。主办方将通过比较参赛模型生成的答案与正确答案之间的准确率来排名。主办方强调，他们期望参赛者使用大型语言模型来解决K-12(指学前教育至高中教育)的数学问题。

据介绍，目前大型语言模型存在一些“天生缺陷”，如缺乏复杂推理能力和数值计算的不准确性。如果这些模型能够克服这些问题，成功应对数学推理的挑战，那么AI领域将迎来一个全新的时代。

竞赛日程如下：

- 2023年10月10日：竞赛开始

- 2023年12月31日：最终提交截止日期

- 2024年1月10日：公布最终竞赛结果

奖项设置如下：

两个方向的前三名将获得现金奖励，一等奖1000美元，二等奖600美元，三等奖300美元。

此外，两个方向的前三名还将获得正式证书，并受邀在2024年AAAI国际大会期间发表口头报告。此次竞赛的前三名团队的第一作者还将被邀请撰写竞赛综述论文。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

北汽新能源携手小马智行，极狐无人驾驶车队预计2025年亮相！

活动现场，北汽新能源与小马智行签署L4无人驾驶车型开发技术合作协议。双方将共同推进Robotaxi技术落地，基于极狐T5的无人驾驶车队将在2025年上路，为市民提供无人驾驶出行服务。根据合作协议，双方将以全无…

11-03

联想新款AI平板YOGA Pad Pro亮相：支持手写笔，智能体验再升级！

11 月 3 日消息，联想 YOGA 今日官方公布一则视频，联想首款 AI 平板 YOGA Pad Pro AI元启版对外亮相，搭配手写笔，支持一圈解释、一圈翻译、一圈总结等功能。例如，在阅读外…

11-03

华为HarmonyOS大升级：信号更稳，网速飞快，你体验了吗？

华为在10月份发布了原生鸿蒙系统的最新版本HarmonyOS NEXT5.0。自从系统发布后，华为的工程师们一直在全力优化和功能完善，以提升系统的使用体验。这个新版本主要做了以下改进：首先是对信号稳定性…

11-03

全新RLHF框架开源！字节豆包大模型团队助力，吞吐量最高提升20倍！

官方宣称，HybridFlow（开源项目名：veRL）是一个灵活且高效的大模型 RL训练框架，兼容多种训练和推理框架，支持灵活的模型部署和多种 RL 算法实现。目前，该论文已被 EuroSys 2025…

11-03

华为联手华西医院，发布“华西黉医”医学大模型：自主创新引领未来！

快科技11月3日消息，今天，华为中国官方公众号宣布，华西医院与华为共同发布了720亿参数级别的全自主知识产权“华西黉医”医学大模型。 “华西黉医”医学大模型集成了10余类通用模型和50余类垂域模型，融合了11…

11-03

Nothing CEO放话：AI助力的Nothing OS即将上线，iOS准备好接招了吗？

尽管裴宇未透露更多细节，但他的言论表明Nothing OS将迎来重大升级，可能重塑用户与手机的交互方式。“我们不应将其称为AI操作系统，”他解释道，并补充说真正的成功将取决于谁能创造出最适合市场的产品并提供引…

11-03

华西医院携手华为，共创“华西黉医”医学大模型，引领未来医疗新篇章！

11 月 3 日消息，华为技术有限公司今日发文宣布，在昨日（11 月 2 日）的 2024 四川大学华西医院管理大会上，。据介绍，“华西黉医”医学大模型集成 10 余类通用模型和 50 余类垂域模…

11-03

台积电CoWoS封装技术受热捧！NVIDIA、微软、谷歌争相合作，价格或将上涨20%？

快科技11月3日消息，据摩根士丹利的最新报告，台积电正考虑对其3nm制程和CoWoS先进封装工艺提价，以应对市场需求的激增。台积电计划在2025年实施涨价，预计3nm制程价格将上涨高达5%，而CoWoS封装…

11-03

TeleAI星辰语音大模型全新升级：中英双语混合说，方言无界限！

11 月 3 日消息，中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 ——星辰超多方言语音识别大模型。时隔不到半年，TeleAI 星辰…

11-03

热巴助阵联想双十一盛宴，首款AI平板震撼登场，科技新风尚！

今晚的直播间集结了众多AI好物，包括联想AI手机、AI平板、AI PC在内的全品类产品，实现了不同品类全覆盖，满足学生党、职场人士、游戏爱好者等不同人群的多元化需求，不管是想新品尝鲜、大促种草换机，统统都可…

11-03

云端争霸战再燃：亚马逊领跑，微软紧追，谷歌能逆袭吗？

DA Davidson 分析师本周在一份报告中表示，他们认为微软在与亚马逊和谷歌的竞争中无法取胜。 Oracle近期与其三家规模更大的云计算竞争对手展开合作，在其服务中提供其数据库，董事长拉里·埃里森 (…

11-03

2024 TechWorld盛会落幕：绿盟科技引领智慧安全新篇章！

与此同时，在“智·启时代 - 第二届AI安全主题论坛”专题论坛上，绿盟科技集团副总裁曹嘉致辞，中国信息通信研究院安全研究所数据安全研究部副主任张琳琳、绿盟科技集团天枢实验室负责人顾杜娟、IDC中国研究总监王…

11-02

苹果、三星、高通争相出手，英特尔成香饽饽？芯片业即将迎来巨变！

11月2日消息，据国外媒体最新报道称，在收购英特尔的路上，除了高通兴趣十足外，苹果和三星也要加入其中。对于高通来说，其正在与Arm公司闹翻，拥有x86 IP的前景很是诱人。反观苹果，公司目前有一个基于Ar…

11-02

iOS 18.1更新：苹果AI技术助力CarPlay再升级，智能驾驶新体验！

IT之家注：用户在车上呼唤 Siri 后，在 CarPlay 显示屏上会出现新的光环效果，提升了一致性和视觉体验。 iOS 18.1 还引入了新的通知管理功能，特别是在驾驶专注模式下。用户可以通过设置菜单轻…

11-02

“AI黄埔军校”领航新征程，中国自动驾驶扬帆起航迈向未来！

早在今年5月，百度就在Apollo Day上发布了全球首个支持L4级无人驾驶应用的自动驾驶大模型Apollo ADFM。百度为行业输出的AI和自动驾驶人才，无疑推动了中国自动驾驶技术的发展步伐，大大缩短了…

11-02

点击查看更多 +

全站最新

第九届“武夷正岩杯”岩茶茶王赛火热进行中，谁将夺魁成为茶界新状元？

"死亡游戏"再现校园，家长警惕：看到这个动作务必制止！

幻灭强势登顶云顶之弈TOC9第四局，数据揭秘其背后实力！

陈序霸气夺冠！月决赛大满贯，猛蓄猛出成制胜秘诀

多款二次元游戏整改，立绘时装改动引热议，乙女游戏或成最大赢家？

西安交大在第十四届“挑战杯”勇夺11项金奖，再捧“优胜杯”！

热门内容

本栏最新

联想新款AI平板YOGA Pad Pro亮相：支持手写笔，智能体验再升级！

华为HarmonyOS大升级：信号更稳，网速飞快，你体验了吗？

全新RLHF框架开源！字节豆包大模型团队助力，吞吐量最高提升20倍！

华为联手华西医院，发布“华西黉医”医学大模型：自主创新引领未来！

Nothing CEO放话：AI助力的Nothing OS即将上线，iOS准备好接招了吗？

华西医院携手华为，共创“华西黉医”医学大模型，引领未来医疗新篇章！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.