滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

小米大模型团队音频推理突破，一周登顶MMAU榜，GRPO算法显神威！

时间：2025-03-17 20:30:00 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

小米大模型团队近日宣布，在音频推理技术方面取得了显著进步。该团队受DeepSeek-R1项目的启发，成功将强化学习算法应用于多模态音频理解任务，这一创新实践仅耗时一周，便在国际权威的MMAU音频理解评测中取得了64.5%的准确率，成功登顶榜首，并且已经同步开源。

据悉，DeepSeek-R1项目中提出的Group Relative Policy Optimization（GRPO）方法，使得模型能够通过“试错-奖励”机制自主进化，展现出类似人类的反思和多步验证等高级推理能力。小米团队受此启发，尝试将GRPO算法迁移到自家的Qwen2-Audio-7B模型上，取得了令人瞩目的成果。

在训练样本方面，小米团队仅使用了AVQA数据集中的3.8万条样本进行强化学习微调，便在MMAU评测集上实现了64.5%的准确率。这一成绩不仅刷新了记录，而且相比目前榜单上排名第一的商业闭源模型GPT-4o，有近10个百分点的优势。

尽管取得了如此显著的进步，但小米团队表示，当前模型的准确率距离人类专家的82%水平仍有差距。他们将继续努力，不断优化算法和模型，以期达到更高的准确率。

在官方提供的交互demo中，小米团队选择了雷军2015年“R U OK”的视频作为默认分析对象，展示了模型在实际应用中的表现。这一选择不仅富有趣味性，也体现了小米团队对于用户需求和场景理解的深入洞察。

小米技术官微在发布这一消息时表示，音频推理技术的突破将为智能语音助手、智能家居等领域带来更加智能和人性化的体验。他们期待与更多合作伙伴共同探索这一技术的广阔应用前景。

小米团队还强调了开源的重要性。他们认为，通过开源可以吸引更多开发者参与到技术的创新和优化中来，共同推动人工智能技术的发展和进步。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

抖音严令禁止无人直播，宝妈被骗案例频发，网友需警惕！

近日，有媒体报道大量宝妈购买“AI无人直播课程”被骗，交了学费后学不到什么，直播总是违规。记者实测发现，“导师”卖课积极，交钱后则爱搭不理拒绝退款。3月17日，抖音副总裁发文提示，抖音严禁无人直播，请大家谨防…

03-17

三星李在镕：生死存亡之际，三星电子如何以“拼死一搏”应对AI变革？

03-17

AI引领存储市场新风向，能否成为复苏关键？

因此，目前从整体存储市场来看，AI 虽带动了DDR5、HBM、企业级SSD等产品需求增长，但消费市场疲软对存储市场冲击较大，或不足以拉动整个市场正向增长，不过随着下半年传统存储需求复苏，整个存储市场仍有望恢…

03-17

AI下乡：大厂竞争白热化，农村市场成新战场

不过，一个问题是，尽管农村市场的用户知道了腾讯元宝，对这一产品的体验如何？当然，不管是梅姨还是小马，对于腾讯元宝的“刷墙”，仍表示“喜闻乐见”，在他们看来，通过这种方式，广大的农村市场，首次真正意义上接触…

03-17

抖音严令禁止无人直播，宝妈被骗学费，如何避免直播陷阱？

03-17

MIT新课揭秘：微分方程如何拓展AIGC边界？

03-17

英特尔新CEO陈立武：全面改革，能否带领公司走出困境？

03-17

QwQ-32B大模型登陆国家超算平台，免费体验百万Tokens等你来拿！

03-17

AI手机无障碍权限：便利背后的隐私泄露隐忧

而此时就出现了一个矛盾，如果用户想要拥有一个满血版的AI Agent，那就势必要开放更多权限给AI手机或AI应用，但一旦开放，自己的隐私信息将会被存储并上传云端进行大模型识别后再给出相应的动作，但如果想要保…

03-17

宝妈警惕！抖音严令禁止无人直播，赚钱教学骗局需防范

据报道，近日，在短视频平台上出现针对宝妈群体做“无人直播带货”赚钱教学的骗局。有宝妈反映称，交了学费后学不到东西，而且直播总是违规。有媒体测试发型，宣传这类课程的“导师” 卖课积极，但是交钱后便爱搭不理且拒绝…

03-17

容联云大模型应用引领AI Agent新风尚，入选2025产业图谱展现标杆实力

03-17

金山办公布局新领域，申请“青丘大模型”商标待审

据天眼查财产线索信息显示，近日，北京金山办公软件股份有限公司申请注册2枚“青丘大模型”商标，国际分类涉及科学仪器、网站服务，当前商标状态均为等待实质审查。该公司成立于2011年12月，法定代表人为邹涛，注册…

03-17

ChatGPT安卓新版上线，能否成为你的手机默认数字助理？

03-17

西交大与华为联手，鲲鹏昇腾孵化中心揭牌，共创科教新篇章！

03-17

DeepSeek助力跨境外贸，但躺赢还需内外兼修

03-17

点击查看更多 +

全站最新

俄宇航员戴外星面具迎美滞留宇航员，太空幽默引热议！

俄宇航员扮外星人趣迎美滞留宇航员，本周将共返地球

理想汽车利润下滑，李想能否借纯电新车打响2025反击战？

智己汽车联手阿里斑马智行，IM AIOS生态座舱引领未来出行新风尚

别克全新插电混动MPV GL8陆尚来袭，真龙插混系统能否引领新能源MPV潮流？

一汽-大众新能源战略大揭秘：捷达纯电来袭，零跑架构助力几何？

热门内容

本栏最新

三星李在镕：生死存亡之际，三星电子如何以“拼死一搏”应对AI变革？

AI引领存储市场新风向，能否成为复苏关键？

抖音严令禁止无人直播，宝妈被骗学费，如何避免直播陷阱？

英特尔新CEO陈立武：全面改革，能否带领公司走出困境？

QwQ-32B大模型登陆国家超算平台，免费体验百万Tokens等你来拿！

AI手机无障碍权限：便利背后的隐私泄露隐忧

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.