滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Kimi视觉思考模型k1上线，拍照解题还能展示完整思考链

时间：2024-12-16 10:22:56 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，月之暗面科技公司正式推出了其最新研发的视觉思考模型k1，这一创新成果基于先进的强化学习技术，旨在实现端到端的图像理解和思维链技术的原生支持，并将应用范围拓展至数学以外的多个基础科学领域。

据月之暗面官方透露，k1模型在基础科学学科的基准测试中表现出色，其性能已经超越了OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet等业界知名模型。这一成就标志着k1模型在理解和解答科学问题上的能力迈上了一个新台阶。

k1视觉思考模型一经发布即上线，用户可以在最新版“Kimi智能助手”的Android和iPhone手机App以及网页版kimi.com上体验到这一新功能。用户只需在App或网页版中找到“Kimi视觉思考版”，即可通过拍照或上传图片进行体验。该模型不仅能够给出答题结果，还能完整展示推理思维链CoT，让用户清晰看到模型思索答案的全过程。

从模型训练的角度来看，k1视觉思考模型的训练过程经过了两个阶段的精心打磨。首先，通过预训练得到基础模型，然后在基础模型上进行强化学习后训练。在基础模型阶段，k1特别优化了字符识别能力，在OCRBench上取得了903分的优异成绩。同时，在MathVista-testmini、MMMU-val和DocVQA等基准测试集上，k1也分别获得了69.1、66.7和96.9的高分。

月之暗面在k1的强化学习后训练阶段也进行了诸多优化，特别是在数据质量和学习效率方面取得了显著进步。同时，公司在强化学习的规模化上实现了新的突破，为k1模型的高性能表现奠定了坚实基础。

在科学模型能力基准测试方案方面，月之暗面也面临着行业内的重要挑战。由于市场上缺乏针对基础科学学科的图形测试集，Kimi模型研发团队自主构建了一个标准化的测试集Science Vista。该测试集涵盖了不同难度的数理化图片题目，且与实际用户需求较为匹配。月之暗面表示，该测试集将开放给全行业使用，以推动基础科学领域大模型技术的发展。

然而，在内部测试中，月之暗面也发现了k1视觉思考模型存在的一些局限性。例如，在分布外问题的泛化能力、复杂问题的成功率、噪声场景的准确率以及多轮问答效果等方面，k1仍有较大的提升空间。与OpenAI的o1系列模型相比，k1在某些场景和泛化能力上仍存在一定差距。月之暗面表示，将继续努力优化模型性能，为用户提供更加高效、准确的视觉思考服务。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

闲鱼AI新突破：超级智能体引领闲置交易革命

04-18

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

04-18

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

AMD GPU大飞跃！Stable Diffusion模型性能提升最高达3.8倍

04-18

点击查看更多 +

全站最新

文科与AI融合，中国哲学如何为通用人工智能塑造“灵魂”？

辅助驾驶非自动驾驶，滥用或误导宣传或将面临法律责任

捷途山海L9：15万级混动新选择，6座大空间能否挑战市场格局？

特斯拉Cybertruck销量大跌，产能缩减引关注

宁德时代新设两家子公司，深耕新能源科技领域

奇瑞海外狂飙！年赚4800亿出口114万辆，低调超越比亚迪成新巨头

热门内容

本栏最新

闲鱼AI新突破：超级智能体引领闲置交易革命

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.