在科技界的浩瀚星空中,一家名为“月之暗面”的公司犹如一颗神秘的新星,吸引着无数探索者的目光。近日,借着其旗舰产品Kimi Chat上线一周年的契机,月之暗面创始人杨植麟罕见亮相,向媒体展示了他们“登月”征途中的又一重要里程碑。
在媒体的聚光灯下,杨植麟身着印有公司标志的黑色T恤,宣布了新一代数学推理模型k0-math的诞生。这款模型在数学能力上可与全球领先的OpenAI o1系列相媲美,当现场演示k0-math解答数学题时,杨植麟的眼中闪烁着兴奋的光芒,他详细地解析了模型背后的技术原理。
k0-math是Kimi推出的首款强化推理能力的模型,它采用了前沿的强化学习和思维链推理技术,这与杨植麟对行业技术趋势的洞察不谋而合。他强调,未来强化学习将成为技术发展的重点,尽管依然需要扩展(Scaling),但方式将有所不同。
据月之暗面透露,k0-math在中考、高考、考研以及包含竞赛题的MATH等数学基准测试中,表现优异,其初代模型的成绩已超越o1-mini和o1-preview,仅次于o1完全版。一位国内顶级互联网公司的大模型技术人员评价称,月之暗面很可能是国内首个在OpenAI o1发布后,摸索并实现其思路的公司。他还指出,数学领域是当前国内大模型团队赶超o1的首选,因为这一领域不需要大量标注数据,成本较低,且答案可验证。
面对媒体,杨植麟坦诚地分享了月之暗面的下一步计划:“Kimi目前的核心任务是提升用户留存率。”他认为,留存率与技术成熟度和技术水平密切相关,是现阶段最重要的目标。他坦言,如果以通用人工智能(AGI)为最终目标来衡量,他们目前仍处于初级阶段。
数据显示,截至今年10月,Kimi的月活跃用户数已超过3600万,并持续增长。在发布会现场,一张展示k0-math模型发布瞬间的照片格外引人注目,画面中,杨植麟站在舞台中央,自信而坚定。
发布会上,杨植麟还公布了k0-math在业界常用数学能力基准测试MATH中的得分——93.8分,这一成绩超过了o1-mini的90分和o1-preview的85.5分,仅次于o1完全版的94.8分。他强调,数学场景最适合锻炼AI的思考能力,k0-math在做题时会花费更多时间进行推理,包括思考和规划解题思路,并在必要时自我反思和改进。
尽管k0-math在解答高难度数学题上表现出色,但杨植麟也坦诚指出,当前版本尚无法处理LaTeX格式难以描述的几何图形类问题,且可能对过于简单的数学问题如“1+1=?”进行过度思考。他透露,k0-math采用了强化学习和思维链推理技术,这是OpenAI o1系列的关键所在,也是行业范式正在发生的变化。
杨植麟还分享了月之暗面对Scaling Law(规模法则)逐渐放缓的看法,他认为预训练仍有提升空间,大概半代到一代的模型将在明年迎来突破。他强调,未来最重点的是强化学习,范式将发生变化,但仍需通过不同的方式进行扩展。
在谈及业务聚焦时,杨植麟表示,月之暗面近期主动做了业务减法,停止了Ohai和Noisee两款出海产品的更新,暂时收缩了出海to C应用。他解释称,这一决策是基于对美国市场的观察和公司业务发展的判断,他们希望保持团队的精干和高效,避免过度扩张对创新造成致命伤害。
对于Kimi而言,提升留存率是当前最核心的任务。杨植麟表示,留存率是技术成熟的重要指标,仍有很大的提升空间。他透露,第三方机构的数据显示,截至今年9月,Kimi的3日留存率为32.2%,他们将通过提升模型思考能力和丰富交互方式来提高留存率。