商汤科技近日揭晓了其2024年度的财务业绩,显示出强劲的增长势头。数据显示,该公司全年总收入实现了10.8%的同比增长,总额达到37.7亿元人民币。尤为生成式AI业务成为了商汤的增长引擎,其收入飙升103.1%,达到24亿元人民币,连续两年保持了三位数的惊人增速,并已跃升为公司最大的业务板块。
随着大模型技术的不断演进,行业关注点已从最初的单纯追求规模扩展,转向了算力效率、训练至推理的转化速度以及实际应用落地等多个维度。这一转变标志着大模型技术正步入一个全新的发展阶段,同时也对工程技术能力和场景协同提出了更高要求。
商汤科技,作为首批“AI原生”企业,早在几年前便前瞻性地布局了AI基础设施,并逐步形成了“大装置-大模型-应用”的核心战略。这一战略如今正展现出其在AI领域的深远影响力和前瞻性。过去三年间,商汤成功构建了“大装置-大模型-应用”三者紧密协同的生态系统,为各行各业提供了强大的技术支持。
商汤的技术积累在多个领域得到了验证。在2024年5月发布的SuperCLUE榜单中,商汤的“日日新5.0”(SenseChat V5)以总分80.03分的优异成绩夺得中文基准测评的桂冠,不仅在中文综合成绩上超越了GPT-4 Turbo,还刷新了国内大模型在该项测试中的最高纪录。
这一成就的背后,是商汤在AI基础设施上的持续投入。面对国内智算中心建设的加速推进,以及算力资源分散、标准不统一等挑战,商汤通过布局算力运营,实现了对不同标准计算资源的有效整合和高效利用,满足了不同客户的多样化需求。
商汤科技董事长兼CEO徐立表示,当前AI领域的竞争关键在于资源的快速整合与高效利用,而商汤提供的基础服务更贴近AI发展的现状。他强调,商汤不仅是最懂模型的算力服务商,也是最懂算力的模型服务商。
为了进一步提升大模型的训练和推理效率,商汤采用了自动化多维并行策略和FP8混合精度训练,显著提升了训练速度。同时,在推理方面,商汤通过低比特量化推理、双推理引擎支持等技术手段,将推理成本大幅降低,同时保持了模型的性能。
在应用层面,商汤的日日新大模型在生产力工具和交互工具两个方向上取得了显著成果。生产力工具直接提升了企业办公、金融、政务等场景的生产效率,而交互工具则通过2B2C的方式赋能业务伙伴,提升了用户体验,满足了智能陪伴、智能硬件交互、智能营销等多场景需求。
商汤还积极布局多模态大模型的研究与应用。与传统的多模态模型不同,商汤采用了“原生融合多模态技术”,从数据层和模型架构层进行全流程融合,实现了感知、思考到输出的完整过程。这一技术在自动驾驶、机器人等前沿领域展现出了巨大的应用潜力。
在2024年的全球CVPR大会上,商汤科技共有50篇论文入选,展示了其在视觉语言基础模型领域的深厚积累。同时,商汤的多元化AI产品也在实际应用中取得了显著成效。例如,“小浣熊家族”智能辅助服务已为数十万用户提供了数十亿次服务,而绝影平台也率先实现了原生多模态大模型的车端部署。
通过底层基础设施和上层应用的协同优化,商汤科技成功构建了坚实的技术壁垒。在基础设施端,商汤自建的AI数据中心和规模化研发服务使其在传统基础设施厂商和AI原生公司中脱颖而出;在应用端,商汤的全栈体系AI应用覆盖了广泛行业,大模型则聚焦于原生融合多模态发展。