在人工智能领域,2025年见证了大语言模型能力的显著提升以及文生视频大模型的崭露头角。随着通用人工智能(AGI)目标的逐步推进,多模态大模型正成为市场的新焦点。在这场技术竞赛中,腾讯凭借其在游戏领域的深厚积累,正全力投入3D生成技术的研发。
近日,腾讯正式推出了混元3D生成大模型的2.0版本,并同步上线了业界首个一站式、低门槛的3D内容AI创作平台——混元AI 3D创作引擎。这一举措标志着腾讯在AI 3D领域的又一重大突破。
据腾讯混元3D负责人介绍,混元AI 3D创作引擎旨在解决3D创作需求广泛但制作门槛高的问题。传统3D模型制作成本高昂,即使是最便宜的模型也接近百元,而高端模型甚至可达十万元。混元3D生成大模型的推出,旨在降低这一门槛,使更多人能够轻松进行3D创作。
事实上,早在去年11月,腾讯就已发布并开源了混元3D生成大模型的1.0版本,支持企业及开发者进行精调和部署。短短两个月后,2.0版本的推出,显示了腾讯在AI 3D领域的坚定决心和持续投入。
与1.0版本相比,2.0版本在几何和纹理解耦生成方面取得了显著进步。通过这一技术,2.0版本在生成效果上更加精细,几何结构更加准确,纹理色彩更加丰富。这一改进使得生成的3D模型更加真实、细腻。
混元AI 3D创作引擎搭载2.0版本后,用户只需通过一句话、提示词或图片,即可直接生成3D模型。除了基础模型生成外,该引擎还提供了3D功能矩阵、3D编辑、3D生成工作流以及创作素材库等多种功能。这一平台不仅支持专业领域的3D生产管线,如游戏开发、设计建模等,还能满足普通爱好者的UGC 3D内容创作需求。
腾讯始终将“产业实用”作为发展大模型的核心战略。混元大模型已在腾讯内部超过700个业务场景中落地应用,而混元3D生成大模型也已在游戏、社交、腾讯地图、腾讯云、机器人等多个业务场景进行内测。据透露,混元生成的3D质量已能满足部分游戏的3D资产标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等。通过混元3D创作平台的助力,腾讯游戏业务的3D资产制作时间成本已从5-10天级别下降到分钟级。
游戏研发是3D模型应用的重要场景之一。然而,市面上现有的AI生成3D模型在游戏研发中仍面临诸多挑战,如模型面数控制能力、布线合理性、绑定骨骼的能力以及蒙皮合理性等。这些问题导致大部分AI生成的3D模型无法应用于游戏中。而腾讯混元3D生成大模型在这些方面取得了明显改善,特别是在面数控制能力上。
腾讯游戏在研项目研发制作人指出,面数控制能力对游戏研发至关重要。某些游戏项目需要的3D模型可能只有几千面,但一些大模型只能生成几万面,这会导致游戏无法流畅运行。而腾讯混元团队能够深入理解游戏研发的生产流程,针对真正痛点进行研发,因此能够在这些问题上取得显著改善。
尽管多模态大模型领域的发展势头迅猛,但仍面临不少挑战。其中,数据不足和3D模型本身的约束较少是两大主要问题。目前,3D模型的数据量仅有千万量级,且尚未被充分利用。3D模型相对于其他模态的约束较少,如视频在时间轴上虽有连续性但少有突变,这增加了模型的技术挑战。