在科技界的瞩目下,NVIDIA于近期宣布了一项革命性的进展——推出了名为Cosmos的世界基础模型平台。这一创新之举在CES 2025大会上由NVIDIA创始人兼首席执行官黄仁勋亲自揭晓,旨在解决通用机器人与自动驾驶领域长期面临的数据瓶颈问题。
Cosmos平台集成了先进的生成式世界基础模型、高效视频分词器、安全护栏以及加速视频处理流水线,并专为NVIDIA数据中心GPU进行了深度优化。该平台致力于推动自动驾驶汽车、机器人等物理AI系统的快速发展,为开发者们提供了前所未有的便捷与效率。
物理AI模型的开发历来成本高昂,需要大量真实数据和繁琐的测试。Cosmos的推出,使得开发者能够轻松生成基于物理学的逼真合成数据,极大地降低了数据获取的门槛。通过微调Cosmos世界基础模型,开发者还能够构建出符合特定需求的自定义模型,进一步加速了物理AI的研发进程。
据悉,Cosmos平台的首批用户涵盖了众多全球物理AI领域的领军企业,如1X、思灵机器人、Agility、Figure AI、Foretellix、傅利叶、银河通用、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Uber、Waabi以及小鹏汽车等,涉及机器人、自动驾驶、共享出行等多个领域。
NVIDIA以开放模型许可证的方式提供Cosmos模型,首批共推出8款,参数量从40亿到140亿不等。用户可以在NVIDIA API目录中预览这些模型,并在NVIDIA NGC目录或Hugging Face平台上下载整个系列的模型和微调框架。未来,这些模型还将以全面优化的NVIDIA NIM微服务形式提供给用户。
在开发过程中,开发者可以利用NVIDIA NeMo Curator加速视频处理,并使用NVIDIA NeMo框架来定制自己的世界模型。随后,通过NVIDIA DGX Cloud平台,这些模型可以快速、简单地部署到实际应用中。NVIDIA AI Enterprise软件平台还将为用户提供全方位的企业支持。
黄仁勋在演讲中强调:“机器人技术的ChatGPT时刻即将到来。与大语言模型一样,世界基础模型将成为推动机器人和自动驾驶汽车开发的关键力量。”他表示,NVIDIA创建Cosmos的初衷是普及物理AI,让每一位开发者都能接触到通用机器人技术,从而推动整个行业的快速发展。
Cosmos世界基础模型专为物理AI的研发而设计,采用了一套开放扩散和自回归Transformer模型架构。该模型能够基于物理学原理实现交互、物体恒存性,并生成高质量的仿真工业环境(如仓库、工厂)和驾驶环境(包括各种路况)。这些模型经过2000万小时真实世界数据的训练,能够根据文本、图像和视频等输入组合以及机器人传感器或运动数据生成逼真的物理学视频。
黄仁勋还展示了Cosmos在实际应用中的多个用例,包括视频搜索和理解、基于物理学的逼真合成数据生成、物理AI模型开发和评估以及预测与“多元宇宙”模拟等。这些用例充分展示了Cosmos在推动物理AI发展方面的巨大潜力。
NVIDIA还为用户提供了先进的开发工具,以节省在数据整理、训练和模型定制方面的巨大成本。其中,NVIDIA NeMo Curator驱动的NVIDIA AI和CUDA加速数据处理管线能够在短时间内处理大量视频数据;NVIDIA Cosmos Tokenizer则是一种先进的可视化分词器,能够显著提高图像和视频的分词效率和压缩率;而NVIDIA NeMo框架则可用于高效的模型训练、定制和优化。
在隐私和数据保护方面,NVIDIA也做出了一系列精心设计。Cosmos平台遵循NVIDIA的可信AI原则,将隐私、安全、保障、透明和减少不必要的偏见作为首要考虑。平台加入了专为减少有害文字和图像而设计的护栏,并提供了增强文字提示准确性的工具。同时,使用Cosmos生成的视频会带有隐形水印,以识别AI生成的内容,从而减少错误信息和错误归属的可能性。
多家物理AI企业已经采用了Cosmos技术,并取得了显著的成效。例如,AI人形机器人公司1X利用Cosmos Tokenizer推出了1X World Model Challenge数据集;Hillbot和Skild AI正在使用Cosmos加速通用机器人的开发;小鹏汽车也将借助Cosmos加快人形机器人的研发进程。这些企业的成功实践进一步证明了Cosmos在推动物理AI发展方面的巨大价值。
在交通运输领域,一些领先企业也在积极探索Cosmos的应用。Waabi公司正在评估Cosmos在自动驾驶汽车软件开发和仿真中数据整理的应用;自动驾驶AI基础模型公司Wayve也在考虑使用Cosmos搜索用于提高安全性和验证的极端驾驶场景;而自动驾驶汽车工具链提供商Foretellix则计划利用Cosmos与NVIDIA Omniverse Sensor RTX API大规模评估和生成高保真测试场景与训练数据。
全球共享出行巨头Uber也在与NVIDIA合作,共同加速自动驾驶汽车的发展。通过结合Uber丰富的驾驶数据集与Cosmos平台和NVIDIA DGX Cloud的功能,Uber的自动驾驶汽车合作伙伴能够更加高效地构建出更强大的AI模型。Uber首席执行官Dara Khosrowshahi表示,生成式AI将驱动未来的移动出行,而NVIDIA的助力将帮助Uber团队更快开发出安全、可扩展的自动驾驶解决方案。