具身智能,这一结合了人工智能与机器人技术的前沿领域,在2024年成为了AI赛道上的璀璨明星。其核心在于“长了身体的智能”,能够直接与物理世界进行交互,而人形机器人则被普遍认为是具身智能的最佳硬件载体。
随着具身智能的火爆,机器人公司如雨后春笋般涌现,投融资活动也异常活跃。据统计,2024年上半年,专注于具身智能机器人的公司数量已突破70家大关,其中不乏华为等大厂的加入,初创企业更是频频获得融资,估值飙升。
以Physical Intelligence、World Labs和Skild AI等为代表的企业,在短短几个月内就宣布了数亿美元的融资,估值也随之水涨船高。Physical Intelligence成立不到一年,就宣布获得4亿美元融资,估值达到24亿美元;World Labs在完成1亿美元融资后,两个月内又完成了2.3亿美元的融资;Skild AI则宣布完成3亿美元A轮融资,估值达到15亿美元。
在这场具身智能的盛宴中,创业企业如何脱颖而出,形成差异化竞争优势?具身智能背后的技术发展路径又是怎样的?带着这些问题,我们与智澄AI的创始人兼CEO胡鲁辉进行了深度交流。
“我们是一家通用人工智能公司,对标的是斯坦福李飞飞老师的公司,但我们的产品形态是具身智能机器人。”胡鲁辉表示,“我们的核心技术是理解物理世界的世界模型,这与主流的多模态大模型有着本质的区别。”
据胡鲁辉介绍,世界模型主要通过传感器直接感知外部环境信息,输入数据以实时感知的外部环境为主,而输出结果则是时间序列数据,可以直接控制机器人。相比之下,多模态大模型则是以图片、文字、视频、音频等信息交互为主,输出结果仍是以信息为主。
胡鲁辉进一步指出,世界模型是迈向通用人工智能(AGI)的必经之路。作为曾在微软、亚马逊、华为美国研究院、meta等顶尖科技巨头担任高管的行业专家,他早已意识到AI与物理世界结合的潜力,并一直在寻找合适的创业机会。
2024年初,智澄AI应运而生。胡鲁辉对公司的整体发展规划分为两部分:一是以打造世界模型为核心,持续进行技术创新和研发突破;二是实现产品落地应用。目前,智澄AI的人工智能机器人原型一(TR1)和原型二(TR2)已经相继完成。
胡鲁辉表示,智澄AI的机器人产品命名为TR,即Transforming Robot,寓意着改变机器人。从TR1到TR2,智澄AI的产品迭代速度非常快,基本上每两个月就能实现一次迭代。
然而,具身智能行业的发展也面临着诸多挑战,其中机器人的泛化能力是关键之一。胡鲁辉认为,智澄AI的泛化能力主要体现在任务泛化、环境泛化和本体泛化三个方面。只有具备这三种泛化能力,才能真正推动机器人时代的到来。
在胡鲁辉看来,当前多模态大模型技术很难突破这三种泛化能力的挑战。因此,智澄AI将打造澄灵世界模型,分阶段推进物理世界模型的发展,以实现像人一样的泛化能力。
面对算法、数据、算力等多方面的挑战,胡鲁辉表示,智澄AI将坚持以物理智能为核心技术,不断加强自身技术能力的迭代,积极拥抱行业变化。
在与胡鲁辉的交流中,我们还了解到智澄AI的产品研发及市场落地策略。胡鲁辉表示,智澄AI的战略方针是两条腿走路,一方面不断进行技术创新和研发突破,另一方面进行产品落地。
对于未来机器人的价格区间和普惠于民的问题,胡鲁辉认为价格是相对的,不同场景和需求下的机器人价格会有所不同。他强调,智澄AI的目标是推动机器人时代的到来,让机器人更好地服务于人。
在制造业中,双臂机器人已经得到了广泛应用。智澄AI的双臂机器人与上一代机器人相比,在实际应用上会有哪些明显感知的区别?胡鲁辉表示,智澄AI的机器人是基于AI原生模型,相比传统机器人控制系统有本质的变化。
传统机器人控制系统基于规则,虽然可以实现精准控制操作,但泛化能力较差,需要重新开始编程。而智澄AI的模型则类似于人脑,已经具备一定的泛化能力。这种技术和解决方案将真正推动机器人时代的到来。