滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

北大清华等联合发布LLaVA-o1：革新视觉AI，引领推理计算新风尚

时间：2024-11-19 13:19:47 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR】近期，一个由国内外顶尖学府及科技企业组成的科研团队宣布了一项重要突破：他们成功研发出名为LLaVA-o1的视觉语言模型，该模型以其独特的自发性多阶段推理能力，在人工智能领域引发了广泛关注。

LLaVA-o1作为一种创新的视觉语言模型（VLM），其核心设计旨在实现自主且高效的多阶段推理过程。这一模型不仅拥有高达110亿个参数，更基于先进的Llama-3.2-Vision-Instruct模型进行了深度开发，从而确保了其在处理复杂视觉与语言信息时的强大能力。

在推理过程中，LLaVA-o1采用了创新的阶段级束搜索技术。这一技术能够在每个推理阶段生成多个候选答案，并通过智能筛选机制，从中选取最佳答案。这一特性使得LLaVA-o1在处理复杂任务时，能够展现出超越传统视觉语言模型的卓越能力。

据研究团队介绍，LLaVA-o1在多模态推理基准测试中，相较于基础模型，性能提升了8.9%，这一成绩不仅超越了众多大型和闭源的竞争对手，更在复杂视觉问答任务中突破了传统模型的局限性。

LLaVA-o1的推出，不仅填补了文本和视觉问答模型之间的空白，更在多个基准测试中取得了优异表现。特别是在数学和科学视觉问题的推理领域，该模型展现出了结构化推理在视觉语言模型中的重要性。这一成果不仅为人工智能领域带来了新的突破，更为未来智能系统的设计和开发提供了宝贵的经验和启示。

值得注意的是，LLaVA-o1所展现的自发性推理能力，正是自发性人工智能（Spontaneous AI）研究的核心目标之一。这一领域的研究旨在通过机器学习和复杂时间模式的设计，赋予机器人或智能系统以类似动物的自发行为能力。LLaVA-o1的成功研发，无疑为自发性人工智能的研究注入了新的活力和动力。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

12-19

天阳科技与SS&C携手，亿元打造Algorithmics软件独家信创版

12-19

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

12-19

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

12-19

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

12-19

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

12-19

闪极AI拍拍镜震撼上市！国内首款量产，售价仅999元起

12-19

苹果中国AI大模型合作引关注，字节腾讯谁将脱颖而出？

值得一题的是，12月19日，北京智源人工智能研究院（智院研究员）发布国内外100余个开源和商业闭源模型多份评测结果，作为今年英伟达全球第二大买家、拥有23万张GPU的字节跳动豆包大模型名列前茅，语言模型结果…

12-19

张一鸣私募新动作，重心已悄然转向大模型与AI战略？

12-19

算力硬件引领市场热潮，豆包概念股能否持续走强？

12-19

市场分化算力硬件爆发，抖音微信小店概念股活跃，后市如何演绎？

12-19

北证50深V反转，AI硬件与微信小店成市场新宠？

12-19

OpenAI Canvas大升级：React渲染与文本格式化新工具来袭

12-19

OpenAI新招！ChatGPT热线电话服务上线，老年机座机也能聊

12-19

AMD苏姿丰领投，Liquid AI崛起：机器人之母带队，AI赛道再掀狂澜

12-19

点击查看更多 +

全站最新

“王妃”炫富带货后集体消失，网友直呼：别再消耗我们的善良！

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

打假人王海遭品牌起诉，道歉后又要反诉，这场“打假”战何时休？

余承东透露：鸿蒙智行受车厂热捧，资源有限难以满足所有合作需求

余承东回忆：与北汽合作始于2017年一张PPT开启华为汽车梦

荣耀Magic7 RSR保时捷设计：100倍AI长焦，样张细节震撼曝光！

热门内容

本栏最新

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

天阳科技与SS&C携手，亿元打造Algorithmics软件独家信创版

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.