滚动资讯

当前位置：首页 > 资讯 > 数字家电 > 正文内容

微软OmniParser V2.0：让AI模型秒变电脑操控高手，已开源

时间：2025-02-17 10:15:03 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

微软近期在人工智能领域再次迈出重要一步，推出了OmniParser V2.0，这是一款基于纯视觉技术的GUI智能体解析工具，能够精准识别并解析屏幕上的可交互图标。此前，该工具与GPT-4V的结合已显著提升了其识别能力。

在2月12日，微软官方网站上正式发布了OmniParser的最新版本。这一版本不仅延续了前代产品的优势，还实现了与多个先进AI模型的兼容，包括OpenAI的多个版本（4o、o1、o3-mini）、DeepSeek R1、Qwen 2.5VL以及Anthropic的Sonnet等。这意味着这些模型在OmniParser的助力下，能够转变为操控计算机的AI智能体。

相较于V1版本，OmniParser V2.0在训练数据上进行了大幅升级，采用了更大规模的交互元素检测数据和图标功能标题数据。这一改进使得V2.0在检测较小的可交互UI元素时，准确率有了显著提升，同时推理速度也更快，延迟降低了60%。

在高分辨率Agent基准测试ScreenSpot Pro中，OmniParser V2.0与GPT-4o的结合展现出了惊人的效果。测试结果显示，V2.0+GPT-4o的准确率高达39.6%，而GPT-4o单独使用时，准确率仅为0.8%。这一对比充分展示了OmniParser V2.0在提升AI模型性能方面的巨大潜力。

为了加速不同智能体设置的实验进程，微软还推出了OmniTool这一开源工具。OmniTool是一个集成了屏幕理解、定位、动作规划和执行等基本功能的Docker化Windows系统。这一工具为将大模型转变为智能体提供了关键支持，极大地简化了实验过程。

对于对OmniParser和OmniTool感兴趣的开发者而言，微软已经提供了开源地址，方便他们获取并使用这些工具，以进一步推动人工智能技术的发展。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

《甄嬛传》导演郑晓龙：微短剧需注重内容深度，避免误导观众

02-20

从切歌到循环：你的音乐习惯如何“出卖”了你的年龄？

在这简单的操作背后，流媒体平台一直在实时追踪你的每一次切歌动作，记录曲目中断的节点，分析你完整听完的歌曲类型，同时结合你的年龄等信息，持续勾勒出专属的用户画像。此外，中老年用户在工作、家务、助眠等场景中听到不…

02-20

电竞酒店热浪来袭：Z世代如何“玩”转新社交？

杭州则以47.62%的增长率位居增长榜首，这可能与杭州在电竞文化和相关赛事中的活跃表现有关。“包下电竞房，和兄弟连打48小时”的故事，在社交平台上并不少见。电竞酒店也在积极寻求与赛事合作，以提升品牌影…

02-20

董明珠透露：格力接班人已有预备人选，管理严格营造务实氛围

02-20

锐界L混动版新手上路，高速与市区油耗大不同？求教省油妙招！

02-20

荣耀MagicBook Pro 14新品发布会：性能狂飙，AI战略将有何新动作？

02-20

安卓16 Beta 2大升级：键盘快捷键，由你做主！

02-20

苹果iPhone 16e发布：告别Home键，国补立减500元来袭！

02-20

爱奇艺龚宇痛批红果短剧：滥用市场地位签排他协议阻碍行业发展

02-20

索尼PS午夜黑系列新品上线，DualSense Edge控制器售1599元

02-20

吉电股份注册资本增至36.3亿元

企查查APP显示，近日，吉电股份（000875）发生工商变更，注册资本由约27.9亿人民币增至约36.3亿人民币。企查查信息显示，该公司成立于1997年，法定代表人为杨玉峰，经营范围包括火电、水电、新能源的开…

02-20

董明珠自曝：非格力空调餐厅不去，销售霸气侧漏！

三言科技消息在《酌见》栏目中，新东方董事长俞敏洪与格力电器董事长董明珠对谈，涉及接班人、婚姻、工作、孩子等话题。董明珠还谈及了自己的销售能力，有一次去饭店吃饭，所有的房间都装了格力，就一个房间没装，被安排…

02-20

龚宇呼吁：微短剧平台应公平竞争，勿滥用市场地位抑制行业发展

三言科技消息在今天举行的首届中国电视剧制作产业大会上，爱奇艺CEO龚宇提出了影视行业“以观众为中心创作”的六个关键趋势和保护行业健康发展、杜绝微短剧领域大平台滥用市场支配地位的呼吁。龚宇认为，对影视行业而…

02-20

大模型部署新突破：无问芯穹一体机将成本降至工作站级，性能却不打折！

02-20

董明珠透露：格力已有接班人预备人选，三四位年轻力量正试炼中

02-20

点击查看更多 +

全站最新

《甄嬛传》导演郑晓龙：微短剧需注重内容深度，避免误导观众

沃尔沃ES90电动轿车即将亮相：双Orin平台加持，技术共享EX90

荣耀Magic6系列新升级：双击熄屏、车联巡航等功能来袭！

江波龙发布史上最薄ePOP4x，0.6mm厚度集成eMMC与LPDDR4x

奔驰2024财年稳健前行，息税前利润达136亿欧元，未来产品攻势蓄势待发

华为江淮联手，尊界S800技术发布会亮点纷呈，百万定价能否打破认知壁垒？

热门内容

本栏最新

《甄嬛传》导演郑晓龙：微短剧需注重内容深度，避免误导观众

从切歌到循环：你的音乐习惯如何“出卖”了你的年龄？

董明珠透露：格力接班人已有预备人选，管理严格营造务实氛围

锐界L混动版新手上路，高速与市区油耗大不同？求教省油妙招！

荣耀MagicBook Pro 14新品发布会：性能狂飙，AI战略将有何新动作？

安卓16 Beta 2大升级：键盘快捷键，由你做主！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.