滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

微软开源OmniParser，GPT-4V秒解析屏幕截图，智能新突破！

时间：2024-10-29 10:38:55 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR】微软近日宣布了一项重大开源项目——OmniParser，这是一款专为解析和识别屏幕上可交互图标设计的AI工具。传统自动化方法受限于HTML或视图层次结构，而现有的视觉语言模型在处理复杂GUI元素时又显得力不从心。为此，微软推出了这款纯视觉基础的工具，旨在解决当前屏幕解析技术的局限性。

OmniParser结合了可交互区域检测模型、图标描述模型和OCR模块，无需依赖HTML标签或视图层次结构等显式基础数据。这一特性使得它能够在桌面、移动设备和网页等多种平台上跨平台工作，显著提高了用户界面的解析准确性。OmniParser还能将识别出的屏幕元素转换成结构化的数据。

在实际测试中，OmniParser展现出了卓越的性能。在ScreenSpot数据集中，它的准确率提高了73%，远超依赖HTML解析的模型。同时，当GPT-4V使用OmniParser的输出后，图标的正确标记率从70.5%提升至93.8%。这些改进充分证明了OmniParser在解决当前GUI交互模型根本缺陷方面的有效性。

微软已在Hugging Face上发布了OmniParser，这一举措将有助于普及这一前沿技术，进一步推动多模态AI的发展，特别是在无障碍、自动化和智能用户辅助等领域。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

家庭能源智联自由海辰储能发布首套免安装家庭微网系统HeroES

当前，全球家庭储能市场持续快速发展。据了解，2024年全球家庭储能累计总装机量将达15GWh，预计到2030年将会升至200GWh。在高速发展的同时，家庭储能市场也面临着费用高、安装慢、扩展难、不智能等痛点。面对这些迫切需要解决的难题，12月12日，在主题为“能源自由·新

12-23

数禾科技2024年回顾：徐志刚价值观引领，稳步前行显实力

12-23

“OpenRice”原生鸿蒙版上线，港澳美食探索更流畅便捷！

12-23

2024-2025消费趋势大揭秘：从理性到个性，中国市场的未来在哪？

12-23

KOCOTREE：婴童服饰新标杆，原纱耐水洗千次实验首创者获权威认证

12-23

UC网盘测速大战启幕：超800博主争夺百大测速官席位

12-23

美团听障骑手关怀升级，全国覆盖：在线语音转文字沟通无障碍

12-23

钉钉携手海亮科技，共绘数智化教育新蓝图

12-23

网御星云与南昌高新区共筑密码信创产业安全生态高地

12-23

中国芯片产能崛起！全球半数12寸晶圆厂已落户大陆

12-23

抖音防诈新招：“验证助手”上线，助力用户精准识别官方信息

12-23

咕咚上榜！2024胡润全球猎豹企业榜运动健康领域新星闪耀

12-23

GG100年度大奖揭晓，vivo S20 Pro多巴胺动态照片功能引领创新潮流！

12-23

2024年度GG100大奖揭晓，兄弟DCP-T536DW彩喷一体机成家庭打印优选！

12-23

12月第3周百度App短剧热度揭晓：《城南花正开》领跑榜单

12-23

点击查看更多 +

全站最新

蔚来萤火虫大灯设计引热议，李斌：与iPhone三摄无关

GMCC美芝电子膨胀阀：以创新科技，引领行业高效静音新时代

鸿蒙2024年度榜单揭晓：原生应用如何重塑高品质数字生活？

“OpenRice”原生鸿蒙版上线，港澳美食探索更流畅便捷！

2024-2025消费趋势大揭秘：从理性到个性，中国市场的未来在哪？

KOCOTREE：婴童服饰新标杆，原纱耐水洗千次实验首创者获权威认证

热门内容

本栏最新

“OpenRice”原生鸿蒙版上线，港澳美食探索更流畅便捷！

2024-2025消费趋势大揭秘：从理性到个性，中国市场的未来在哪？

KOCOTREE：婴童服饰新标杆，原纱耐水洗千次实验首创者获权威认证

UC网盘测速大战启幕：超800博主争夺百大测速官席位

钉钉携手海亮科技，共绘数智化教育新蓝图

网御星云与南昌高新区共筑密码信创产业安全生态高地

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.