滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

微软推出42亿参数新AI模型Phi-3-vision，主打视觉理解

时间：2024-05-26 08:39:49 来源：ITBEAR编辑：茹茹 发表评论无障碍通道

【ITBEAR科技资讯】5月26日消息，微软最近推出了其小语言AI模型家族(SLM)的全新成员——“Phi-3-vision”。此款模型以“视觉能力”为主打特色，不仅能理解图文内容，还被誉为能在移动平台上实现流畅高效的运行。

Phi-3-vision模型，作为微软Phi-3系列的首款多模态模型，其文字理解能力源于Phi-3-mini，并继承了其轻量化特性，非常适合在移动设备或嵌入式系统中运行。该模型拥有42亿的参数量，这一数字超过了Phi-3-mini的3.8亿，但低于Phi-3-small的70亿。其上下文长度达到了128k token，训练周期从2024年2月持续至4月。

据ITBEAR科技资讯了解，Phi-3-vision模型的最大亮点在于其“图文识别能力”。它不仅能够理解现实世界中图片的含义，还能迅速识别和提取图片中的文字信息。微软表示，这款模型在办公场合中表现出色，特别是在识别和理解图表及方块图方面有着出色的能力。它可以根据用户输入的信息进行推理，并为企业提供有价值的战略建议，其效果甚至可与大型模型相媲美。

在模型训练方面，微软强调Phi-3-vision是通过多种类型的图片和文字数据进行训练的，这些数据来源于一系列经过严格筛选的公开内容，如教育材料、代码、图文标注数据等，从而确保了模型能够处理多样化的输入。同时，微软也注重用户隐私的保护，在训练数据中严格排除了任何个人信息。

性能方面，微软提供了Phi-3-vision与其他竞品模型如字节跳动的Llama3-Llava-Next(8B)、微软研究院与其他机构合作的LlaVA-1.6(7B)以及阿里巴巴的通义千问QWEN-VL-Chat等模型的对比图表。结果显示，Phi-3-vision在多个测试项目中均表现出色。

目前，微软已经将Phi-3-vision模型上传至Hugging Face平台。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

AMD GPU大飞跃！Stable Diffusion模型性能提升最高达3.8倍

04-18

芯明慕尼黑电子展大放异彩：空间智能如何重塑人形机器人未来？

04-18

智谱连发三款开源模型，豪掷3亿支持全球AI开源社区，加速生态建设

智东西4月18日报道，今天，智谱总裁王绍兰向智东西等媒体详细介绍了智谱开源模型的最新进展，并宣布智谱Z基金出资3亿元，以支持全球范围内的AI开源社区发展，任何基于开源模型（不局限于智谱开源模型）的创业项目均…

04-18

点击查看更多 +

全站最新

手机影像新突破？OPPO Find X9系列摄影师版或搭载外置镜头

小米15S Pro来袭！3000元内平板怎么选？大学生该换游戏本还是办公本？

极越07旅行版硬模曝光，简约流畅侧面设计引热议

华为Vision智慧屏5：鸿蒙AI引领，智能电视新体验开启

苹果Vision Pro二代展望：性能飞跃，价格更接地气？

台积电2025年Q1财报亮眼：营收超预期，净利润大涨六成！

热门内容

本栏最新

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

AI造游戏，路还长吗？

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.