滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Hugging Face新推SmolVLM AI模型，20亿参数助力设备端高效推理

时间：2024-11-27 14:18:04 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

Hugging Face平台近期在科技界掀起波澜，发布了一款名为SmolVLM的AI视觉语言模型（VLM），这款模型以其精简的20亿参数设计，专为设备端推理打造，凭借超低的内存占用，在众多同类模型中独树一帜。

SmolVLM AI模型的核心优势在于其小巧的体积、惊人的处理速度以及高效的内存利用。更重要的是，该模型完全开源，所有相关的模型检查点、VLM数据集、训练配方和工具，均在Apache 2.0许可证下向公众开放。

SmolVLM提供了三个版本以满足不同需求：SmolVLM-Base，适用于下游任务的微调；SmolVLM-Synthetic，基于合成数据进行微调；以及SmolVLM-Instruct，这是一个指令微调版本，可直接应用于交互式应用中。

该模型在架构设计上的巧妙之处，是其借鉴了Idefics3的理念，并采用了SmolLM2 1.7B作为语言主干。通过创新的像素混洗策略，SmolVLM将视觉信息的压缩率提升了9倍，从而实现了更高效的视觉信息处理。

在训练数据集方面，SmolVLM涵盖了Cauldron和Docmatix，并对SmolLM2进行了上下文扩展，使其能够处理更长的文本序列和多张图像。这一优化不仅提升了模型的性能，还有效降低了内存占用，解决了大型模型在普通设备上运行缓慢甚至无法运行的问题。

在内存使用方面，SmolVLM展现出了卓越的能力。它将384x384像素的图像块编码为81个tokens，这意味着在相同的测试图片下，SmolVLM仅需使用1200个tokens，而相比之下，Qwen2-VL则需要1.6万个tokens。这一显著的内存节省，使得SmolVLM在设备端推理上更具优势。

在性能表现上，SmolVLM同样令人瞩目。它在多个基准测试中，如MMMU、MathVista、MMStar、DocVQA和TextVQA等，均展现出了出色的处理能力。与Qwen2-VL相比，SmolVLM在预填充吞吐量上快了3.3到4.5倍，而在生成吞吐量上更是快了7.5到16倍。

这款创新模型的发布，无疑为AI视觉语言模型领域带来了新的活力和可能性。随着SmolVLM的广泛应用和深入发展，我们有理由期待它在未来能够发挥更大的作用，为人工智能技术的发展贡献更多的力量。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

12-19

天阳科技与SS&C携手，亿元打造Algorithmics软件独家信创版

12-19

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

12-19

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

12-19

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

12-19

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

12-19

闪极AI拍拍镜震撼上市！国内首款量产，售价仅999元起

12-19

苹果中国AI大模型合作引关注，字节腾讯谁将脱颖而出？

值得一题的是，12月19日，北京智源人工智能研究院（智院研究员）发布国内外100余个开源和商业闭源模型多份评测结果，作为今年英伟达全球第二大买家、拥有23万张GPU的字节跳动豆包大模型名列前茅，语言模型结果…

12-19

张一鸣私募新动作，重心已悄然转向大模型与AI战略？

12-19

算力硬件引领市场热潮，豆包概念股能否持续走强？

12-19

市场分化算力硬件爆发，抖音微信小店概念股活跃，后市如何演绎？

12-19

北证50深V反转，AI硬件与微信小店成市场新宠？

12-19

OpenAI Canvas大升级：React渲染与文本格式化新工具来袭

12-19

OpenAI新招！ChatGPT热线电话服务上线，老年机座机也能聊

12-19

AMD苏姿丰领投，Liquid AI崛起：机器人之母带队，AI赛道再掀狂澜

12-19

点击查看更多 +

全站最新

“王妃”炫富带货后集体消失，网友直呼：别再消耗我们的善良！

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

打假人王海遭品牌起诉，道歉后又要反诉，这场“打假”战何时休？

余承东透露：鸿蒙智行受车厂热捧，资源有限难以满足所有合作需求

余承东回忆：与北汽合作始于2017年一张PPT开启华为汽车梦

荣耀Magic7 RSR保时捷设计：100倍AI长焦，样张细节震撼曝光！

热门内容

本栏最新

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

天阳科技与SS&C携手，亿元打造Algorithmics软件独家信创版

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.