滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Hugging Face发布超轻量AI视觉语言模型，2.56亿参数挑战内存极限！

时间：2025-01-24 13:15:48 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

Hugging Face平台近日宣布了一项重要进展，推出了两款专为算力受限设备设计的轻量级AI模型——SmolVLM-256M-Instruct与SmolVLM-500M-Instruct。这两款模型的发布，标志着在资源有限的环境下，AI技术的应用潜力得到了进一步拓展。

早在2024年末，Hugging Face就曾推出过一款名为SmolVLM的视觉语言模型（VLM），该模型凭借仅20亿参数的高效设计，在设备端推理领域展现出了卓越的性能，尤其是其极低的内存占用，更是成为了同类模型中的佼佼者。

而此次推出的SmolVLM-256M-Instruct，更是将参数规模压缩至了2.56亿，成为了有史以来发布的最小视觉语言模型。这款模型能够在内存低于1GB的PC上流畅运行，为用户提供出色的性能表现。对于资源受限环境下的开发者而言，这无疑是一个巨大的福音。

与此同时，SmolVLM-500M-Instruct也以其5亿参数的规模，展现了强大的数据处理能力。这款模型主要针对硬件资源受限的场景设计，旨在帮助开发者应对大规模数据分析的挑战，实现AI处理效率和可访问性的双重突破。

SmolVLM系列模型不仅参数规模小巧，更具备先进的多模态能力。无论是图像描述、短视频分析，还是回答关于PDF或科学图表的问题，这些模型都能游刃有余地完成。Hugging Face表示，SmolVLM在构建可搜索数据库方面，不仅速度更快、成本更低，其性能甚至能与规模十倍于自身的模型相媲美。

为了打造这些高效的AI模型，Hugging Face团队依赖了两个专有数据集：The Cauldron和Docmatix。The Cauldron是一个精选的高质量图像和文本数据集集合，专注于多模态学习；而Docmatix则专为文档理解而设计，通过配对扫描文件与详细标题，增强了模型的理解能力。

在模型架构方面，SmolVLM-256M-Instruct和SmolVLM-500M-Instruct采用了更小的视觉编码器SigLIP base patch-16/512，相较于SmolVLM 2B中使用的SigLIP 400M SO，这一优化减少了冗余，提高了模型处理复杂数据的能力。这两款模型还能够以每个标记4096像素的速率对图像进行编码，相较于早期版本的每标记1820像素，有了显著的性能提升。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

中国稀土出口管制下，西数微软联手探索废旧硬盘稀土回收新路径

04-18

TikTok掀“中国工厂热”，阿里国际站霸榜全球120国电商APP下载榜！

04-18

关税波动下的坚实后盾：中国石化长城润滑油如何护航产业安全？

04-18

金士顿FURY Renegade G5 SSD发布：首款消费级PCIe 5.0，顺序读写破14GB/s

04-18

美企联手启动机械硬盘稀土回收，助力环保与供应链强化

04-18

马航考虑引进中国商用飞机，C909与C919成潜在选项！

04-18

海外社媒营销新挑战：流量昂贵下如何高效“种草”？

04-18

京东外卖全职骑手新亮相，工服上直接标注“全职员工”身份

近日有网友在街头发现，京东外卖的骑手身穿工服，衣服上还戴了标牌，标注“全职员工”四个字，且有员工编号。…

04-18

网红“猫一杯”服务合同纠纷开庭，其公司杭州瑟曼被指下落不明

网红“猫一杯”（本名徐某艺）及其背后的杭州瑟曼网络科技有限公司，因服务合同纠纷被上海黑芒营销策划有限公司起诉，案件于4月18日在杭州市滨江区人民法院开庭。据人民法院公告网刊登的公告显示，杭州市滨江区人民法院…

04-18

徐里里微博遭禁言15天，因何与小米公关部总经理起争执？

博主万能的大熊透露，“徐里里老师已经被禁言了，我就劝他胳膊拗不过大腿，他非要试试……傻了吧……”还贴出了禁言15天的截图。在评论区中有网友表示“截图哪儿来的，微信发你的？”博主表示了肯定。此前，徐里里和…

04-18

祁连山自驾盛宴，4月18日“北驾祁连·9号公路”百车启航！

04-18

动力电池安全新国标出台，王倩谈如何为绿色出行加码安全保障？

04-18

王一博遭造谣者晗晗qvq面临执行难，黑粉已无偿还能力？

04-18

小镇青年返乡创业，拼多多驿站成人生转折点

04-18

云南云能红河电厂：700兆瓦超超临界循环流化床锅炉成功投运！

04-18

点击查看更多 +

全站最新

京东外卖全攻略：怎么下单、点餐省钱与优惠券领取技巧

2025湖北国补倒计时！家电数码汽车补贴最高可达万元，抓紧上车！

LG电子6月底全面停止手机软件升级，手机业务彻底告别

吉利博越L新车4月22日预售，搭载Flyme Auto智能座舱系统亮相

金士顿FURY Renegade G5 SSD发布：首款消费级PCIe 5.0，顺序读写破14GB/s

英特尔发布具身智能方案：酷睿Ultra处理器引领大小脑融合新时代

热门内容

本栏最新

金士顿FURY Renegade G5 SSD发布：首款消费级PCIe 5.0，顺序读写破14GB/s

美企联手启动机械硬盘稀土回收，助力环保与供应链强化

京东外卖全职骑手新亮相，工服上直接标注“全职员工”身份

网红“猫一杯”服务合同纠纷开庭，其公司杭州瑟曼被指下落不明

徐里里微博遭禁言15天，因何与小米公关部总经理起争执？

祁连山自驾盛宴，4月18日“北驾祁连·9号公路”百车启航！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.