滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Hugging Face新推SmolVLM多模态模型：高效能低资源新选择

时间：2025-01-27 07:56:32 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，科技界迎来了一项新的突破，Hugging Face公司于1月26日正式推出了两款精心打造的多模态模型——SmolVLM-256M与SmolVLM-500M。这两款模型是从去年训练的庞大800亿参数模型中提炼而出，成功地在性能与资源消耗之间找到了完美的平衡点。

据悉，SmolVLM-256M采用了先进的SigLIP作为图像编码技术，而更高级别的SmolVLM-500M则配备了更为强大的SmolLM2文本编码器。尤为引人注目的是，SmolVLM-256M凭借其小巧的体积，成功跻身当前最小的多模态模型之列。它不仅能够接收任意序列的图像与文本输入，还能生成丰富的文字输出，涵盖图片描述、视频字幕生成乃至PDF处理等多样化功能。

在资源占用方面，这两款模型同样展现出了极高的效率。对于移动设备而言，SmolVLM-256M仅需不到1GB的GPU显存即可完成单张图片的推理任务，这对于移动应用开发来说无疑是个巨大的福音。而对于追求更高性能的企业级应用环境，SmolVLM-500M则提供了更为精准的输出结果，尽管其资源需求稍高，仅需1.23GB的GPU显存，但其在处理复杂任务时的表现更为出色。

值得注意的是，Hugging Face此次推出的两款模型均采用了Apache 2.0开源授权，这意味着开发者可以自由地获取、修改和分发这些模型。公司还贴心地提供了基于transformer和WebGUI的示例程序，大大降低了开发者的上手难度。所有模型及其演示代码均已在公开平台上发布，方便开发者下载与使用。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

赛力斯集团携手北航，共启新兴产业产学研用新篇章！

01-27

赛力斯集团携手北航，开启校企合作新篇章！

01-27

伦敦摄政公园“白宫”易主，美国科技亿万富豪1.39亿英镑豪掷购入

01-27

张大大霸凌风波再起，直播剧本泛滥，MCN员工权益何以保障？

留几手也曾吐槽过张大大直播，称张大大签约的MCN是无忧传媒，批量流水线人工打造人设，背后有剧本，都是套路打造出来人设。据九派新闻报道，1月26日，一位无忧传媒前员工表示：无忧的张大大工作室已经换了好几波员…

01-27

冷链物流市场规模持续扩大！企查查：超四成企业成立5-10年

01-27

动保企业业绩寒冬，宠物市场成新希望？

01-27

证监会力推资本市场指数化投资高质量发展新方案

01-27

伦敦摄政公园“白宫”易主，美国科技亿万富豪1.39亿英镑豪掷购入

01-26

比尔·盖茨自传曝心声：离婚成最大遗憾，27年婚姻何以至此？

01-26

Mudra Link追踪腕带：VR新体验，手指动作精准捕捉无压力

01-26

智谱AI高层变动：两位元老离职，前Midjourney高管入局能否破局？

之所以会邀请运营侧精英加入，主要是因为智谱的ChatBot产品相比于kimi和豆包并不占优，而其也想要通过一条AI Agent的道路破局，自去年10月，智谱连续发布AutoGLM和PC端的AutoGLM，虽…

01-26

抖音副总裁李亮论短剧：精品化是方向，尊重老人娱乐选择

01-26

抖音副总裁李亮：短剧应走精品路，老年人看剧权利应尊重

他还指出短剧发展的早期，一些长剧平台错过了最初增长窗口，在用户和营收上有些压力，现在也开始做短剧。最后，关于老年人看短剧，他个人观点是，只要不是大量占用老年人户外运动时间，不沉迷、不过度消费，应该尊重他们…

01-26

浙商银行子公司浙银理财获批开业，注册资本高达20亿

01-26

欧盟完成对X平台调查，马斯克或将面临数亿欧元罚款？

01-26

点击查看更多 +

全站最新

赛力斯集团携手北航，开启校企合作新篇章！

苹果iOS 18.4四月更新：Siri更智能，Apple Intelligence将支持中文

苹果iCloud+存储方案遭吐槽：200GB至2TB跨度大，用户呼唤更灵活选择

《黑色沙漠》手游国服将停运，腾讯代理协议到期引关注

DeepSeek火爆，哪些ETF将受益或受冲击？

游戏为媒，向世界讲述中国故事！

热门内容

本栏最新

伦敦摄政公园“白宫”易主，美国科技亿万富豪1.39亿英镑豪掷购入

张大大霸凌风波再起，直播剧本泛滥，MCN员工权益何以保障？

冷链物流市场规模持续扩大！企查查：超四成企业成立5-10年

动保企业业绩寒冬，宠物市场成新希望？

证监会力推资本市场指数化投资高质量发展新方案

伦敦摄政公园“白宫”易主，美国科技亿万富豪1.39亿英镑豪掷购入

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.