滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

阿里云万相2.1视频大模型开源，8.2GB显存轻松驾驭，性能超越Sora等竞品

时间：2025-02-25 23:16:40 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

阿里云近日宣布了一项重大举措，正式开源其视觉生成基座模型——万相2.1（Wan）。此次开源行动采用了极为宽松的Apache2.0协议，意味着全球开发者将能够无限制地访问和使用这一前沿技术。

万相2.1模型包含14B和1.3B两种参数规格，阿里云不仅开放了全部推理代码，还提供了相应的权重文件。这一举措极大地方便了开发者进行文生视频和图生视频等任务的探索。开发者可以在Github、HuggingFace和魔搭社区等多个平台上轻松下载并体验这一模型。

据悉，14B参数的万相模型在指令遵循、复杂运动生成、物理建模以及文字视频生成等多个领域均展现出了卓越的性能。在评测集VBench中，万相2.1以86.22%的总分力压群雄，包括Sora、Luma、Pika等国内外知名模型，成功登顶。而1.3B版本的测试结果同样令人瞩目，它不仅超越了更大尺寸的开源模型，还逼近了部分闭源模型的表现。尤为该版本能够在消费级显卡上流畅运行，仅需8.2GB显存即可生成480P视频，这对于二次模型开发和学术研究来说无疑是一个巨大的福音。

万相视频模型采用了先进的DiT架构和线性噪声轨迹Flow Matching范式，并在此基础上研发了高效的因果3D VAE和可扩展的预训练策略等创新技术。特别是在3D VAE方面，万相团队通过实现特征缓存机制，成功支持了任意长度视频的编码和解码，实现了对无限长1080P视频的高效处理。通过将空间降采样压缩提前，万相模型在不损失性能的前提下，进一步减少了29%的推理时内存占用，从而提升了整体运行效率。

在多个维度的测试中，万相模型均展现出了业界领先的表现。特别是在运动质量、视觉质量、风格和多目标等14个主要维度以及26个子维度的测试中，万相模型斩获了5项第一，充分证明了其强大的技术实力和广泛的应用潜力。

对于想要深入了解和使用万相模型的开发者来说，以下是一些开源地址的链接：

Github：https://github.com/Wan-Video

HuggingFace：https://huggingface.co/Wan-AI

魔搭社区：https://modelscope.cn/organization/Wan-AI

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

华为MWC 2025将展5G-A与AI深度融合新方案，引领AI-Centric网络时代

02-25

量化私募抢滩AI，人才大战正酣，本土机构能否撑起科技投资半边天？

02-25

智元机器人发布AgiBot Digital World，仿真框架与海量数据助力具身智能发展

通过高保真地模拟训练场景，全链自动化地生成数据，AgiBot DigitalWorld可以实现一系列的具身仿真服务，比如惟妙惟肖地模拟各种机器人训练场景等。 AgiBot Digital World的三维资…

02-25

上海新能源黑马：思格新能源三年登顶全球第一，年收入破7亿！

02-25

嘉强智能获数亿融资，领跑千亿激光智能装备赛道

02-25

AI新浪潮：产业资本如何重塑中国新故事？

02-25

智元机器人发布AgiBot Digital World，仿真框架与海量数据助力具身智能开发

通过高保真地模拟训练场景，全链自动化地生成数据，AgiBot DigitalWorld可以实现一系列的具身仿真服务，比如惟妙惟肖地模拟各种机器人训练场景等。 AgiBot Digital World的三维资…

02-25

联想新品G5&V4系列服务器携手英特尔至强6，共启AI算力新篇章！

02-25

智元机器人发布AgiBot Digital World，仿真框架与海量数据助力机器人技能提升

通过高保真地模拟训练场景，全链自动化地生成数据，AgiBot DigitalWorld可以实现一系列的具身仿真服务，比如惟妙惟肖地模拟各种机器人训练场景等。 AgiBot Digital World的三维资…

02-25

英伟达GTC 2025 China AI Day来袭，字节、阿里等巨头共话AI前沿

02-25

DeepSeek R2模型加速面世，或提前至5月前，能否引领AI新潮流？

02-25

百度YY直播收购案终落地，李学凌妥协少赚15亿美元

02-25

智元机器人推大型仿真框架AgiBot，机器人操作仿真数据海量开源

通过高保真地模拟训练场景，全链自动化地生成数据，AgiBot DigitalWorld可以实现一系列的具身仿真服务，比如惟妙惟肖地模拟各种机器人训练场景等。 AgiBot Digital World的三维资…

02-25

百度21亿收购YY直播，16亿资金将全力助推AI发展

三言科技消息百度2月25日宣布与欢聚时代达成协议，拟收购后者此前在中国大陆拥有的视频娱乐直播业务（即YY直播）收购总价约为21亿美元。作为交易的一部分，百度之前根据股权收购协议存入托管账户的约16亿美元已全…

02-25

微软调整数据中心布局，DeepSeek低成本AI引发开支策略思考？

TD Cowen的分析师还称，他们的渠道调查还发现了一些迹象，表明微软正在逐步退出数据中心建设和收购——他们了解到，微软已经让超过1千兆瓦的大型站点意向协议过期，并放弃了“多个”协议，每个协议涉及约100兆…

02-25

点击查看更多 +

全站最新

固态电池来袭！2027年或上车，2030年量产化不是梦？

何小鹏：小鹏高阶智驾全球推广，基础硬件标配软件免费是关键

起亚EV4量产版前瞻，跨界轿跑+电子换档，能否重现燃油车驾驶快感？

美规小改款欧蓝德上市，2.5L燃油引擎+7座配置，内饰科技感升级！

三阳豪华双缸“灵龟”踏板登陆台湾，7.4万人民币能否成为新宠？

本田ADV350即将震撼登场，发布会亮点抢先看！

热门内容

本栏最新

华为MWC 2025将展5G-A与AI深度融合新方案，引领AI-Centric网络时代

量化私募抢滩AI，人才大战正酣，本土机构能否撑起科技投资半边天？

智元机器人发布AgiBot Digital World，仿真框架与海量数据助力具身智能发展

嘉强智能获数亿融资，领跑千亿激光智能装备赛道

AI新浪潮：产业资本如何重塑中国新故事？

智元机器人发布AgiBot Digital World，仿真框架与海量数据助力具身智能开发

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.