滚动资讯

当前位置：首页 > 资讯 > 手机快报 > 正文内容

腾讯混元新突破：图生视频模型发布并开源，一键生成动感短片

时间：2025-03-06 17:02:13 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

腾讯混元近期在其官方微信公众号上宣布了一项重大进展，推出了图生视频模型，并向公众开放源代码。这一创新技术不仅为用户带来了对口型与动作驱动等趣味玩法，还实现了背景音效的自动生成以及2K高清视频的轻松制作。

借助图生视频模型，用户只需上传一张静态图片，并简单描述期望的画面动态效果和镜头运动轨迹，混元便能根据指令将图片转化为一段生动的5秒短视频，并自动匹配合适的背景音效。更有趣的是，用户上传人物图片并输入希望“对口型”的文字或音频后，图片中的人物竟能“开口说话”或“欢快歌唱”。利用“动作驱动”功能，用户还能一键生成与他人同款的跳舞视频。

体验这一前沿技术的渠道十分便捷，用户只需访问混元AI视频官网即可开始创作。而对于企业和开发者而言，他们可以在腾讯云平台上申请API接口，将这一技术融入自己的产品或服务中。

此次开源的图生视频模型，是腾讯混元在文生视频模型开源基础上的又一力作。该模型的总参数量高达130亿，广泛应用于写实视频、动漫角色以及CGI角色等多种场景的视频生成。开源内容涵盖了模型权重、推理代码以及LoRA训练代码，支持开发者基于混元训练专属的LoRA等衍生模型。目前，这一模型已在Github、HuggingFace等主流开发者社区上线，供开发者下载并体验。

据混元开源技术报告显示，其视频生成模型展现出极高的灵活性和扩展性。图生视频和文生视频在相同数据集上进行预训练，模型在保持超写实画质、流畅演绎大幅度动作以及原生镜头切换等特性的同时，还能捕捉到丰富的视觉和语义信息。结合图像、文本、音频和姿态等多种输入条件，模型实现了对生成视频的多维度精准控制。

截至目前，腾讯混元的开源系列模型已全面覆盖文本、图像、视频和3D生成等多个领域，在Github平台上累计吸引了超过2.3万名开发者的关注和点赞。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

REDMI K80系列百日销量破360万，高通祝贺，王腾携团队共庆佳绩

03-06

千元投影新王者，大眼橙C2 Ultra性能全解析！

03-06

五大国产手机品牌年中推迭代新机，性能升级，全员大电池设计来袭！

03-06

iOS 19升级清单出炉，你的iPhone XR还能跟上节奏吗？

03-06

小米MIX 5或采用外挂镜头技术，未来感量产新机即将来袭？

03-06

MWC 2025智能手机新潮流：传音领跑，五款奇特新机闪耀登场

03-06

小米REDMI Note 14S曝光：4G配置搭载Helio G99 Ultra芯片，影像升级

03-06

鸿蒙版微信正式入驻华为MatePad平板，手机平板同登还会远吗？

03-06

苹果申请注册“视控ID”商标，或为Vision Pro设备新增虹膜识别技术

03-06

小米15 Ultra斩获MWC大奖

在近期于巴塞罗那举行的MWC 2025（世界移动通信大会）盛会上，小米集团迎来了一个振奋人心的时刻。其最新旗舰产品小米15 Ultra凭借其卓越的创新力与高端定位，成功摘得了由大会主办方GSMA颁发的“Best in Show”最佳产品大奖。小米集团总裁卢伟冰亲自上台，从GSMA手中接过了这份沉甸甸的荣誉。

03-06

紫光飞腾腾锐D3000台式机实测：国产PC性能如何？

03-06

iPad 11内存升级至6GB，遗憾未达8GB，且不支持苹果智能功能

03-06

苹果布局未来：视控ID商标申请，生物识别技术再升级？

03-06

苹果折叠iPhone曝光：2026年底或面世，售价或超2000美元！

03-06

2025年Minecraft Live即将启幕，新游戏内容及电影片段抢先看！

03-06

点击查看更多 +

全站最新

问界M9/M8预售开启，国产豪华SUV新势力挑战理想L系列地位！

MWC 2025盛况：AI引领手机与运营商革新，硬件创新故事再升级

1月运动户外品牌热度排行：谁引领了新潮流？

REDMI K80系列百日销量破360万，高通祝贺，王腾携团队共庆佳绩

大众ID.Every1概念车亮相，廉价小车新选择，能否进军中国市场？

做自己的女明星，绿源 LOOPY 联名骑行搭子给你无限力量

热门内容

本栏最新

千元投影新王者，大眼橙C2 Ultra性能全解析！

MWC 2025智能手机新潮流：传音领跑，五款奇特新机闪耀登场

小米REDMI Note 14S曝光：4G配置搭载Helio G99 Ultra芯片，影像升级

紫光飞腾腾锐D3000台式机实测：国产PC性能如何？

苹果布局未来：视控ID商标申请，生物识别技术再升级？

苹果折叠iPhone曝光：2026年底或面世，售价或超2000美元！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.