滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

腾讯混元图生视频模型开源，语音播报新功能即将上线

时间：2025-03-07 07:57:19 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近期，腾讯元宝官方在微博上积极回应了用户的反馈，透露了即将上线的新功能——语音播报的暂停与续播能力。这一举措显示了腾讯元宝对用户需求的快速响应和改进决心。

与此同时，腾讯混元在科技领域也取得了新的突破。在3月6日，腾讯混元正式推出了图生视频模型，并宣布该模型将对外开源。伴随着这一消息的发布，对口型与动作驱动等新颖玩法也随之上线，用户甚至可以生成背景音效及2K高质量视频。

据详细介绍，图生视频模型的能力令人瞩目。用户只需上传一张图片，并简要描述画面如何运动、镜头如何调度等创意想法，腾讯混元即可根据这些指令，将静态图片转化为生动有趣的5秒短视频。更令人惊喜的是，这一过程还能自动匹配并添加背景音效，使得视频更加完整和吸引人。

不仅如此，图生视频模型还支持对口型和动作驱动功能。用户只需上传一张人物图片，并输入想要让图片中人物“说”或“唱”的文字或音频，图片中的人物就能仿佛被赋予了生命，开始“说话”或“唱歌”。而通过动作驱动功能，用户甚至可以一键生成与指定舞蹈动作相匹配的跳舞视频，为创作带来了更多可能。

目前，广大用户已经可以通过混元AI视频官网亲身体验这一创新技术。同时，企业和开发者也有机会在腾讯云平台上申请使用API接口，将图生视频模型集成到自己的产品或服务中，进一步拓展其应用场景和商业价值。

腾讯混元方面表示，此次开源的图生视频模型是其文生视频模型开源工作的进一步延续。该模型的总参数量达到了130亿，适用于多种类型的角色和场景，无论是写实视频制作、动漫角色生成，还是CGI角色制作，都能展现出出色的表现力和实用性。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

《雄狮少年》官方严正声明：维权行动开始，网络侵权者速删虚假信息！

03-09

网易数智否认全面关停公有云，仅蜂巢模块服务调整引关注

03-09

网易数智回应公有云关闭：仅蜂巢模块受影响，其他业务正常运行

03-09

Windows 11电池图标大变身！7种新样式，一次全掌握

03-09

联掌门户上市一周市值飙升，但业务支撑力存疑

03-09

大疆“9点下班令”：严禁过度加班，员工健康成首要考量？

03-09

这个链接可能存在安全风险，为了保护您的设备和数据安全，请避免访问此链接。

03-09

AMD RX 9050显卡曝光，入门级市场或将迎来新选择？

03-09

台积电工艺进化揭秘：4nm、3NP芯片竟由生产线工人精心打造

03-09

3月8日快手短剧热度揭晓：《隔壁姐姐是我的乒乓球教练》登顶日榜

03-09

3月9日品牌短剧热度如何？《我给自己发Offer》是否蝉联榜首？

03-09

3月8日短剧星图热度揭晓：《惊鸿一笑惹天娇》登顶榜首

03-09

漫威《雷霆特攻队*》5月2日来袭，全员恶人组队，奥斯卡阵容演绎反叛之路！

03-09

Lilium Jet破产，电动垂直起降飞行器梦碎？

03-09

宇树人形机器人成新宠，二手溢价40%，租赁市场火爆，买还是租？

03-09

点击查看更多 +

全站最新

极氪007 GT绿色猎装车亮相，纯电新选择续航高达825公里

知行汽车科技预亏近三亿，股价暴跌八成，自动驾驶之路何去何从？

杭州西湖上演AI情缘，宇树机器人化身白娘子许仙浪漫相遇

传祺向往S7引领智驾新风尚，L2++无图技术开启出行新篇章

多品牌汽车及摩托车被召回，快看看你的爱车是否在列！

零跑B10明日预售！搭载LEAP 3.5架构与激光雷达，智驾新体验来袭

热门内容

本栏最新

《雄狮少年》官方严正声明：维权行动开始，网络侵权者速删虚假信息！

Windows 11电池图标大变身！7种新样式，一次全掌握

联掌门户上市一周市值飙升，但业务支撑力存疑

大疆“9点下班令”：严禁过度加班，员工健康成首要考量？

AMD RX 9050显卡曝光，入门级市场或将迎来新选择？

台积电工艺进化揭秘：4nm、3NP芯片竟由生产线工人精心打造

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.