滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

腾讯混元大模型上线文生视频，130亿参数模型120秒成片并开源

时间：2024-12-03 22:01:47 来源：ITBEAR图源：智东西编辑：瑞雪 发表评论无障碍通道

腾讯在AI视频生成领域迈出了重要一步，正式上线了其混元大模型的视频生成功能。这一功能是在腾讯已经实现的文本生成文本、文本生成图像以及3D生成能力之后的又一技术突破。

腾讯混元多模态生成技术的负责人凯撒在介绍中表示，此次更新的HunYuan-Video模型经历了四大核心改进。首先，引入了超大规模的数据处理系统，显著提升了视频画质。这一系统能够混合处理图像与视频数据，通过多个维度的功能，如文字检测、转景检测、美学打分等，进一步优化了视频质量。

其次，模型采用了多模态大语言模型（MLLM）作为文本编码器，提升了复杂文本的理解能力，并实现了多语言支持。这一改进使得文本与图像之间的对齐更加精确，能够根据用户提供的提示词生成符合要求的视频内容。

模型架构方面，HunYuan-Video使用了130亿参数的全注意力机制（DIT）和双模态ScalingLaw，有效利用了算力和数据资源，增强了时空建模能力，并优化了视频生成过程中的动态表现。这一架构支持原生转场，实现了多个镜头间的自然切换，同时保持了主体的一致性。

最后，腾讯自研的3D VAE架构被应用于HunYuan-Video模型中，以提升图像和视频重建的能力。这一架构特别在小人脸和大幅运动场景下表现更加流畅，进一步增强了视频的视觉效果。

与此同时，腾讯宣布将这款拥有130亿参数规模的视频生成模型进行开源，并在APP与Web端发布。用户可以在标准模式下大约120秒内完成视频生成。这一举措将极大地促进AI视频生成技术的发展和应用。

在技术升级之外，腾讯还对HunYuan-Video模型进行了多项应用拓展。通过微调、应用拓展及开源等措施，腾讯进一步强化了模型的实际应用能力。目前，HunYuan-Video正在六个关键方面进行专项微调，包括画质优化、高动态效果、艺术镜头、手写文本、转场效果以及连续动作的生成。这些微调将进一步提升模型在视频生成方面的定向能力。

HunYuan-Video还推出了Recaption模型，提供了常规模式和导演模式两种生成模式。常规模式适合专业用户进行精细操作，而导演模式则更适合非专业用户使用，通过提升画面质感、强化镜头运用等方面，帮助用户生成高质量的视频内容。

腾讯混元大模型在视频生成领域的表现也获得了认可。经过千题盲测的定量分析，混元在总体排序中以41.3%的表现领先，优于其他多个模型。特别是在处理人文场景、人工场所以及多主体组合场景时，其生成效果尤为突出。这一成绩显示了腾讯在AI视频生成领域的强大实力。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

AI大模型新突破：字节跳动豆包上线图片理解功能，引领多元化应用潮流

再比如，早前，马斯克创立的人工智能公司xAI宣布为Grok增加了图像理解功能，而马斯克本人也出来官宣了，并发布以下图片，称“Grok现在能够理解图像了，甚至还可以解释笑话”。漫画中的两个人在战场上看到士兵倒…

12-03

腾讯混元大模型突破！130亿参数视频生成能力上线并开源

12-03

三星AR眼镜新原型曝光：50克轻盈设计，Gemini AI加持引期待

12-03

柯瑞文在数字科技生态大会：AI引领，共探数字生态新未来

12-03

中国电信天翼AI手机震撼亮相，内置3B星辰大模型提升智能体验

12-03

搜索新时代来临！周鸿祎纳米搜索引领AI搜索3.0变革

12-03

梁建章提议取消中高考：延迟选拔至就业考研，网友反应热烈

有网友直接指出，建议携程首先取消简历筛选和面试环节，把压力放到后面的考核部分就可以了。针对高考，很多网友表示支持，他们认为高考不是最好的制度，但是公平的制度，周围很多偏远地区变改命运的人就是通过高考；现在…

12-03

岁末新启，农工党大兴区工委探索新能源发展之路

12-03

曼孚科技荣耀登榜！2024年度最具投资价值企业TOP100实至名归

12-03

AI赋能新吴教育，希沃引领全域展评活动探索深度融合新路径

12-03

中兴通讯2024数字科技生态大会：AI终端新品引领智慧生活新风尚

12-03

中兴通讯携手中国电信，2024展会上演AI终端盛宴，共筑数字生态新篇章

12-03

科大讯飞布局新领域，“AI速记”商标申请引关注

三言科技 12月3日消息，天眼查知识产权信息显示，近日，科大讯飞股份有限公司申请注册1枚“AI速记”商标，国际分类为科学仪器，当前商标状态为等待实质审查。…

12-03

成都新设超级智算科技公司，注册资本高达50亿，国资背景引关注

12-03

大华股份新设科技公司，涉足人工智能与大数据服务领域

12-03

点击查看更多 +

全站最新

中山大学80厘米红外望远镜：填补空白，揭秘宇宙红外波段奥秘

长征十二号首飞成功，揭秘六大创新技术如何引领商业航天新篇章

马斯克坚持纯视觉路线，激光雷达真的是自动驾驶“弯路”吗？

iCAR V23预售火爆，8小时狂揽31000单，年轻人的新宠如何炼成？

爱心包助力货车司机，暖心行动“驶”向幸福路

比亚迪海豹07DM-i全面评测：设计、智能、驾控，亮点不止DM技术？

热门内容

本栏最新

腾讯混元大模型上线文生视频，130亿参数模型120秒成片并开源

AI大模型新突破：字节跳动豆包上线图片理解功能，引领多元化应用潮流

腾讯混元大模型突破！130亿参数视频生成能力上线并开源

柯瑞文在数字科技生态大会：AI引领，共探数字生态新未来

中国电信天翼AI手机震撼亮相，内置3B星辰大模型提升智能体验

梁建章提议取消中高考：延迟选拔至就业考研，网友反应热烈

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.