ITBear旗下自媒体矩阵:

国内AI技术再突破:Vidu视频大模型一键生成高清内容

   时间:2024-04-28 10:50:15 来源:ITBEAR编辑:星辉 发表评论无障碍通道

【ITBEAR科技资讯】4月28日消息,随着Sora在全球掀起AI视频生成热潮,国内科技界也迎来了新的突破。近日,一段由国内AI技术生成的视频短片受到了广泛关注,该视频源自生数科技与清华大学联合发布的最新视频大模型Vidu。

据官方介绍,Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。用户只需输入简单的指令,如“画室里的一艘船驶向镜头”,Vidu便能生成效果逼真、镜头连贯的高清视频。其整体质感足以与全球领先的Sora模型相媲美。

除了能生成复杂且细节丰富的场景外,Vidu还具备虚构场景及想象超现实主义画面的能力,同时能更好地理解和生成熊猫、龙等富有中国文化特色的形象。这一创新功能的引入,使得Vidu在国内外AI视频生成领域中脱颖而出。

ITBEAR科技资讯了解到,生数科技团队在机器学习和多模态大模型领域有着深厚的积累。正是基于这些长期的技术沉淀,团队在短短两个月内便突破了长视频表示与处理的多项关键技术,成功研发并推出了Vidu视频大模型。

公开资料显示,生数科技成立于2023年3月,其核心团队来自清华大学人工智能研究院,并汇聚了来自北京大学及阿里巴巴、腾讯、字节跳动等知名科技公司的技术精英。截至2024年3月,公司员工总数已超过70人,其中研发人员占比近90%,彰显了公司强大的研发实力。

生数科技自成立以来,便致力于打造可控多模态通用大模型。去年3月,公司开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser,进一步巩固了其在行业内的领先地位。同时,公司在短短一年时间内完成了三轮融资,总计数亿元人民币,估值迅速攀升,已成为目前国内多模态大模型中估值最高的初创公司之一。

生数科技的快速发展和Vidu模型的成功发布,不仅展示了国内AI技术的创新实力,也为全球AI视频生成领域注入了新的活力。未来,随着技术的不断进步和应用场景的拓展,我们有理由相信AI将在视频创作领域发挥更加重要的作用。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version