滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI发布Sora文生视频大模型，清华大学亦有新专利公布

时间：2024-02-21 08:52:36 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR科技资讯】2月21日消息，近日，人工智能领域的领军企业OpenAI发布了其首款名为Sora的文本生成视频大模型。这款模型能够根据用户提供的文字提示，生成长达60秒的高质量视频。令人惊叹的是，Sora所输出的视频效果堪比专业的影视CG，因此在发布后迅速引爆了科技圈。

与此同时，在文生视频技术的研发上，国内高校也取得了显著进展。据国家知识产权局网站公布的信息，清华大学于2月2日申请了一项名为“一种定制化多主体文生视频方法、装置、设备及介质”的专利。该专利涉及神经网络技术领域，为文生视频技术的进一步发展提供了新的思路。

据ITBEAR科技资讯了解，清华大学的这项专利申请中详细描述了一种定制化多主体文生视频的方法。该方法需要获取多个主体分别对应的主体文本表述以及主体图像;然后，基于这些信息，进一步获取混合文本和组合图像。接下来，将混合文本和组合图像输入到文生视频模型中，生成第二噪声预测值，并根据这个预测值与组合图像，计算出第二损失和第三损失。通过综合考虑第一损失、第二损失与第三损失，对文生视频模型进行优化，从而得到一个性能更优的文生视频模型。

这项专利技术的创新之处在于，它通过多种损失函数对文生视频模型的参数进行优化，确保在基于文本描述生成视频中的图像时，文本描述与定制化主体能够保持一致。同时，该技术在生成过程中能够确保每个主体的特征不会发生混淆，并且在最终的视频中消除合成痕迹，从而提升视频的整体质量和观感。

标签： Sora

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

马斯克与OpenAI官司缠身，2026年春将迎来陪审团审判

当地时间周五，美国联邦法官周五裁定，亿万富翁埃隆·马斯克起诉人工智能公司OpenAI一案将于2026年春季启动陪审团审判。主审此案的加州北区联邦地区法院法官伊冯·冈萨雷斯·罗杰斯上月驳回了马斯克要求暂停Ope…

04-05

AI机器人按摩，年轻人的养生新选择还是智商税？

我确定自己不会再去尝试其中任何一个，因为它们存在着一个共同点：机器人接触到的都是人体比较脆弱的部位——头、腰腹、脊椎，且评论区中已经有人在用机器人洗头时出现了头发与机器缠绕在一起的情况，而我显然不希望再花钱…

04-05

北京少年人工智能学院启航，中学生将涉足国家级科研前沿

04-05

谷歌Gemini AI部门高层调整，Sissie Hsiao卸任后去向成谜

04-05

微软CTO展望：2030年AI主导代码生成，软件工程师转型指令大师？

04-05

AI未来：专家乐观公众忧虑，态度差异为何如此之大？

04-05

Kindle新功能上线：AI“回顾”助你快速掌握书中精髓

04-05

Meta Llama 4大语言模型本月或将面世，数学推理能力待提升

04-05

比尔·盖茨展望：AI将深度改造行业，人类生来不为工作？

04-05

山姆·奥特曼透露：GPT-5即将面世，能力超乎想象，产能成关键

OpenAI创始人山姆·奥特曼宣布，将在几周后发布 o3 和 o4-mini，然后在几个月内推出 GPT-5。奥特曼表示，这有很多原因，但最令人兴奋的是，GPT-5 比最初设想的能力更强。 “我们还发现，顺…

04-05

OpenAI即将发布o3及o4-mini，GPT-5推迟亮相，能否再创辉煌？

04-05

微软三任CEO遭AI调侃，人类与AI如何共处引深思

04-05

OpenAI奥尔特曼预告：o3与o4-mini或将近期面世，GPT-5随后而来

04-05

微软CTO预言：2030年AI将生成95%代码，程序员工作将如何变革？

04-04

朱啸虎批人形机器人商业化路径，创业者与投资机构各执一词

对于很多刚刚成立，甚至还停留在图纸上的人形机器人公司来讲，有如此高昂的估值，对于投资机构来讲，其实更多地代表的是资金成本的增加。对于朱啸虎来讲，或许是看到了这样一种问题，并且单纯地从投资的角度，早已洞悉了…

04-04

点击查看更多 +

全站最新

《怪物猎人：荒野》竞速排行上线，卡普空重拳出击整治作弊

太空之眼助力！中国14颗卫星如何精准指导缅甸地震救援？

月球生活不是梦！探月总师：打电话、盖房子，未来都能实现

起亚EV6：新能源汽车市场中的未来出行新典范

威达精工GMP2040龙门加工中心：立嘉展上展现自主研发实力

奇瑞QQ概念车曝光，极简黑白配色萌力全开，上海车展亮相在即

热门内容

本栏最新

AI机器人按摩，年轻人的养生新选择还是智商税？

北京少年人工智能学院启航，中学生将涉足国家级科研前沿

微软CTO展望：2030年AI主导代码生成，软件工程师转型指令大师？

AI未来：专家乐观公众忧虑，态度差异为何如此之大？

Kindle新功能上线：AI“回顾”助你快速掌握书中精髓

Meta Llama 4大语言模型本月或将面世，数学推理能力待提升

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.