在AI技术日新月异的当下,中国电信人工智能研究院(TeleAI)近日在“TeleAI开发者大会”上发布了一项引人注目的创新——基于星辰大模型的视频生成大模型。这一举措标志着国内运营商企业正式涉足AI视频生成领域,与快手等互联网巨头同台竞技。
据悉,该视频生成大模型是国内首个由央企全自研的AI视频生成解决方案。通过整合语义、语音、文生图等多模态能力,它能够覆盖短剧及影视制作的全流程,包括文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等环节,旨在实现高效的成本控制和质量提升。
在大会上,TeleAI团队展示了该模型的强大功能,通过支持主体目标时空一致性、个体复杂动作精准控制、音视频同步生成等技术,不仅能够驾驭多个主角和场景,还能确保生成的视频内容流畅自然。这一演示赢得了与会者的广泛赞誉。
据中国电信负责人透露,这款视频生成大模型主要应用于高质量可控短剧的生成,旨在赋能文宣产业的创新发展。同时,该负责人还表示,TeleAI已完成国内首个全国产化万卡万参大模型的研发,随着本次视频生成大模型和视觉大模型的发布,星辰大模型系列已进一步完成了其全模态能力的构建。
回顾今年2月,美国OpenAI公司发布的视频生成模型Sora在全球范围内引起了轰动。仅需寥寥数语,Sora便能生成效果炸裂、镜头感堪比电影的长视频。这一创举激发了全球AI公司对视频生成技术的热情,众多企业和教授纷纷参与其中,试图打造“中国版Sora”。
然而,尽管Sora的demo惊艳了全球近300天,但至今仍未公开使用。相比之下,国内的AI视频生成赛道却呈现出加速发展的态势。快手可灵、腾讯混元、字节即梦等互联网大厂,以及生数、爱诗、HiDream等初创公司都纷纷加入其中,与全球的“类Sora”们展开竞争。
生成式AI视频生成技术的兴起,得益于计算机视觉、机器学习、ViT架构等多种AI技术手段的不断发展。无论是文生视频、图生视频还是视频生视频,AI驱动的视频生成工具正在不断增强视频制作的工作流程,为影视、游戏、培训与教育、营销与广告、社交媒体等领域的发展提供了更多的增长空间。
据市场研究机构预测,2024年全球AI视频生成市场规模预计达到6.148亿美元,到2032年,这一数字将增至25.629亿美元(约合人民币186.36亿元),年复合增长率高达19.5%。随着AI+视频技术和产品的不断升级迭代,电影、广告、视频剪辑、视频流媒体平台、UGC创作平台、短视频综合平台等众多行业都将从中受益。
TeleAI自今年7月正式挂牌运营以来,已取得了显著的成果。其自主研发的星辰大模型不仅通过了“境内深度合成服务算法备案”和产品备案,还在权威视频生成评测榜单VBench中排名第一。在VBench的16个评分项目中,TeleAI视频生成大模型一举夺得9项第一,覆盖了画面稳定性、语义一致性、空间场景以及视觉风格等多个核心能力。
在大会期间,TeleAI还宣布与华为、中兴、亚信科技、中科曙光等19家合作伙伴共同发布了中国电信人工智能开发者产业联盟计划。该计划旨在聚合各方力量,加快推动AI产业发展,提升技术能力与应用水平,并为全球开发者赋能。
中国电信董事长柯瑞文表示,科技成果只有通过规模应用,才能促进技术不断迭代完善,形成成熟的商业模式。他强调,生成式AI以前所未有的速度进行迭代和创新,大模型能力得到快速提升。未来,中国电信将继续推动数智化应用深度融入行业生产场景,为客户提供“算力+平台+数据+模型+应用”的一体化服务。