【ITBEAR】9月12日消息,生数科技CEO唐家渝在近日举办的媒体开放日活动中,揭示了公司旗下产品VIDU所采用的“U-ViT架构”与行业内其他视频大模型的异同,并表达了对于AI视频技术普及的乐观态度。
唐家渝指出,尽管U-ViT架构与某些模型的底层技术有相似之处,但生数科技在模型设计上更注重实际应用与落地。他通过类比语言模型的发展,强调了即便在相同的技术架构下,不同公司在技术细节、实践经验以及破解难点上的能力差异,将决定最终模型性能的优劣。
据ITBEAR了解,生数科技自2023年3月成立以来,已迅速完成了新一轮融资,并与清华大学联合研发出原创视频大模型Vidu。该模型面向全球发布后,短短时间内便收到了数万个API接入申请,显示出市场对AI视频技术的强烈需求。
在商业模式上,唐家渝透露,生数科技目前主要采取SaaS订阅和MaaS两种模式。他解释称,SaaS模式通过提供免费的额度吸引用户,而更高级的功能则需要支付订阅费用;MaaS模式则是针对那些需要将视频生成能力集成到自身工作流程中的客户。
谈及AI视频的市场前景,唐家渝认为,尽管当前的主要使用者仍是专业用户,如电影工作者等,但AI视频技术已经来到了普及的临界点。他通过摄影技术的演变类比,指出AI视频正在降低创作门槛,使更多人能够轻松驾驭这一工具。
此外,唐家渝还透露了生数科技在技术研发方面的最新进展。他表示,公司正在不断提升模型能力,以突破当前视频生成技术的天花板。例如,通过增强模型对复杂结构的生成成功率,以及提升在动态场景中的表现等。
最后,他强调,在推动技术原创性和突破性的同时,生数科技也注重商业化的平衡发展。公司正计划将Vidu的生成时长扩展得更长,以满足更多创作需求,但同时也会根据市场反馈和实用角度来调整产品化的优先级。
#生数科技# #VIDU# #AI视频# #U-ViT架构# #技术普及#