【ITBEAR】在近日落幕的2024国际多媒体会议(ACM MM 2024)上,中国人民大学高瓴人工智能学院与值得买科技联合研究团队展露锋芒。团队代表王希华发表了关于多模态领域最新研究成果《TiVA:时序同步的视频到音频生成》的口头报告,揭示了解决视频到音频同步生成技术难题的新路径。
TiVA框架通过创新的音频布局使用,不仅提升了AIGC内容生成的速度与质量,更在语义匹配和时间同步精度上实现了突破,获得国家发明专利授权,成为多媒体领域的一大亮点。
该研究团队还展示了另外两项成果:面向电商领域的共享基座检索增强架构(BSharedRAG)与多模态知识增强的视觉信息查询架构(MuKA)。其中,BSharedRAG架构已被国际顶尖会议EMNLP2024录用,彰显了其在自然语言处理与人工智能领域的领先地位。
值得买科技CTO王云峰表示,这些研究成果不仅推动了公司业务的提质增效,更为整个电商行业的智能化升级贡献了力量。通过与人大高瓴的深入合作,值得买科技正逐步构建起强大的AI技术壁垒,并致力于将科技成果与行业经验开放共享,推动行业的持续繁荣。
BSharedRAG架构的开源评测集更是为行业提供了一个统一的基准,助力研究者在不同研究工作之间进行效果对比,推动了电商领域AI技术的标准化与透明化发展。
随着全面AI战略的深入实施,值得买科技将继续携手合作伙伴,在产学研用一体化进程中不断探索AI技术的更多可能性,为消费者带来更加智能、高效的购物体验。