ITBear旗下自媒体矩阵:

面向未来:多模态模型成为语言模型发展的重要趋势

   时间:2023-03-21 11:04:04 来源:ITBEAR编辑:星辉 发表评论无障碍通道

【ITBEAR科技资讯】3月21日消息,中信建投研报指出,GPT-4的多模态特性将为语言模型带来更加丰富的应用场景。报告认为,未来的多模态模型应该包括三个基本组成部分:图像、视频和音频。其中,视频对算力和IP复杂度的要求最高,其次为音频。为了满足多模态模型的需求,硬件算力需要向视频、音频编解码能力的支持进行扩展。

在新一代语言模型GPT-4的到来之前,中信建投研报认为多模态模型将会成为未来的发展趋势。这种模型不仅可以处理文本,还可以处理图像、视频和音频等多种数据类型,从而拓展了语言模型的应用场景。

然而,随着模型规模和复杂度的增加,对硬件算力的要求也将越来越高。为了满足多模态模型的需求,需要在硬件算力层面面向视频、音频编解码能力的支持进行扩展。中信建投研报指出,视频对于算力和IP复杂度的要求最高,这意味着为了实现多模态模型的应用,需要有更加高效的算力和更加复杂的编解码模块支持。

据ITBEAR科技资讯了解,未来的多模态模型需要具备图像、视频和音频三个基本组成部分。因此,随着多模态的发展,需要将硬件算力从GPU扩展到GPU周边支持性的编解码IP,如VPU模块,以满足多模态模型的需求。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version