近日,金融大模型发展论坛举办,马上消费发布了国内首个零售金融大模型“天镜”。在金融业数字化转型的大背景下,人工智能大模型的发展是大势所趋,目前我国金融业中人工智能大模型的发展尚处于起步阶段。
那么,相对于通用大模型而言,金融大模型有何独特性?又面临着怎样的挑战?在大模型建设的过程中最重要的是什么?论坛上,谭建荣、倪光南、孙茂松和杨新民四位院士就何为人工智能、何为大数据及算力、存力建设等问题发表讲话,中国信息研究院副总工程师王爱华就如何解决金融大模型安全可信的问题详细阐述目前采取的具体措施。
算力建设为金融大模型未来发展核心
在关于人工智能的讨论中,几位院士都不约而同地提到了大数据算力的建设问题。谭建荣院士解释道,常规的手段、常规的技术、常规的规矩难以处理的数据就是大数据,在模糊、随机、混沌的情况下往往需要使用大数据。
“数据是人工智能发展的关键因素,数据存储产业也将成为未来国家的战略性产业,成为新的国际竞争高点”。倪光南院士进一步指出数据存储市场的局势,他指出,数据存储目前是被高度垄断的,“2022年三星、美光、海力士三家公司占据了DRAM(动态随机存取内存)97%的市场份额”。
对此,倪光南院士就我国数据产业未来的发展方向给出三点建议:第一,均衡配置算力与存力,换言之,处理数据、存储数据、传输数据三种能力缺一不可。第二,提高存力中先进存力的比重,适时启动以固态硬盘SSD取代机械硬盘HDD的机械革命。第三,在我国数据产业基本具备国际竞争力的基础上,借助双循环迅速扩展规模,提升性价比和服务能力。
“大模型、大数据、大算力,三者缺一不可。”杨茂松院士指出,从2017年到2021年,算力的成本从1000美金降到5美金,成本降低的同时,算力在不断增加,两个因素相互交织着不断演进。杨茂松预言,在未来,大语言模型还会向拟人化机器人、三维空间等领域发展,“这件事肯定会使得行业生态重新洗牌”。
安全可信成金融大模型的最大挑战
马上消费首席信息官蒋宁表示,在工业领域、金融领域,大模型应用还存在四个难题。首先,大模型和通用大模型的本质区别在于前者要做交易决策,而在决策中1%的误差都有可能带来金融风险,因此大模型就要做到“100%决策安全”,安全可信也就成为了金融大模型要解决的首要问题。
对于安全问题的考量不止于此,蒋宁指出,在金融行业中存在“数据孤岛”,这会导致大模型无法形成生态,从而很难形成群体智能。群体智能的建立能权衡各方数据权益,使数据得到有效利用,并打造出行业模型。只有做到共享权益安全可靠,才能实现真正的竞合。此外,在人工智能为客户服务的过程中,也存在如何平衡个性化服务和个人隐私数据合规的问题。同时,金融大模型需要不断优化底层基础设施适应垂直领域、金融领域的发展。
具体到解决措施,杨新民院士介绍了大模型的三种技术方向:第一,基于运筹学思维解决复杂决策的高效果性、经济性问题。通过参数调优的训练速度、多轮对话任务的计算成本科学问题,推动大模型的产业应用;第二,发展双系统,促进大模型的可控、可干预、可解释;第三,推进多模态的防伪技术,保证大模型的安全性。
在人工智能可信治理方面,中国信息研究院副总工程师王爱华介绍了研究院推出的人工智能能力测评体系。目前该系列展开的工作涵盖了各类人工智能测评的环境和数据集,并且已经在金融、互联网、电信、能源等领域投入测评。