在全球AI芯片竞争日益激烈的背景下,一款名为DeepSeek的国产大模型横空出世,正悄然改变着技术演进的底层逻辑。这款应用迅速走红,用户量激增,已突破3000万日活跃用户的大关。DeepSeek的崛起,引发了业界对AI热潮的深度思考与理性审视,同时也让人们对其技术潜力充满好奇。
近日,一场聚焦“DeepSeek如何重塑AI格局?AGI门槛正逐渐消失?”的沙龙活动成功举办。此次活动由新网银行携手西南财经大学管理科学与工程学院联合呈现。活动中,新网银行副行长李秀生、西南财经大学管理科学与工程学院计算金融系主任王俊教授,以及新网银行风控科学部负责人卫浩,共同揭示了DeepSeek背后的技术秘密及其在银行业的应用蓝图。
(从左至右:主持人任帅、李秀生、卫浩、王俊)在直播现场,开源与闭源的议题被热烈讨论。当OpenAI与微软的合作引发“生态垄断”争议,英伟达面临史上最严格的AI芯片出口管制时,DeepSeek的开源策略如同一股清流,为企业提供了以较低成本应用先进大模型的可能,进而提升多场景智能助手的能力。
李秀生以Linux和安卓为例,阐述了开源与闭源两种模式在软件行业的并存现象。他指出,尽管两者路径不同,但都取得了显著成就。李秀生个人更看好开源模式,认为它能够汇聚全球智慧,共同推动技术进步。而王俊则认为,开源与闭源是相互融合、相互竞争的关系,各有优势与局限,实践中可能会相互借鉴、融合,并在某些领域形成竞争态势。
DeepSeek作为一种开源、低成本且高效的大模型,对市场上的头部科技公司产生了不小的冲击。王俊坦言,对于OpenAI这类闭源大模型公司,DeepSeek的定价策略迫使其重新审视商业模式和技术优化方向。同时,DeepSeek的发布也促使英伟达等芯片公司思考AI基建的投资逻辑和发展模式应如何调整。
然而,尽管大模型具备广泛的能力,但在风控这一垂直领域,其表现并不尽如人意。卫浩指出,大模型的训练主要依赖于公开的互联网数据和代码,缺乏针对风控领域的专门数据语料训练,因此其逻辑可能与风控的实际需求不完全吻合。
值得注意的是,DeepSeek的训练成本和效率令人瞩目。与传统大模型动辄千万乃至上亿的投入相比,DeepSeek的训练成本仅为557.6万美元,且整个训练过程仅用不到280万GPU小时。这一低成本、高效率的优势,使得DeepSeek在本地化部署时,成本可低至不足百万元。
目前,从银行、基金到证券,多家金融机构都在积极部署DeepSeek。自2024年5月起,新网银行就在系统研发场景中应用DeepSeek大模型,构建了研发知识问答助手与代码续写助手,有效缩短了工程师查阅技术资料的时间。
李秀生认为,DeepSeek的出现带来了两大理念上的变化。一是打破了“大力出奇迹”的执念,证明了通过优化算法和模型,也能在较低算力下实现高效性能。二是加剧了开源与闭源之争,降低了技术门槛,使得更多机构能够应用大模型。这一变化对银行业等金融机构产生了深远影响。
卫浩分享了DeepSeek在银行业数字化风控领域的应用前景。他表示,DeepSeek等大模型能增强语义理解和文本处理能力,从更广泛的数据中获取信息,提高客户评估准确性,做出更好决策。同时,DeepSeek的深度思考能力也在处理长上下文和复杂意图时表现出色。
面对大模型时代的来临,李秀生认为银行需要从战略层进行思考,构建适配自己的智能技术应用能力。他强调,银行需要思考如何构建应用、组织数据、提升数据质量以及应用行外数据等多方面因素。目前,新网银行已在客服领域应用大模型,并正在营销、贷后管理等领域尝试大模型的应用。
王俊预测,在制造业、气候风险预测、计算机、教育、媒体娱乐等领域,大模型相关智能应用都会有较明显的提升。他指出,大模型能监测零件或电池的可靠性、预测天气情况、助力代码补全和理解、构建个性化学习模型以及用于内容生成和场景搭建等。
随着AI和大模型技术的发展,商业银行正迎来新一轮重塑。李秀生表示,尽管金融风险管理的本质未变,但服务方式、产品形态和运作机制将发生巨变。他勉励银行从业者保持冷静、不断学习,紧跟时代变化,以适应时代技术的进步。