“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

时间：2024-06-28 22:46:56 来源：ITBEAR编辑：汪淼 发表评论无障碍通道

一个“技术问题”，导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近100%。

想必很多小伙伴已经感受过了这则铺天盖地的消息，所带来的亿点点震撼。

而根据事后的消息来看，这个大故障是纽交所的合并报价系统(CTA)在更新软件时出现了问题。

许多专家都对此做了分析，有人认为是CTA软件在进行版本更新时出现了数据一致性问题;也有人提出最大的问题应该是出现在了数据库。

但总而言之，这并非是纽交所今年来第一次出现的故障，而是众多里的一个：

甚至某开源数据库联合创始人Jason直言不讳地表示：

>纽交所在CTA软件上相关的IT水平还不及中国的大型金融机构和互联网公司，在中国已经很少会发生这种低级错误了。

即便如此，这也不禁令人产生更大的顾虑和担忧——

传统软件问题尚能引发如此大的问题，那么站在大模型时代当下，AI+金融，是否又能做到准确可信?

正所谓实践是检验真理唯一标准，要回答的这个问题，我们不妨了解一下已经在金融领域“上岗”了的AI大模型。

大模型上岗金融，都在做什么？

诚然AI大模型的发展已然呈现势不可挡的趋势，但在金融领域真正应用的时候，依旧存在一些显著的困难和挑战。

例如数据隐私和安全方面，金融数据往往高度敏感，涉及个人和企业的财务信息，确保数据隐私和安全是首要挑战之一。

并且这些数据具有多源和异构的特点，需要进行有效的整合和处理，才能确保它们的准确性和完整性。

再如模型本身，大模型往往被视为“黑箱”，因为其内部决策过程难以解释;在金融领域，尤其是涉及风险管理和监管合规时，可解释性和决策透明性是非常重要的。

还有在实时性和资源消耗方面，金融市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。

加之大模型训练和推理过程需要大量的计算资源和能量消耗，这对企业的成本和环保要求提出了挑战。

而成立于1998年的老牌金融科技公司金证，面对上述固有的重重困难，却有着自己的一套解法。

在金证看来，大模型的优势在于文本及非结构化数据处理能力、人机交互能力、生成能力和逻辑推理能力较强。

而相比小模型而言，大模型也存在明显的劣势，例如大模型“幻觉”问题(即大模型答非所问)，大模型的部署算力要求高造成算力资源浪费，部署成本高等问题。

因此，金证的解法就是——通过组合式AI，即大模型+小模型+工具，以此来支撑各个业务场景AI需求。

大模型方面，包含金证去年年底推出的K-GPT以及业内众多顶流的大模型，在特定的金融任务中发挥大模型的特长。

小模型则是指诸如OCR、NLP、人脸识别、文字识别、财务分析等传统模型，可以细分任务做到快准狠地处理。

至于工具，则是指地图、天气、CRM、邮件、OA等。

一言蔽之，在某个金融领域任务中，这种模式可以让大模型、小模型和工具做到“专业的人干专业事”，尤其能极大地提高效率。

相比于通用大模型，金证的K-GPT在数据查询的准确性方面表现更佳，能够更好地理解金融术语，提供专业且数据扎实的回复。

据了解，K-GPT 还支持查看引用的知识源，并具备与实时数据和模块化集成的能力，可以调取实时数据和组件。

依托庞大的金融知识库，K-GPT专为金融场景服务，其核心优势在于对金融的深入理解、数据准确、可验证性以及支持调用Agent功能。

从效果上不难看出，金证已然让大模型在金融领域中合格地上岗，那么针对成本和资源上的痛点，金证又是如何解决的呢?

背后是高带宽内存（HBM）的至强处理器在发力

金证K-GPT方案中，还有一点比较特别：与英特尔合作，采用了基于CPU的大模型推理方案。

据了解，他们主要是看中的是英特尔® 至强® CPU Max 系列处理器。

这是英特尔唯一一款基于x86架构并采用高带宽内存(HBM)的CPU系列，采用了片上HBM设计，内存带宽高达4TB/s。和传统DDR5内存相比，HBM具有更多的访存通道和更长的读取位宽，理论带宽可达DDR5的4倍之多。

要知道，大模型推理涉及大量的权重数据读取，对硬件平台的内存访问带宽提出了很高的要求。

至强® CPU Max具有64GB HBM，每个内核可以分摊到超过1GB的内存，对于包括大模型推理任务在内的绝大多数计算任务，HBM都可以容纳全部的权重数据。

内存带宽还不是金证选择这款CPU的全部理由。

英特尔® 至强® CPU Max系列还内置了英特尔® 高级矩阵扩展 (英特尔®️ AMX)引擎，大幅提升了大规模矩阵乘法运算性能。

金证K-GPT基于Transformer架构，其核心特点包括多头注意力机制和前馈神经网络层，这其中都包含大量矩阵运算，而英特尔® AMX通过1024位TMUL指令和8个独立的矩阵计算单元，可以每时钟周期执行8次独立的矩阵乘累加操作，为这些运算提供强大的加速能力。

如此一来，大模型推理的效果如何呢?

在只用单颗 CPU 的情况下，推理130亿参数大模型，首个词元生成时间就能压到1秒左右，模型推理TPS超过10 tokens/s，用户提问后约2秒内就能得到响应。

别忘了遇到负载高峰等情况，还可以同时启用2颗CPU，性能还能提升将近一倍，可以说足以满足金融场景的大部分应用需求了。

除了硬件层面的突破，英特尔还提供了经过优化的软件工具来挖掘硬件潜力。

比如广泛使用的OpenVINO™ 工具套件，就被用来专门调优加速模型的Embedding处理进行。

金融场景涉及大量专业文档的输入任务，Emedding正是把文本从离散变量转变为连续向量的过程，好让AI能够理解。

经过OpenVINO™ 工具套件优化后，K-GPT大模型的批量Embedding性能提升到3倍之多。

图注：OpenVINO™ 工具套件优化前后 Embedding 性能比较

再比如金证与K-GPT配合使用的开源向量数据库Faiss，英特尔也提供了优化版本，以提升在至强® CPU Max上的模型推理性能。

在大规模向量相似性检索任务中，经英特尔优化过的版本性能可提升至4倍左右。

图注：英特尔优化版 Faiss 与原始 Faiss 性能对比(越高越好)

除了性能方面之外，金证选择英特尔® 至强® CPU Max系列作为算力底座还带来其他方面的优势：

首先是灵活性。由于与主流的 x86 架构完全兼容，金证可以继续使用原有的机器，灵活搭配适合自身业务的配置。而且 CPU 能同时应对推理和通用计算，可根据负载情况随时调配资源。

第二是总拥有成本 (TCO)。从长远来看，CPU路线能以更低的部署和维护开销，实现与专用加速器相媲美的性能。这对于需要控制预算的金融机构来说至关重要。

综合看下来，英特尔® 至强® CPU Max系列处理器在硬件能力、软件优化、生态适配、总拥有成本优势等方面都与金融场景非常契合，不失为业界大模型落地的一种新思路。

如何评价？

随着数字化转型的不断深入，大模型为金融行业带来的机遇与挑战并存。

越来越多的金融机构开始探索如何将 AIGC 技术与实际业务相结合，在提质增效的同时控制成本。但大模型在金融行业的应用仍处于初步探索阶段。

金证携手英特尔打造的这套大模型推理方案，可谓是应用层、模型层、算力层的深度融合，为业界树立了标杆。

不久前举办的金证科技节，就吸引了众多金融机构前来"取经"。

作为连接金融与科技的重要平台，金证科技节吸引了众多来自银行、证券、保险等领域的金融行业玩家参与，共同探讨 AI 技术在金融领域的应用前景与优质实践。

可以预见，在英特尔的算力加持下，金证将在大模型技术上不断突破，助力更多金融机构实现数字化转型，为用户带来更智能、高效的服务体验。

3月20日至21日，“因聚而生众智有为”华为中国合作伙伴大会2025在深圳圆满举行，旨在进一步聚合(Aggregate)伙伴能力，升级(Ascend)对伙伴的支持，加速(Accelerate)客户数智化进程。21日下午，“AI赋能，智汇未来：创新引领生态新发展”——华为云AI生态分论坛同期举行

2025年3月21日，三星家电新品发布会在上海成功举行，显示器领域推出玄龙骑士OLED电竞显示器G81SF、玄龙骑士3D电竞显示器G90XF以及绘域37英寸 4K高性能办公显示器S80UD三大旗舰新品。在游戏硬件性能持续迭代的产业背景下，三星不断实现显示设备革新，为专业玩家提供前沿

3月21日，三星 “有AI的科技·艺术·家” 2025家电新品发布会成功举办。三星旗下多系列生活家电新品震撼亮相，包括三星AI神冰箱9系、三星AI神黑钻热泵洗烘旗舰、三星AI神黑钻衣物护理机在内的一众AI神系列新品备受瞩目。从智能互联的家电生态系统，到节能环保的创新

3月21日，2025三星家电新品发布会成功举行，焕新推出2025 Neo QLED 8K/4K、OLED与新款The Frame画壁艺术电视，以及AI神系列生活家电、显示器旗舰新品等全系生态产品。三星以创新产品组合与智慧解决方案引领未来家居趋势，通过AI赋能将高端显示科技、艺术化设计及智能生

据科技新闻网站Techspot报道，知名爆料人士Jukanlosreve于3月14日在社交媒体X上发文称，三星可能取消SF1.4制程，针对这一信息，三星暂未作出回应。如果传闻准确，表明其遇到多个技术障碍，而SF1.4工艺对高性能计算和人工智能至关重要的战略地位或令三星进一步错失人工智

你是否曾为“洗一双袜子却要启动整台洗衣机”而烦恼?是否因空间有限而无奈接受衣物混洗?如今，海信洗衣机给出了家庭分区洗护的终极解决方案。3月21日下午，海信召开2025世俱杯新品发布会，海信集团副总裁、海信家电集团总裁胡剑涌重磅发布海信全球首台4合1热泵洗烘一体

2025年3月20日，在华为Pura先锋盛典及鸿蒙智行新品发布会上，华为推出首款搭载HarmonyOS 5（鸿蒙操作系统5）的手机HUAWEI Pura X，标志着华为终端全面进入鸿蒙时代。发布会上，腾讯音乐娱乐集团QQ音乐技术副总裁周文江通过视频，分享了鸿蒙版QQ音乐的开发历程，以及在华

由中国卫星导航定位协会与四川国际商会联合主办，四川省国际展览中心、中展励德国际集团有限公司承办的2025中国国际北斗规模化应用展览会，将于2025年7月10日至12日在成都世纪城新国际会展中心盛大开展！本届展会以“深化北斗应用，赋能城市治理”为主题，聚焦北斗技术

3月20日，华为Pura先锋盛典以及鸿蒙智行新品发布会如期而至。发布会上，首款搭载鸿蒙操作系统 5的阔折叠HUAWEI Pura X正式亮相，引发广泛关注。Pura X采用阔折叠设计，打破传统折叠屏手机比例限制，提升内外屏使用一致性。依托鸿蒙操作系统 5的强大能力和颠覆以往折叠形

2025年3月20日，中国家电及消费电子博览会(AWE 2025)在上海盛大启幕。作为全球三大家电及消费电子展之一，AWE 2025汇聚了众多国内外的顶尖科技产品和前沿创新理念。作为全球领先的智能终端企业，TCL实业在AWE 2025展出了多款新品，包括首款第四代液晶电视TCL Q10L系列、

3月20日，华为Pura先锋盛典及鸿蒙智行新品发布会在深圳举行，华为正式发布首款全面搭载HarmonyOS 5的手机HUAWEI Pura X。除了在外形、屏幕上带来亮眼表现外，HUAWEI Pura X在应用体验上也亮点满满，为用户带来了全新小艺外屏交互、碰一碰发红包等众多大有不同的创新体验

近年来，酒店长租作为一种新兴的居住方式，在年轻人群中迅速走红。去哪儿平台数据显示，2024年冬季，租期一个月以上的长租酒店订单增长率3倍， 25-30岁的年轻一代订单增幅最高，较2019年增长2.5倍，在社交媒体上，“长住酒店” 的话题浏览量超过700万次，相关笔记2万多

3月20日，东芝电视携全新旗舰产品大芝士Z700QF亮相AWE展会，这款产品是Z700NF迭代之作，凝聚东芝在音画技术领域的创新思考，为家庭影音娱乐带来新突破。据悉，东芝电视Z700QF将于3月31日开启预售/预约，4月17日全渠道开售。消费市场对高端视听产品的需求持续升温。来自

随着2025中国家电及消费电子博览会(AWE 2025)盛大启幕，AI技术在家电与消费电子领域的深度应用引起广泛关注。作为家电行业的创新引领者，三星生活家电携AI神冰箱、AI神洗干套装、AI神黑钻热泵洗烘旗舰、AI神黑钻衣物护理机在内的全套产品亮相本届展会，全景式呈现BE

3月20日，2025年中国家电及消费电子博览会(AWE 2025)艾普兰奖获奖名单公布。作为“全球智慧生活领域奥斯卡”，艾普兰奖评选出的产品代表了年度行业新品的最高水准和最新技术走向。三星玄龙骑士3D电竞显示器G90XF以裸眼3D技术的突破性创新，荣膺2025AWE艾普兰创新奖，为

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.