如何让大模型变得更聪明，避免一本正经地说胡话？方法找到了

时间：2023-07-07 14:45:44 来源：ITBEAR编辑：茹茹 发表评论无障碍通道

大模型们还在进行狂热的“诸神之战”，尝过鲜的用户却无法忽视大模型的短板。在交互过程中，用户常常被它们一本正经的胡言乱语所打败——对于部分问题，它们会输出一些“看似非常有道理，实则完全不对”的内容，让人啼笑皆非。

云创大数据成立于2011年，并不是2015年

之所以出现这种“AI幻觉”，是因为大模型的内容由推理而来，而在其自身训练过程中也不可避免存在数据偏差。因此，当提问超出其训练范围，大模型可能会模糊回答，或者一本正经地胡诌。

娱乐一下没有关系，但是对于数据准确性有着较高要求的用户，这样的通用性大模型可能会是负担，进而导致大模型应用的普及度没有想象的高（根据摩根士丹利发布的一项调查显示，只有4%的人表示对于ChatGPT使用有依赖）。

ChatGPT&Bard应用趋势(图片来源：摩根士丹利报告)

有没有办法改善大模型回答不准确的情况?当然有。既然回答不准确是因为缺少真正有用的知识参考，可以面向特定领域定制行业大模型，将可信来源的数据转化成向量数据存储起来，校准大模型推理输出的结果，从而使大模型输出的结果更加准确。

各种对象转换为向量存储在向量数据库中(图片来源：swirlai.com)

向量比对过程(图片来源：Pinecone)

对于企业而言，可基于大模型和企业的个性化数据建立专属知识库(Knowledge base)。可参照以下大模型业务流程，建立企业知识库，以可信可靠的数据和知识，提高大模型输出的准确率。

LLM大模型知识库业务流程(图片来源：swirlai.com)

首先，将企业的知识库文本语料分割为多个块，用嵌入(Embedding)模型将分割的文本块转换为一个个向量存储在向量数据库中，并建立向量和文本之间的对应关系，如上图①-③所示。

此后，就可以提出问题。需要注意的是，问题也需要进行向量化，同时使用与知识库语料向量化相同的嵌入模型，并且在向量数据库中进行查询，找到相似度高的向量，如⑤-⑦所示。

将返回的向量嵌入映射到对应的文本块，并返回给大模型，利用大模型的语义理解能力，结合上下文生成问题答案，如⑧-⑨所示。

在建立企业知识库后，同样的问题再问大模型，它能给出准确的回答(建立知识库的过程类似于下图提供参考信息的过程)。

建立知识库的过程类似于上图提供参考信息的过程

实现私有化部署后，大模型“胡言乱语”的习惯开始逐渐被纠正，而且向量数据库做的越大，它掌握的知识越多、越准确、越全面，就越有可能带来爆炸式的大模型应用。

不过，如果只是依靠向量数据库进行私有化部署，容量有限且速度比较慢，无法完全满足企业通过大模型提质增效的潜在需求。

现在，cVector向量计算一体机通过发挥高性能硬件、向量加速算法和并行计算算法的合力，致力于满足亿级乃至百亿千亿向量规模的大模型推理应用向量计算需求。

cVector向量计算一体机

cVector向量计算一体机的使用方式与向量数据库基本一致，支持批量、追加入库，支持向量间欧式距离、余弦距离等向量计算，支持网页、命令调用、Python库等方法，但在向量的入库和比对计算上具有惊人的性能。

cVector向量计算一体机架构图

近期， cVector向量计算一体机接受了工信部直属的国家一级科研事业单位中国软件评测中心的鉴定测试。中国软件评测中心对比测试了cVector向量计算一体机与3款主流向量数据库在入库速度、查询速度、准确性等维度的性能对比。

在入库性能方面，同样入库3000万条256 维向量数据，在向量数据库中最快的是A，入库速度是4851.97s，cVector向量计算一体机是1202.91s，入库速度约是向量数据库A的4倍，向量数据库C的50倍，向量数据库B的113倍;当入库数据达到1亿条时，向量数据库A的入库速度是17295.49s，cVector向量计算一体机是4484.55s，入库速度约是前者的3.9倍。

入库性能比对

在查询性能方面，同样查询1亿条256 维向量数据，向量数据库A的查询速度是512.8s，cVector向量计算一体机是0.27s，查询速度是前者的1899倍，而其他两家测试向量数据库由于数据量太大无法入库比较。

查询性能对比

在准确性方面， cVector 向量计算一体机、向量数据库A、向量数据库B和向量数据库C的数据准确度一致，通过了中国软件评测中心(工业和信息化部软件与集成电路促进中心)单项性能测试。

cVector向量计算一体机在亿级乃至百亿千亿向量规模的的入库和查询等方面具有显著的性能优势，可帮助提高大模型推理的服务性能和服务质量，并能明显降低其基础设施建设成本，助力类ChatGPT等人工智能企业以更优的性价比解决算力不足的问题。

在具体应用方面，对于生成式AI相关企业，cVector向量计算一体机主要面向大模型推理应用，能够在下述大模型推理环节发挥显著作用：

①提高生成式AI的输出准确性。由于大模型的输出结果是根据概率推理而成，所以会出现“一本正经说胡话”的情形。可以将可信来源的数据转化成向量数据存储在向量计算一体机中，校准大模型推理输出的结果，从而使大模型输出的结果更加准确。

②提升大模型理解互联网实时数据的能力。大模型基于历史数据训练而成，所以“只知道过去，不知道现在”。如果使用向量计算一体机存储海量实时数据所转化成的向量数据，可以帮助大模型理解掌握实时情况。

③提升大模型对用户的服务质量。向量计算一体机可以允许用户上传更多的数据，让大模型掌握用户个性化的背景资料，更好地学习理解用户请求，更好地结合用户的实际情况回答问题。

④减轻大模型的访问压力。用户所提的大部分问题都是相似的常见问题，向量计算一体机可以缓存大量热点问题，不需要经过大模型推理即可返回结果，从而大幅减少算力成本。

⑤帮助生成式AI过滤敏感内容。怎么防止生成式AI说错话一直是一个挑战性问题，而向量计算一体机可以存放敏感内容所对应的向量数据，在用户提出请求时加以判断，尽可能防止AI对敏感问题做出不恰当的回应。

cVector向量计算一体机能够广泛应用于人工智能领域中生成式AI的推理应用场景，为各类生成式AI企业提供高性价比的产品和解决方案，大幅增加大模型平台的竞争力，欢迎各大企事业单位试用。

目前国内某家龙头大模型研发机构已经开始在测试cVector向量计算一体机，他们反映原来的向量数据库的确是一个大瓶颈，如果不解决，会严重制约大模型的表现。联系方式：单先生一三七七零三一一八八七（微信同号）

12月18日，以“携光共进与智同行”为主题的2024第二届智能车载光峰会在风景秀丽的东莞松山湖悦榕庄成功举办。本次峰会由中国智能网联汽车产业创新联盟、中国汽车工业协会车用智能显示分会联合主办，华为技术有限公司承办。峰会汇聚了来自车企、标准研究、产品测评、合

在当今手机摄影日益普及的时代，一款高性能、便携的存储设备成为了众多摄影爱好者的必备之选。雷克沙推出的Professional Go PSSD，正是为了满足这一需求而设计的。这款固态硬盘不仅体积小巧，性能卓越，还具备多重安全保障，成为专业摄影用户的得力助手。雷克沙Professi

在科技日新月异的今天，每一次技术的革新都足以掀起行业的波澜，尤其是有行业领导者推出的新技术更是如此。比如在前几天的TCL QD-Mini LED新技术发布会上，凭借一系列颠覆性的创新成果，引发了行业内外的热议。在本次发布会上重磅推出的万象分区、绚彩XDR以及量子点Pro

在科技日新月异的今天，电视显示技术正经历着前所未有的大变革。Mini LED技术的快速发展不仅为电视市场注入了新的活力，更推动了画质表现的不断突破。然而，面对激烈的市场竞争，单纯依赖参数提升已难以满足消费者对于画质的极致追求。近日，TCL QD-Mini LED新技术发布

在季节更迭的轮回中，冬季已悄然降临。然而，随着气温的逐渐下降，空气也日益干燥，给人们的肌肤带来了严峻的挑战。在这样的季节里，许多人开始感受到肌肤的微妙变化，变得干燥、紧绷，甚至出现脱皮的现象。为了应对这一季节性肌肤挑战，自然阳光焕肤水润时光面膜，正是

鸿蒙风起,未来已来——云学堂鸿蒙应用入门级开发者认证开营啦!在科技飞速发展的今天,鸿蒙系统以其开放、创新、安全的特点,正逐步构建起一个全新的智能生态。从智能手机到智能家居,从穿戴设备到出行工具,鸿蒙系统的身影无处不在,它不仅为用户带来了更加流畅、智能的使用

12月18日，2024京东金榜迎来五周年盛典，备受瞩目的“百大金奖”商品榜单也正式揭晓。过去的一年里，近9亿人次通过金榜完成下单，80%的用户在不到10秒内就能找到心仪商品；超过5200个品牌金榜留名，其中超1700个品牌在上榜当月实现销售同比增长超100%。数码品类中，从智

近日，由工信部指导的2024“绽放杯”5G应用大赛全国总决赛结果在2024中国5G发展大会期间正式揭晓——中国广电、亚信科技共同建设的全球首个全量核心网下沉本地的5G风电专网项目，从众多案例中脱颖而出斩获全国一等奖!该案例是全国一等奖中唯一的风电行业案例，此前已获

这一年我们看到的中小企业关键词是拼搏与时代共舞，书写奋斗历程是同行抱团取暖，点燃希望的火种是争先与爱采购携手，成就数智转型幸会，这一年与你们同路感恩，这一路有你们相随2024爱采购「岁末家年华」温情来袭联动全国近50个城市致敬时代同行者，期待与你共绘新章!

12月14日，2024一带一路暨金砖国家技能发展与技术创新大赛之元宇宙3D数字内容设计创作赛项(中职组)全国总决赛在湖北崇阳职业技术学校圆满闭幕。大赛于12月12日开幕，围绕文博文创、轨道交通、智能制造三个主题开展，通过比赛，参赛选手可以更深刻理解3D数字化技术在社会

在这个快节奏的时代，看电影却是一个必须慢下来的过程。相信在外奔波一天，每一位电影爱好者回家观影时，内心渴求的绝不仅仅是一台简单的投影设备，而是一份由电影原色带来的真实感动。可当今家庭影院消费市场鱼龙混杂，让人眼花缭乱，什么样的设备才能真正称得上「专业

不觉已到深冬,西伯利亚的寒风早已吹遍北方,不知已下过几场大雪。千里冰封,万物冬藏,但对另一群生命来说,却无处可藏。所以和季风一同在西伯利亚起飞的,还有候鸟。和人一样,鸟儿也在冬天向往温暖宜居的南方,为了生存每年如约开启一场浩荡迁徙。各类候鸟聚群而飞,相互支撑

相信大家最近都听说了电视圈即将迎来的年末压轴大戏吧?没错，说的就是将在12月16日举行的“光生万象”2024 TCL QD-Mini LED新技术发布会!为此官方这几天连发3张倒计时海报，引来网友的纷纷猜想，作为头部电视品牌，TCL会给消费者带来怎样的突破性技术呢?在发布正式开始

转眼又到了年底，科技圈的热闹程度堪比春节!不久前就有关TCL新技术突破的消息曝光，这几天TCL也陆续官宣新技术即将发布信息，据悉，2024年TCL QD-Mini LED新技术发布会将于12月16日14:30举行!这场被誉为“光生万象”的QD-Mini LED技术发布会，无疑将成为年底科技圈的一

我们真的太激动了，打《无畏契约》有两年的时间，真没想到有一天会拿到10万元的奖金。这对于我们战队的每个人都是莫大的鼓励，有一种热爱成为专业的不真实感。感谢掠夺者电竞大赛这个舞台，感谢宏碁品牌举办这么好的赛事活动，也感谢英特尔酷睿的加持。12月14日，掠夺

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.