谷歌发布最新通用大语言模型PaLM2，训练数据达3.6万亿个令牌

时间：2023-05-17 09:32:31 来源：ITBEAR编辑：星辉 发表评论无障碍通道

【ITBEAR科技资讯】5月17日消息，谷歌在其I/O开发者大会上发布了最新的通用大语言模型PaLM2。据ITBEAR科技资讯了解，该模型的训练数据几乎是其上一代模型的5倍，达到了3.6万亿个令牌。PaLM2在编程、数学和创意写作方面表现更为优秀，得益于其庞大的训练数据。

谷歌此次发布的PaLM2模型采用了比之前版本多得多的令牌进行训练。令牌是指训练大语言模型所使用的单词串，它们对于教导模型如何预测字符串中可能出现的下一个单词至关重要。内部文件显示，2022年发布的上一代模型PaLM仅使用了7800亿个令牌，而PaLM2则提升到了3.6万亿个令牌。

尽管谷歌希望展示其人工智能技术的实力，并在搜索、电子邮件、字处理和电子表格等领域实现更高效的应用，但该公司并未公开披露训练数据的具体规模和其他细节。与谷歌类似，微软支持的OpenAI也对其最新的GPT-4大语言模型保密了细节信息。这两家公司之所以保密，是因为它们都希望吸引那些希望通过聊天机器人直接获取答案的用户，从而在商业竞争中占据优势。

然而，随着人工智能军备竞赛的白热化，一些研究人员呼吁企业增加透明度。虽然谷歌声称新模型比之前的大语言模型更小，但其技术效率却得到提升，能够完成更复杂的任务。根据内部文件显示，PaLM2是基于3400亿个参数进行训练的，而初始版本的PaLM则基于5400亿个参数。

据谷歌在一篇关于PaLM2的博文中介绍，该模型采用了一种名为“计算机优化扩张”的新技术，使得大语言模型具备更高的效率和整体性能，包括加快推理速度、减少参数调用和降低服务成本。

此次发布的PaLM2模型针对100种语言进行了训练，能够执行更广泛的任务，并已被应用于谷歌的25个功能和产品，包括实验性聊天机器人Bard。PaLM2共有四个规模，从小到大分别是壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn)。

根据公开披露的信息来看，PaLM2比现有的任何模型都更加强大。Facebook在今年2月宣布的LLaMA大语言模型仅采用了1.4万亿个令牌进行训练。而OpenAI在披露GPT-3训练规模时表示，其当时基于3000亿个令牌进行训练。今年3月，OpenAI发布GPT-4时宣称其在许多专业测试中展示出与人类媲美的表现。

LaMDA是谷歌两年前推出的对话型大语言模型，今年2月与Bard一同亮相。该模型基于1.5万亿个令牌进行训练。

随着新的人工智能应用快速进入主流，围绕底层技术的争议也日益激烈。谷歌高级研究科学家艾尔·迈赫迪·艾尔·麦哈麦迪(El Mahdi El Mhamdi)今年2月辞职，其中一个主要原因是人工智能技术缺乏透明度。本周二，OpenAI的CEO山姆·阿尔特曼(Sam Altman)在美国国会举行的隐私和技术听证会上表示，我们需要建立一套新的制度来应对人工智能潜在的问题。

阿尔特曼说：“对于一种全新的技术，我们需要一套全新的框架。当然，像我们这样的公司应当为我们推出的工具承担许多责任。”

这主要是受到人工智能（AI）开发需求激增的推动，Python 还被广泛应用于数据科学和开源项目的开发。报告指出，与生成式 AI相关的项目贡献量在过去一年中增长了 59%，AI 相关的公共项目的贡献量几乎比…

在大会上，声网发布了他们的RTE+AI能力全景图，在全景图中，声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AIAgent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度，清…

在X100S、X200系列上，vivo通过AI大模型对超过十亿的物体数据学习，再结合AI多帧高像素算法，实现了远景画面的高清拍摄；OPPOFind X8系列更是直接宣传搭载了AI千里长焦，在20倍-120倍…

恰好，雷科技手上这台小米15是首批搭载HyperOS2.0的产品，在这几天的体验中，小雷也感受到了小米对于手机操作系统的一些新构思和小心机，以及对于手机未来的探索和思考。曾在操作UI上吃过亏的小米显然明…

这不仅极大提升了小笨智能SLAM &机器人领域的智能化水平和服务效率，还将助力我们快速拓展市场边界，为客户提供更加高效、灵活、可靠的智慧服务解决方案，引领行业迈向新的发展阶段。未来，小笨智能将继续在工业智…

为深入贯彻党中央、国务院关于推进新型工业化、支持制造业企业及中小企业数字化转型的系列决策部署，落实《上海市制造业数字化转型实施方案》的任务要求，加快推进企业数字化转型，上海市经信委开展了2024年度上海市重点…

财报提及，三季度Meta元宇宙业务营业亏损44亿美元，而Meta还计划加大在AI上的投资，预计2025年资本支出将显著增加。Meta CFO表示，现实实验室在2024年运营亏损还将显著增长，原因是公司持续的产…

他认为，人工智能赋能科研工作有三个台阶，一是借助科研文献助手和代码助手提升基础工作效率，二是基于深度神经网络对科学任务进行精准建模，三是借助认知大模型学习领域知识并辅助设计科研实验方案。在今年的科大讯飞全球…

2024年10月30日，豆神教育在北京举行豆神辞源大模型“名师超拟人，AI新时代”产品发布会，推出自主研发的端模一体教育产品——豆神AI，将客户端与大语言模型深度结合。与之类似，智谱华章有优秀的大模型开发及…

该合作将以联合研究阿拉伯语模型以及沙特特定的人工智能应用为特色，目前有待获得监管机构的批准。新的投资建立在谷歌云在沙特阿拉伯的现有业务基础上，其中包括去年启动的达曼云区域，该区域是谷歌云目前全球40个区域…

微软在周三提交给美国证券交易委员会的文件中写道：我们对 OpenAI Global,LLC（简称OpenAI）进行了投资，并已承诺投资总额为 130 亿美元。在之前提交给美国证券交易委员会的文件中，微…

10 月 31日消息，据《科创板日报》今日消息，荣耀股改引入新一轮投资者，中国电信、中金资本旗下基金、基石旗下基金、特发基金，以及新一轮代理商投资平台（金石星耀）等机构加入。对于此轮融资，荣耀称…

只有形成智算云产业的自循环，中国云谷的建设才有意义。在《机器中的达尔文》一文中，塞缪尔·巴特勒提出了“机械王国”的理论：技术进化与生物进化的过程将多方面重合，但不会像生物进化漫长而平静，而是带有激烈且革命性的色彩。他不吝词藻描绘道：“如今机器被用来生

近日，腾讯音乐娱乐集团（Tencent Music Entertainment Group，简称 “TME”）与中兴通讯近日达成了一项具有重大意义的战略合作，这次的战略合作不仅包含音乐产品合作，也将在音乐AI…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.