距终极梦想更近一步！百度全新PLATO-2展现开放话题人机嗨聊新高度

时间：2020-07-08 14:11:26 来源：互联网编辑：星辉 发表评论无障碍通道

人与机器在开放领域自由对话这一终极理想，又迎来重大进展。近日，百度全新发布了超大规模模型PLATO-2，在承袭PLATO模型运用隐变量进行多样化回复生成特性外，模型参数规模上升到16亿!能够就开放话题和人类流畅嗨聊。在对话演示中，PLATO不仅能深聊“去吧去吧，学会了游泳带我一起”，还会小腹黑“你不怕我把你扔河里么?”，朱朝阳看了都直呼专业。

这样的优秀效果同样反映在公开数据集的测试中，评估结果显示百度PLATO-2的对话效果全面超越了今年谷歌发布的26亿参数模型Meena，以及Facebook发布的27亿参数模型Blender，以更少样本达成了更优的效果。而在中文对话中，更是与微软小冰拉开了极大差距，这无疑意味着百度PLATO-2将对话智能提升到了全新高度。

$C:\Users\lingmiao.yan\Desktop\1.jpg$

左图为PLATO-2中文对话演示，右图为《隐秘的角落》剧照

如今，智能对话正以肉眼可见的速度成为人们热爱谈论的话题，不管是《向往的生活》里的国民机灵鬼小度，或者是手机里随叫随到的“hi，siri!”，我们越来越习惯以语言来和机器进行沟通。但不论是家庭、或是手机端，当下有明确功能性的智能助手对比真正能与人类在开放话题中自由对话仍然有差距。

针对这一问题，近年来，基于大量语料和超大规模预训练模型的对话生成技术取得了非常多喜人进展，如谷歌Meena、Facebook Blender等模型依托数十亿级的参数和语料，已能模拟生成与人类非常相近的对话。

但是，庞大的对话语料下隐藏着丰富的信息，同样的对话语境可以有多种不同的回复，这样“一对多”问题是当前对话系统面临的一个重要难点。我们知道，人与人的对话不仅与上下文相关，也和背景知识相关，不论是个人属性、知识背景、或是价值观、情绪状态等。但每段对话背后，对话者的背景知识是模型训练中难以获取的，这就给训练带来了很大噪音。如谷歌Meena、脸书Blender等一般的编码-解码神经网络不论结构多复杂，仍然是一个“一对一”的函数，直接应用很容易产生大量“哈哈，不知道”这类的安全回复。

针对这一问题，百度去年发布的PLATO模型和微软近期发布的OPTIMUS模型中都提到了运用隐变量来建模这种不可见多样性的方法。百度PLATO更独特地采用了离散隐变量建模，运用多样化生成 + 合适度判断的方式，在三个不同各类型的公开数据集上均取得了SOTA效果。

此次公布的PLATO-2, 是百度在PLATO工作基础上的进一步扩展，通过扩展网络增加训练数据集，模型的参数规模扩展到了16亿。同时，PLATO采取了课程学习的方法，解决大规模参数隐变量网络训练的计算消耗问题，逐步优化参数、加快训练效率。

PLATO-2模型结构简图

这样大体量的模型训练，离不开百度深度学习平台飞桨强大的并行能力支持。PLATO-2包含中英文两部分模型。其中，中文模型在12亿中文开放域多轮对话数据集上进行训练，而英文模型则在7亿英文开放域多轮数据集上训练。PLATO-2训练耗费了64张V100卡共3周的时间，依托了飞桨强大并行能力，包括Fleet并行库和Recompute等扩展显存的方式。单个Batch包含52万Token，训练过程中约进行了30万次梯度回传。

为了验证模型效果，百度对PLATO-2进行了全面的静态和动态评估。静态评估为利用现有对话从上文预测下文，以及人机对话、两个模型相互对话形式的中英文动态评估。评测结果显示，百度PLATO在动态和静态评估中均明显超越了微软DialoGPT, 谷歌Meena和Facebook Blender模型。更在中文上，与微软小冰在连贯性、信息量、吸引力、人性化

等维度拉开了极大的差距。

在对话演示中，也可以明显看出PLATO不仅在对话内容丰富度上提升明显，还能够就一个话题深入聊天并扩展到相关话题。而此前的最佳模型Blender，则会频繁地转换话题。

PLATO-2英文对话演示和Blender使用相同对话种子对比

基于PLATO-2在对话内容的丰富度和连贯性上展现出了来的高度，有望为智能对话开辟出全新的领域。此外，百度POLATO-2相关英文模型和代码将在Github中陆续开放，中文模型未来也将开放接口服务。也期待在全球领军AI企业的共同努力下，我们将离人机自由对话的终极梦想更近一步。

更多信息请参考：https://github.com/PaddlePaddle/Knover

HUAWEI Sound X4共推出了悦动白和韵律黑两种配色，从外观上看，HUAWEI Sound X4保持了此前圆润的设计，并且支持智慧幻彩灯效，其采用了48颗全色系RGB灯360°环绕，光影能够追随音乐…

在数字经济的驱动下，零工经济正以前所未有的速度崛起，截至2023年底，我国灵活就业人口已达2亿人，这一数字不仅彰显了零工经济的蓬勃生机，也预示着未来就业形态的新趋势。身边云作为中国领先的共享服务平台，致力于为企业用工模式转型提供数字化工具，根据行业性质及

基于对Agentic Al时代来临的笃定，孙涛勇表示微盟将“紧跟AI技术发展，All inAI"，并从”AI+SaaS（助力SaaS商家智慧经营）、AI+营销（AI驱动智慧营销降本增效）、To B（提供个…

IPO前，Tang Li（唐莉）博士直接持有华昊中天约1.03%已发行股本，而BaygenQTInc.、北京北进缘、珠海华欣、珠海华锦、珠海京蓉及珠海华蓉（均由TangLi（唐莉）博士控制）则合计持有华昊中…

截至2024年4月30日，傲基科技持有的现金及现金等价物为9.38亿元。 IPO前，陆海传（直接及透过乐清傲基成长肆号（由陆海传控制的实体））及迮会越分别于公司已发行股本实益拥有19.43%及11.22%，…

活动现场，DeepWay深向营销公司总经理张晓帅在都江堰相关领导、徐上上及李波的见证下，将象征100台DeepWay深向换电重卡的“车钥匙”郑重交付给鑫程辉物流总经理邓锐。四川鑫程辉物流有限公司董事长李波…

对此，京东11.11针对黄金品类升级包括“双十赔付”“假一赔四”“材质保障”“克重无忧”等四大服务保障，通过提供高于行业的服务保障全方位守护消费者权益，并在京东11.11带来了造型可爱寓意好运的狗头金10元/…

事实上,知乎数亿用户群体涵盖各行业领域专业人士,积累了海量专业文献的问答、查询、讨论需求。本次知乎直答专业搜索升级的中文文献数据库,同步集合在“知识会员”中,用户可以通过专业搜索和知识会员两个不同场景和路径,…

同样低价的还有阿迪达斯男子跑步系列DURAMO 10跑步鞋,京东现货到手价199元,对比某平台549元的预售价,超300元的差价快够再买两双鞋了;而耐克NIKE空军1号休闲鞋,京东现货到手价仅需599元,某…

这一举措是微软于 2023 年 11 月推出的“安全未来计划”的一部分，旨在增强其产品的网络安全保护。IT之家从报道中获悉，此项变更将于2024 年 12 月 2 日起影响所有新租户，并于 2025 年 …

10 月 31 日消息，科技媒体 Android Headline 昨日（10 月 30 日）发布博文，展示了 One UI 7系统的诸多新功能 / 新特性，涵盖了新版图标、智能通知管理、作业帮助、家长控制…

同时，在中国三星多产融合模式和可持续发展理念的启发下，杨维娜等创领者不仅利用废弃青柿子打造了现代化柿子漆生产线，还研发出了一系列柿子深加工产品，并致力于柿染文化的传承，从而带动了富平整体文旅产业生态的提升，为…

截至2024年8月31日，滔搏全国门店直播账号数量突破300个，公司在抖音平台的直播销售额跻身平台运动户外榜第一。目前，双方已经携手开启了美国百年经典运动品牌Mitchell& Ness在国内的运营，在香港…

案例中的Imrich Molnár利用Mole3D扫描仪+3D打印机为朋友制作手臂康复辅具，相较于传统的依赖医生个人经验和手工制作的方式，其一，辅具精度更高、更贴合患者手臂，舒适度也更好;其二，手臂康复辅具…

基于先进的材料技术和三十多年的车灯防水透气应用经验，戈尔公司(W.L.GoreAssociates)向业界发布《车灯凝露解决方案白皮书》。该白皮书深入分析了车灯凝露现象的成因，并提出了应对汽车电动化和智能化趋势下的车灯凝露管理解决方案，以助力行业应对新挑战，推动汽车照明

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.