ITBear旗下自媒体矩阵:

吴甜解密百度语言与知识技术平台全貌 每日调用量超千亿

   时间:2019-07-04 19:19:28 来源:互联网编辑:星辉 发表评论无障碍通道

在7月3日的“Baidu Create 2019”百度 AI开发者大会上,百度首席技术官王海峰博士正式发布了百度大脑5.0。这可以说是百度大脑史上最具跨越性的一次重磅升级,在算法创新、AI计算架构层面均实现重大突破。当天下午,百度大脑分论坛如期举行。众多百度技术大佬们在两个半小时内悉数登场,解密十余项AI前沿技术的最新进展。

其中,百度AI技术平台体系执行总监吴甜围绕百度语言与知识技术的整体布局,做了详细介绍。语言方面,百度大脑推出知识增强语义理解框架ERNIE,以及兼具高准确、低时延的机器同传技术;知识方面,全面解析基于百度知识图谱技术的视频语义理解能力。同时,重磅推出行业知识图谱平台和智能创作平台2.0两大应用级平台。

核心算法全面升级 保持业界领先水平

在语言与知识技术中,语义理解是重要的基础之一。吴甜介绍了近期百度大脑在语义理解上的重要突破,推出基于知识增强的语义理解框架ERNIE。“不仅在学术界的公开数据集上,ERNIE也一直在百度实际的应用中展现实力,比如智能问答、CPR预估、文本润色、对话理解等等,”吴甜说到。截至目前,ERNIE已经学习了超10亿知识。由此,ERNIE全面刷新中文NLP任务的效果,成为业界效果最好的语义理解框架,帮助AI更深度地理解真实世界。

C:\Users\XINYAN~1.HUA\AppData\Local\Temp\WeChat Files\0ae8a01d43017a61fa15022cbfc3487.jpg

机器同传方面也有最新进展,在翻译过程中对语音识别结果进行纠错的联合词向量编码技术,可解决翻译一致性和连贯性问题的语篇翻译模型等,结合先进的语音技术,百度大脑实现了高准确、低时延的端到端机器同传技术。在本次大会上,现场听众扫描二维码,即可通过手机同步收听机器同传流畅、自然播报的声音,获得沉浸式体验。

知识,能帮助AI更深度地理解真实世界。在主论坛中,王海峰用近期热映的音乐纪录片《大河唱》,形象展示了融合百度知识图谱技术的视频语义理解能力。该技术通过对视频的多模态知识解析,在多元异构知识图谱上建立关联,并通过计算推理,建立对视频的深度语义理解。

解密百度语言与知识技术平台全貌

百度在语言与知识技术方面的重大更新,依靠的是在该领域的长期积累。现场,吴甜展示了百度语言与知识技术开放平台的全景图,其中不仅有丰富的基础技术,还有包括翻译开放平台、UNIT平台、行业知识图谱平台和智能创作平台在内的4个应用级平台。

“从使用规模、便捷性和价值来看,这是NLP和知识技术大生产平台。”吴甜这样介绍百度语言与知识技术开放平台。30多项技术供给,多样、灵活、可定制的服务方式,多套场景技术方案以及全面领先的多语言与知识技术,包括最好的中文语义理解框架ERNIE以及最大的多元语义知识图谱等,使得平台具有很好的便捷性价值。目前,平台日均调用量达千亿级,吸引了20万开发者,综合规模巨大。今年,百度基于飞桨(PaddlePaddle)平台正式开源了百度多年积累的中文NLP工具和数据集Paddle NLP,吴甜表示,Paddle NLP的发布是开源、开放、大生产平台阶段一个重要的里程碑。

应用级平台再升级:行业知识图谱、智能创作2.0

在吴甜的发言中,两大应用级平台的重磅新发布作为压轴戏登场,一是行业知识图谱平台,二是智能创作平台2.0。

行业知识图谱平台基于领先的知识图谱核心技术,提供智能高效的知识生产流程、低成本启动和跨行业迁移的能力,帮助产业开发者定制行业知识图谱并应用。

行业智能化的大量需求,对行业知识的积累和应用带来了巨大的挑战。后者的知识构建通常需要领域专家参与,而传统知识图谱耗时、耗力、成本高。吴甜进一步解释道,百度打造了行业知识图谱平台,旨在能通过百度自身积累的知识图谱技术,实现行业知识自动获取和应用,助力企业实现智能化升级。百度行业知识图谱具有深入复杂和专业两大特点,且具备迁移学习能力,低成本启动,能帮助产业开发者定制行业知识图谱并应用。

同时,吴甜还向现场观众介绍了升级后的百度大脑智能创作平台2.0。如果说去年百度世界大会上发布且在今年4月完成能力全面开放的智能创作平台1.0,是让创作者从枯燥和繁忙的“赶稿”日常中解放出来,那么2.0版本塑造的是更智能、更贴心的自动创作服务。据吴甜所说,智能创作平台2.0具有三大特点。

一是实时热点关联丰富素材,以知识图谱为基础,提供热点事件、热词关联和事件脉络等不同角度的素材,包含文本、图片、视频等多种模态,为创作者提供新鲜、实用的创作灵感和素材支持,让撰稿者不再谈“热点”色变。二是全面的创作辅助能力,该平台提供了全面的创作辅助能力,例如快速创作时效性内容的自动创作功能、帮助创作者优化文字细节的纠错和润色功能、在发布内容前补充信息的自动标签和摘要功能等。三是领先的多模生成技术,以短视频为例,多模态是内容创作的重要趋势。综合利用百度视觉、语音、文本的多模态理解能力,百度研发了自动根据图文创作视频,以及根据视频创作图文的先进技术。这些技术可以帮助创作者高效完成多种模态的内容生产。

语言与知识技术是机器与人交流、理解真实世界的重要基础,百度大脑在此方面的系列创新,拉近了人与机器的距离。在最后,吴甜在大屏幕上用了“突破创新、开源开放、智见未来”十二个大字,结束了她的演讲。这也是百度在语言与知识技术领域的长期发展目标,将持续为开发者和相关领域提供更好的技术支持。

从该场论坛来看,百度大脑5.0已经打通了从基础层的深度学习技术到通用AI能力、应用技术方案,再到定制化模型,以及最终的部署和集成,整个人工智能产业化应用落地的全部流程,实现了AI技术的标准化、自动化和模块化。而这股打通“任督二脉”的“神功”,百度正在开放给更多开发者,希望大家都能平等便捷地获取AI能力,加速产业智能化进程。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version