AlphaGo新版本问世：自学40天就能胜赢柯洁的版本

时间：2017-10-19 08:56:13 来源：网易科技编辑：星辉 发表评论无障碍通道

10月19日消息，专注于推进人工智能(AI)研究的谷歌子公司DeepMind今天发布了一款新版本的AlphaGo程序，它能通过自学玩转多种游戏。这套系统名为“AlphaGo Zero”，它通过一种名为“强化学习”的机器学习技术，可以在与自己游戏中吸取教训。

仅三天时间，AlphaGo Zero自行掌握了围棋的下法，还发明了更好的棋步。这期间，除了被告知围棋的基本规则，它未获得人类的帮助。随着AlphaGo Zero被不断训练时，它开始在围棋游戏中学习先进的概念，并挑选出一些有利的位置和序列。

经过三天的训练，该系统能够击败AlphaGo Lee，后者是去年击败了韩国选手李世石(Lee Sedol)的DeepMind软件，胜率是100比0。。经过大约40天的训练(约2900万场自玩游戏)，AlphaGo Zero击败了AlphaGo Master(今年早些时候击败了世界冠军柯洁)。

旧版AlphaGo接受的训练是，观摩由实力强大的业余或专业棋手对弈的海量棋局。但AlphaGo Zero没有获得这样的帮助。它自我对弈数百万次，并从中学习。一开始，它只是随意把棋子放在棋盘上，但后来它发现了获胜的策略，棋艺就快速提升了。

AlphaGo的首席研究员大卫·席尔瓦(David Silver)表示，“由于未引入人类棋手的数据，AlphaGo Zero远比过去的版本强大，我们去除了人类知识的限制，它能够自己创造知识。”

AlphaGo Zero通过“强化学习”这一程序来积累技能。当AlphaGo Zero走出一步好棋，它更有可能获胜。若这步棋没走好，它输棋的概率变大了。

这一程序的核心是一组连在一起形成人造神经网络的 “神经元”。对于棋局的每个回合，神经网络会观察棋子在棋盘上的位置，并推算接下来的棋步以及这些棋步让全盘获胜的概率。每次对弈后，它会更新神经网络，让棋艺更精进。虽然性能远胜于以前的版本，但AlphaGo Zero是一个更简单的程序，掌握棋法的速度更快，接受训练的数据更少，使用的电脑更小。席尔瓦表示，如果拥有更多的时间，AlphaGo Zero还能够自己学会围棋规则。

研究团队在《自然》杂志上发表的文章写道，一开始AlphaGo Zero的棋艺糟透了，后来它逐渐成为一名缺乏经验的业余棋手，最终进阶为围棋高手，能够走出极具战略性的棋步。这些进步仅花费了几天时间。最初10小时内它就发现了一个定式。随后不久它又领悟了一些棋法。三天后，AlphaGo Zero发现了人类专家正在研究的全新棋步。有趣的是，程序在发现更简单的棋步之前就早已掌握了一些复杂棋步。

这一进展标志着通用型AI发展的大一里程碑。除了下棋赢过人类，通用型AI能做更多事情。由于AlphaGo Zero能够从一无所知实现自学成才，如今其天赋可以在诸多现实问题上派上用场。

AlphaGo Zero正在研究蛋白质如何折叠的问题，这是一个艰难的科学挑战，不过有望成为药物发明的一大突破。

(丹米斯·哈撒比斯)

DeepMind的CEO丹米斯·哈撒比斯(Demis Hassabis)表示，“对我们来说，AlphaGo不仅限于在围棋对弈中获胜，这也是我们开发通用算法的一大进步。”大多数AI被认为“用途有限”，因为它们只能执行单一任务，例如，翻译、识别面孔。但通用型AI在许多不同任务上拥有超越人类的潜能。哈撒比斯认为，在接下来十年，AlphaGo的迭代产品将成为科学家和医学专家，与人类并肩工作。

此外，AlphaGo Zero比它的许多前辈都要高效得多。AlphaGo Lee需要使用几台机器和48个谷歌张量处理单元机器学习加速器芯片，该系统的早期版本AlphaGo Fan需要176个GPU。而AlphaGo Zero和AlphaGo Master一样，只需要一台机器和4个TPU。(惜辰)

10 月 31 日消息，科技媒体 Android Headline 昨日（10 月 30 日）发布博文，展示了 One UI 7系统的诸多新功能 / 新特性，涵盖了新版图标、智能通知管理、作业帮助、家长控制…

同时，在中国三星多产融合模式和可持续发展理念的启发下，杨维娜等创领者不仅利用废弃青柿子打造了现代化柿子漆生产线，还研发出了一系列柿子深加工产品，并致力于柿染文化的传承，从而带动了富平整体文旅产业生态的提升，为…

截至2024年8月31日，滔搏全国门店直播账号数量突破300个，公司在抖音平台的直播销售额跻身平台运动户外榜第一。目前，双方已经携手开启了美国百年经典运动品牌Mitchell& Ness在国内的运营，在香港…

案例中的Imrich Molnár利用Mole3D扫描仪+3D打印机为朋友制作手臂康复辅具，相较于传统的依赖医生个人经验和手工制作的方式，其一，辅具精度更高、更贴合患者手臂，舒适度也更好;其二，手臂康复辅具…

基于先进的材料技术和三十多年的车灯防水透气应用经验，戈尔公司(W.L.GoreAssociates)向业界发布《车灯凝露解决方案白皮书》。该白皮书深入分析了车灯凝露现象的成因，并提出了应对汽车电动化和智能化趋势下的车灯凝露管理解决方案，以助力行业应对新挑战，推动汽车照明

作为Hi MateBook 系列新品，Hi MateBook 14与Hi MateBook D 16 通过差异化定位，满足了用户对于移动办公和高效办公的个性化需求，同时，也彰显了该系列杰出的共性，在信号、跨…

近日，第12届百度奖学金正式启动申报。百度奖学金面向全球范围内计算机领域的优秀华人学生进行评选，10位获奖者每人将获得可自由支配的20万元人民币奖学金。在全球人工智能技术快速发展的背景下，AI已经成为推动经济创新与社会进步的关键因素。随着国际间在AI领域的竞争

随着AI浪潮的到来，钉钉在产品与服务中融入了AI技术，通过打造AI PaaS平台，将技术与场景深度融合，丰富交互对象与形式，提升企业工作效率。此次获奖，不仅是对钉钉内部团队数字化、智能化管理实践价值的肯定，…

这种特性极大地简化了物联网开发的复杂性，让开发者能够更加专注于应用场景和功能的创新。活动现场还举行了华为云物联网开发者认证的考试，充分激发同学们的学习热情，认证课程学习与考试不仅提升了他们的专业技能，也为未来…

相较于同业公司，公司的主要优势有：（1）网络可视化的技术积累和场景经验；（2）和上游CPU和GPU芯片厂商的深度合作基础；（3）具备高性能和国产化算力集群的交付、组网、调优经验，模型代训能力。分析指出，恒为…

快科技10月31日消息，据媒体报道，近日有多名消费者在黑猫投诉、小红书等平台反馈称，在李佳琦直播间花200多元抢原价599元的正品耐克鞋，到手后发现了溢胶、开线、线头多等诸多瑕疵。大量消费者表示，自己在李佳…

快科技10月31日消息，博主数码闲聊站爆料，联发科天玑84000基于台积电4nm制程打造，首发Cortex-A725全大核架构，安兔兔跑分在170万-180万之间，作为对比，骁龙8 Gen2跑分在160万左右…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.