漫谈人工智能之二，Master粲粲如星，挥洒缚豪英

时间：2017-03-08 09:15:13 来源：创事记 作者：褚达晨 编辑：星辉 发表评论无障碍通道

国内的人工智能热很大程度上就是被AlphaGo炒起来的。机器围棋和哥德巴赫猜想、费尔马大定理一样，是一道举世公认的难题。围棋361个点，一盘棋的变化数目据说超过了宇宙中的原子数目，和其他博弈游戏相比是高出几十个数量级的差别。

在我看来，围棋规则异常简单：“交替落子，气尽棋灭”，却暗含宇宙中生命之妙。你看一个19路棋盘宛如苍茫大地，黑白棋从无而始，两支生命交替生长;中盘取势占地，扭杀守御，皆为棋子生存繁衍。一局终了，棋谱留世。围棋作为古人发明的智力游戏，妙处实不可言状。千万年后即使地球毁灭，外星来客若找到一张高手遗谱，我觉得他们大致可以探知人类当时所拥有的计算能力和智力水平。

AlphaGo的核心算法早已在Nature杂志上发表，解读的文章也很多。基本上就是说AlphaGo团队通过喂了狗狗几十万盘人类对局，让狗狗学会了下棋，到了一定水平后狗狗自己和自己下棋就能涨棋，水平会越来越强。

果然，2016年底升级版阿法狗——Master横空出世，在围棋网站上小试牛刀，战遍中日韩顶尖高手，求一败而不得。更为可怕的是60连胜棋谱传世之后，人类高手反复拆解，好像至今没有人敢说在60局中有某一局的某一个时刻人类棋手有过明显领先的时刻。从数学上讲，如果(60局棋)X(每局200步棋)X(每步可能的变化数)在这么大的概率空间里，人类高手都没有明确的获胜机会，那Master这个系统的水平和稳定性可谓深不可测。

作为深度围棋爱好者，让我震惊的是对局内容。去年AlphaGo和李世石的棋谱其实还比较循规蹈矩，就算被媒体追捧的第二局五路尖冲“外星招法”，其实也并不算太出格。今年Master的棋就不一样了，60局快棋中推翻人类棋手思维的下法简直俯拾皆是。比如序盘很早就点三三，习惯性尖冲无忧角，对人类已经沿用了几十年的“妖刀定式”“大雪崩定式”的彻底改造，等等，给很多围棋国手“要重新学围棋”的触动。打个比方，如果说去年的AlphaGo是集天下剑术之大成(毕竟刚刚从人类棋谱里学来)的高手，今年Master的感觉就已接近剑术通神的大师，手中无剑，天下万物为剑，飞花摘叶退敌千里。Master新年一出场，就是风清扬、扫地僧这样的世外高人范儿，轻轻松松饶天下英雄一先。

举个有点搞笑的例子，Master在对日本第一人井山的棋局中在右上角下出一步看起来很像初学者下出来的围空棋，人类研究后认为Master表示就这样随便下下就赢了，颇为推崇。事后替Master摆棋的“机器臂”黄士杰博士解释是他连续在电脑前摆那么多盘棋太累了，鼠标一滑摆错位置的结果。虽然有点尴尬，不过的确说明Master随便下下，中间打个盹歇一手也能追回来。

大师是怎样练成的?Master没有公开任何信息，外面基本上没有什么技术解读。作为业余爱好者，权且说说我的看法。

上一篇说了“深度子”的厉害，AlphaGo or Master不只是简单用到了深度学习技术，它用了两个“深度子”的乘法效应。具体而言，狗狗训练了两个深度神经网络，一个叫“策略网络”负责学习人类的“棋感”，就是通过人类棋谱猜测棋盘上哪几步是最有可能的“下一手”，帮助计算机剪枝，把宝贵的计算资源用在刀刃上。另一个“价值网络”负责做“形势判断”，就是计算在选用策略网络推荐 “下一手”时的获胜概率。这两个算法相辅相成，互相推动，产生了乘法效应。

狗狗的“棋感”一开始是跟人学的，但精确的形势判断能力是自己发展起来的。形势判断能力其实是下围棋的核心能力，这恰恰是人类的弱点和容易被忽视的地方。人类棋手在序盘和中盘用的“点目法”做形势判断的方法是非常非常粗糙的近似，无法和机器的量化方法(比如说把胜率精确到小数点后3位)抗衡。人脑其实剪枝能力超强，如果给予充分时间，高手也基本能把变化都算清楚，但是若是在选择下出对自己更有利的招法时犯糊涂，你说怎么下赢狗?

Master能通过“反人类思维”的招数战胜人类，是机器学习的一个巨大的进步!究其原因，一方面可能是过去一年狗狗在“价值网络”取得了大突破，在判断局势、把握局势走向的能力上远超人类，就是“控场能力爆表”。另一个方面，两个高水平狗狗双手互博，可以不断尝试超越人类“直觉”或者“经验”的选点，这样一些需要深度模拟才能推敲出来的好棋(比如人类需要反复推演30步才能得到的结论)，就会被Master挖掘出来。

这次Master在布局阶段走出了不少以前被人类否定的下法，就是说已经摆脱了人类棋谱的思维限制，开始探索未入之境。人类下棋其实有个问题，就是借助于经验的成分远远大于临场发挥的成分。比如说学习和记忆定式，最多考虑一个四分之一棋盘，但是狗狗是通盘全局考虑的，Master新的棋谱就很明显，左上角是黑子还是白子，无忧角还是大飞角，左下角选择的定式可能完全不同。这种“牵一发而动全身”的战法给人很多启发，有棋手说“美的让人哭”。如果说一开始狗狗通过打人类棋谱学棋，现在是人类通过向狗老师学习来探索围棋的奥秘了。

翻译成机器学习的语言，狗狗是从监督学习(照棋谱学习)进入了非监督学习(自由探索)的阶段，AlphaGo的设计者让程序具备了自我进化的能力。人工智能算法的提升依赖于高质量的数据，在任何领域，高质量的标注数据(比如说高手的棋谱)都是有限的，或者说生产速度很慢，成本很高。AlphaGo一旦能够自我产生高水平的新数据，还通过自我博弈不断提高自身水平，就相当于有了自我进化的能力。所以说领先的AI技术一旦确立优势，很有可能一骑绝尘，让后来者难以追赶。

举例来说，日本zen是一个有10年发展历史的老牌围棋程序。他们引入alphago的“策略网络”技术后，很快就提高到了职业水平，但是后面再提升好像有点难。目前世界第二应该是腾讯主力部队开发的“绝艺”，开发半年多现在已经到了去年AlphaGo战胜李世石的水平。虽然距离Master还有差距，我非常希望这个国产围棋程序能迎头赶上，让Master不再寂寞。

在一个商业领域，如果人工智能技术能在机制上能不断自行产生优质数据从而自我进化，那么别人后来居上的可能性也就大大降低，这可能就是全球顶尖互联网公司在人工智能领域做疯狂的军备竞赛的动因。

好了，Master“粲粲如星，挥洒缚豪英”的故事就说到这里。既然已经提到了AI商业化，下一篇就回到我工作的领域，谈谈人工智能和商业结合。

10月30日，备受瞩目的iQOO最新旗舰机——被誉为“性能之光”的iQOO 13在深圳震撼发布。该款机型由BOE(京东方)独供6.82英寸超旗舰2K LTPO直屏，行业首发搭载全新一代Q10发光器件，在画面表现、护眼舒适度及性能功耗方面均达到行业领先水准，并以“直屏超窄边”的设计为用

在当前市场上，千元级别的投影仪中，当贝Smart1和小明Q5 Pro无疑是两款备受瞩目的产品。它们各自凭借独特的特点和优势，赢得了用户的认可，今天就来说说这两款哪个是千元投影仪最好的?将从显示技术、系统性能、智能功能以及设计便携性四个方面，对这两款投影仪进行详细

双十一购物狂欢节持续进行中，各大电商平台与厂家，纷纷推出了超值优惠吸引消费者。与此同时，为了解锁PC的出色性能，DIY装备也成为了玩家们重点关注的对象。对此，小编带来了全新“ROG三神套装”：ROG RYUJIN龙神3代360 ARGB水冷散热器、ROG THOR雷神3代氮化镓1600W电

近日，法国巴黎的Pathé Palace影院顺利安装了六套三星Onyx LED电影屏，连同影院大厅内安装的8K显示屏“The Wall”以及遍布影厅周边的智能标牌共同构成了一个全面提升的观影环境，旨在为观众带来更加沉浸与便捷的观影体验。经过长达五年的全面翻新，Pathé Palace 影院

近来传的沸沸扬扬的“Hi MateBook”笔记本终于水落石出，WIKO官方正式认领该产品，并官宣该系列笔记本电脑定于10月31日正式发布，届时将推出Hi MateBook 14 和Hi MateBook D 16两款新品。作为入局笔记本电脑赛道的首秀，官方大秀了一把同微软的亲密关系，同时揭晓了两款

2024年10月,鲸语品牌首款开放式真无线耳机——鲸语Loki 正式上市!鲸语以创新性地“配饰化”形态,专为潮流人群和音乐数码爱好者开辟开放式耳机的全新风格领域,以叛逆玩家的姿态,打造出街的潮音单品。鲸语Loki售价159元,上市期间限时优惠仅需129元。各大电商平台鲸语旗舰

鉴于ROG键盘改装赛2.0受到热烈反响，ROG决定将此赛事的报名期限延长，新的报名时间为10月25日至12月15日(其中，12月15日为决赛日，而最终结果的公示则定于12月25日)。本次延长赛程为玩家提供了丰厚的奖励，除了一系列诱人的ROG产品外，还准备了ROG键盘礼包，内含夜魔专

八位堂64手柄，为Analogue 3D精心打造，拥有霍尔摇杆并且采用人体工学设计，外观上重现任天堂N64手柄经典元素。八位堂与Analogue携手为玩家们带来无与伦比的游戏体验，重返游戏的黄金年代。八位堂64手柄，在2024.10.21预售开启当天，引爆外网，突破八位堂预售首发历史记

从“无线通信公司”转型为面向新一代AI处理时代的“连接计算公司”，在过去很长一段时间以来，都是高通标榜自身的主基调，而今年在夏威夷茂宜岛如期举行的骁龙峰会，话题正是从这一基调展开。连接与计算，是通信技术与智能技术的代称，新一代AI技术席卷之下，一切用户体

京东11.11福利再次加码，为耳机音箱产品爱好者们带来了一场品牌爆款五折抢购活动，10月24日晚8点，多款热门耳机音箱产品将以真五折的价格震撼上线。对于广大游戏爱好者来说，一款优质的游戏耳机无疑是提升游戏体验的重要装备。ROG棱镜精英版游戏耳机，作为ROG系列的明星

宛如岁末星河初绽，11.11如期而至。身处这场专为甄选精品而设的璀璨盛典，众多广受赞誉的臻品如星辰竞相闪耀，为每个追求品质生活与卓越人生的用户带来入手心仪好物的良机。例如代表着现代智能化科技生活的三星商城，就在其「超级星动为AI狂欢」活动中，为三星Galaxy T

莲偶科技最新发布的夜视AR眼镜莲光Visual- N，作为全球首款星光夜视AR眼镜，以其独特的差异化定位赢得了广泛关注。这款眼镜不仅搭载了先进的8片特制玻璃透镜光学模组，实现了66°的超大视场角(FOV)，在底照度低至0.01lux的环境下依然能清晰呈现，识别距离更是覆盖从最近

松下更新的 LUMIX S5D是一款混合型全画幅无反相机，在视频和照片方面都有出色的表现，非常适合专业摄像师和日常摄影使用。我们在原先LUMIX S5 紧凑型设计的基础上，配备了大疆 LiDAR 自动对焦功能*。如今的LUMIX S5D 与大疆 LiDAR 测距模块及大疆 RS3 Pro 云台配对使用

随着无人机的广泛普及，它们正逐渐融入智慧城市的各个领域，悄然改变着城市的建设与监测方式。相较于传统人力高空作业的高风险与低效，无人机以其独特的优势，不仅规避了人工操作的潜在危险，还降低了城市更新过程中如路网规划、自动化巡逻及风力发电机维护等关键任务的

在如今的用户购机需求中，性能是很多用户的第一需求，毕竟大家都经历过买的手机用了没多久就卡顿、不流畅的情况。原因有很多，很多的原因是你买的手机是入门款而不是旗舰手机，所以购机尽量买旗舰款，功能和配置都是top级别的。就比如刚刚发布没多久的vivo X200，不仅搭

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.