滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

人工智能专家柏林森：德扑人机大战为什么人类还有赢的可能

时间：2017-04-13 11:42:59 来源：互联网编辑：星辉 发表评论无障碍通道

【导读】近日，备受全球德扑迷关注的“冷扑大师VS中国龙之队”德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆开启比赛。“冷扑大师”是基于卡内基梅隆大学Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统，这套系统将对阵由中国扑克高手杜悦带领的“中国龙之队”，这也是亚洲首度举办的人工智能与真人对打的扑克赛事。

4月10日上午，“冷扑大师VS中国龙之队”德州扑克人机大战表演赛结束了全部比赛，第九场龙之队依旧未能总分取胜，输了47343分。总战绩36000手牌，人类一共输了792327分，平均每百手损失22个大盲注。即使单看九个单场的比赛，人类牌手也未取一胜。

赛后几位龙之队的选手坦言，后半程他们其实已经发现了冷扑大师的一些规律性失误，所以成绩也有所提升，但可惜发现得有些晚。如果在进行几场较量的话，他们有信心取得单场比赛的胜利。

柏林森先生，信柏科技创始人/CEO、深海棱镜公司创始人，资深大数据和人工智能从业者，深度围棋、德州扑克爱好者，受邀作为新浪网的科学顾问和棋牌特约评论员出席了此次大赛。

【柏林森简介】柏林森，中国科学技术大学物理学学士，美国伊利诺伊大学电子及计算机工程硕士、物理学硕士，美国注册金融分析师(CFA)，美国精算协会准精算师(ASA)，在海内外知名企业从业二十多年。柏林森先生专长于海量数据处理、数学建模、时间序列预测、人工智能及其系统实现，自美归国后先后创建百分点科技、信柏科技、深海棱镜科技等大数据/人工智能公司，先后被评为中关村高端领军人才(高聚工程)、海淀区创业领军人才、中关村核心区文化创意产业十大最具网络影响力人物、中关村十大海归新星，北京大学零售业研究中心大数据专家讲师、中商联商业养老产业分会大数据分析专家，是国内大数据和人工智能实践领航者。

现场，针对此次德扑人机大战，柏林森先生在接受记者采访时进行了个人观点的阐述与解析：

记者问：李开复说德州扑克人机大战人类胜率有10%，而围棋是零，你怎么看?

柏林森答：我们假设真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变··6化，那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌，他能从你的行为中读出你的手牌是对3，而他拿着对A。那么这手牌，德扑之神肯定是“All IN”的。但河牌是有可能发出一张3的，最后输的是德扑之神。

围棋和德扑有本质上的区别，围棋是完全信息博弈，理论上有最优解。德扑是非完全信息，总是有概率的。德扑水平的较量要看长线收益，打得手牌越多，小概率事件所能造成的影响就越少。这次一共只打36000手，其实人取胜的概率比想象的大。

可能要跟柯洁下人机大战的AlphaGo当然还不是围棋之神，但他距离围棋之神的距离肯定比人类棋手近很多，人类棋手跟他下的胜率会很低很低。不过，在数学上0%并不代表着不能发生，只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候，我们都称之为奇迹。

记者问：听说冷扑大师没有用最近比较热的深度学习的技术?

柏林森答：冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里，理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样，人类和机器的输赢相加和为零，双方的目的都是为了赢其对手手里尽可能多的筹码。

我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到，如果我很均匀的按三种各1/3的概率出，那么无论对方怎么出，最后的结果肯定是胜平负各占1/3，而我不可能获得更差的结果。

如果对手只出石头和剪子，在我1/3策略不变的前提下，我的胜率还是1/3。但一旦我读到了对手的策略，做出相应的改变，那么对手的胜率将会大幅下降。所以对手的最优策略也应该各出1/3，这样能够保证自己的胜率不会低于1/3。

各出1/3就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布，而且是根据不同的牌面情况还是不同方式的剪刀石头布，冷扑大师就是要找出各个状态下不会输的策略。

具体到某个牌手，机器会通过数据分析牌手的策略，寻找其中的可利用性，加以打击。这也是为什么上一次冷扑大师与外国牌手人机大战，前面差距不大，后面人类越输越多的原因。

所以目前看来冷扑大师和深度学习暂时没什么太大关系。

记者问：我如果有足够的高手牌谱，是不是能用深度学习训练出德扑AlphaGo来?

柏林森答：不能。两者游戏的基本算法逻辑是有很大区别的。举个例子，两个高手打牌的各种操作，反馈到扑克游戏里，最后的结果可能并不一样，因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子，最后的结果是肯定的，不是黑胜就是白胜。从这种意义上讲，AlphaGo使用的那种棋谱学习的模式，是无法复制到德州扑克里的。

.........

记者问：听说人工智能会诈唬，它们学会骗人了?!

柏林森答：所谓诈唬就是在德州扑克比赛里，假装自己有大牌，把对方吓跑。我们忘掉诈唬这个词的表面意思，它其实就是德州扑克里的一个技术手段。除了诈唬，还有假装诈唬，假装假装诈唬，甚至一直无限的假装下去。

从数学的角度上讲，诈唬是在德州扑克游戏里获得更大收益的一种基础手段，只是在表现形式上看似是在“骗人”而已。对AI来说，诈唬和说实话没有本质的区别，只是在当前牌型和底池情况下，选择哪种策略会让它的长期收益更高而已。

冷扑大师会用诈唬的策略不是人为教给它的，而是告诉它德州扑克规则之后，它在演算过程当中自然而然形成的打牌策略，是这个游戏规则本身决定的。对人工智能来说，德州扑克是个数学问题，诈唬这种行为和加减乘除的之类数学符号没什么区别。

此外，作为新浪特约评论员，柏林森先生在现场也对冷扑大师的缔造者TuomasSandholm托马斯教授进行了专访。

观看专访视频：

http://video.sina.cn/sports/other/2017-04-09/detail-ifyeceza1691250.d.html?from=groupmessage&isappinstalled=0

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

12-19

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

12-19

宠物粮市场乱象频发，铲屎官如何为宠物选对粮？

据“趣解商业”了解，“源鲜”曾是网易严选、喵梵思等国产中高端品牌多次合作的代工厂，在不少养宠人心中有较高信任度；“源鲜”的塌房，再次挑动了许多养宠人的神经。 Erica还提到，宠粮本质上属于快消行业，并不是靠…

12-19

柔韧机器人：具身智能的新赛道与革命性突破？

相比于现阶段普遍使用的基于电机关节、金属材料、复杂传感器和精密加工工艺的“刚性”机器人技术，万勋科技通过使用软性材料与气/液驱动，以软材料仿生肌肉和神经元智能复刻人类肌肉柔韧特性，具备轻巧灵活、安全互动、易…

12-19

北京中关村科学城国际医谷开工，打造医疗健康产业集聚新高地

作为项目建设推进方，北京海新域城市更新集团相关负责人介绍，中关村科学城国际医谷项目将在产业链上游吸引顶尖研发机构和企业，汇聚创新源头力量；在中游通过公共技术服务平台降低研发门槛，助力创新的想法实施；在下游建…

12-19

《猎人克莱文》IGN仅评3分，高成本制作却换来低质口碑？

12-19

中兴通讯股价异动，公司称生产经营正常，无未公开重大信息影响股价

12-19

顺丰控股11月速运物流营收微增，供应链及国际业务增长超两成

12-19

澳门风情画轴展开，智界新S7穿梭其中成焦点

12-19

国产高端仪器新突破！首套高精度激光干涉仪测评装置研制成功

12-19

中国大陆TFT基Micro LED量产线点亮，新一代显示技术破茧而出！

12-19

字节跳动警示：勿盲从“豆包概念股”市场传言

三言科技12月19日消息，今日，字节跳动发布声明称，近期，资本市场出现炒作“豆包概念股”现象，流传着众多夸大其词甚至虚构内容。涉及字节跳动资本开支、数据中心花费、AI硬件、应用合作等多方面。字节跳动强调，投…

12-19

第十六届无锡新能源展盛启，27大项目签约，新能源装备之都蓄势待发！

12-19

极氪007猎装版路测谍照流出，圆润车身配空气悬架引期待

12-19

阿维塔06中型轿车2025Q2来袭，20万级主打珊瑚红，年轻范儿十足！

12-19

点击查看更多 +

全站最新

黑洞风狂飙！时速3600万英里，能否重塑宇宙星系新貌？

月亮对地球有多重要？《我们真的需要月亮吗》纪录片深度解读

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

iQOO Neo10 Pro：游戏玩家新宠，旗舰性能畅爽体验

国产DDR5新突破！光威金百达32GB套装仅需499元首发

热门内容

本栏最新

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

宠物粮市场乱象频发，铲屎官如何为宠物选对粮？

柔韧机器人：具身智能的新赛道与革命性突破？

北京中关村科学城国际医谷开工，打造医疗健康产业集聚新高地

《猎人克莱文》IGN仅评3分，高成本制作却换来低质口碑？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.