人工智能专家森:德扑人机大战为什么人类还有

2021-01-20 11:40
和记娱乐 来源:和记h88
原创

 

  【导读】近日,备受全球德扑迷关注的“冷扑大师VS中国龙之队”扑克人机大战表演赛在海南生态软件园传奇智力运动馆比赛。“冷扑大师”是基于卡内基梅隆大学Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限扑克人工智能系统,这套系统将对阵由中国扑克高手杜悦带领的“中国龙之队”,这也是亚洲首度举办的人工智能与真人对打的扑克赛事。

  4月10日上午,“冷扑大师VS中国龙之队”扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。

  赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。

  森先生,信柏科技创始人/CEO、深海棱镜公司创始人,资深大数据和人工智能从业者,深度围棋、扑克爱好者,受邀作为新浪网的科学顾问和棋牌特约评论员出席了此次大赛。

  【森简介】森,中国科学技术大学物理学学士,美国伊利诺伊大学电子及计算机工程硕士、物理学硕士,美国注册金融分析师(CFA),美国精算协会准精算师(ASA),在知名企业从业二十多年。森先生专长于海量数据处理、数学建模、时间序列预测、人工智能及其系统实现,自美归国后先后创建百分点科技、信柏科技、深海棱镜科技等大数据/人工智能公司,先后被评为中关村高端领军人才(高聚工程)、海淀区创业领军人才、中关村核心区文化创意产业十大最具网络影响力人物、中关村十大海归新星,大学零售业研究中心大数据专家、中商联商业养老产业分会大数据分析专家,是国内大数据和人工智能实践领航者。

  森答:我们假设真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变··6化,那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3,而他拿着对A。那么这手牌,德扑之神肯定是“All IN”的。但河牌是有可能发出一张3的,最后输的是德扑之神。

  围棋和德扑有本质上的区别,围棋是完全信息博弈,理论上有最优解。德扑完全信息,总是有概率的。德扑水平的较量要看长线收益,打得手牌越多,小概率事件所能造成的影响就越少。这次一共只打36000手,其实人取胜的概率比想象的大。

  可能要跟柯洁下人机大战的AlphaGo当然还不是围棋之神,但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低。不过,在数学上0%并不代表着不能发生,只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候,我们都称之为奇迹。

  森答:冷扑大师用到的是一种叫做CFR(Countectual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里,理论上是都存在纳什均衡点的。这次人机大战的扑克单挑赛制就是这样,人类和机器的输赢相加和为零,双方的目的都是为了赢其对手手里尽可能多的筹码。

  我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到,如果我很均匀的按三种各1/3的概率出,那么无论对方怎么出,最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果。

  如果对手只出石头和剪子,在我1/3策略不变的前提下,我的胜率还是1/3。但一旦我读到了对手的策略,做出相应的改变,那么对手的胜率将会大幅下降。所以对手的最优策略也应该各出1/3,这样能够自己的胜率不会低于1/3。

  各出1/3就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把扑克理解为一个复杂了无数倍的石头剪刀布,而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略。

  具体到某个牌手,机器会通过数据分析牌手的策略,寻找其中的可利用性,加以打击。这也是为什么上一次冷扑大师与外国牌手人机大战,前面差距不大,后面人类越输越多的原因。

  森答:不能。两者游戏的基本算法逻辑是有很大区别的。举个例子,两个高手打牌的各种操作,反馈到扑克游戏里,最后的结果可能并不一样,因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子,最后的结果是肯定的,不是黑胜就是白胜。从这种意义上讲,AlphaGo使用的那种棋谱学习的模式,是无法复制到扑克里的。

  森答:所谓诈唬就是在扑克比赛里,自己有大牌,把对方吓跑。我们忘掉诈唬这个词的表面意思,它其实就是扑克里的一个技术手段。除了诈唬,还有诈唬,诈唬,甚至一直无限的下去。

  从数学的角度上讲,诈唬是在扑克游戏里获得更大收益的一种基础手段,只是在表现形式上看似是在“”而已。对AI来说,诈唬和说实话没有本质的区别,只是在当前牌型和底池情况下,选择哪种策略会让它的长期收益更高而已。

  冷扑大师会用诈唬的策略不是人为教给它的,而是告诉它扑克规则之后,它在演算过程当中自然而然形成的打牌策略,是这个游戏规则本身决定的。对人工智能来说,扑克是个数学问题,诈唬这种行为和加减乘除的之类数学符号没什么区别。

  此外,作为新浪特约评论员,森先生在现场也对冷扑大师的缔造者TuomasSandholm托马斯教授进行了专访。

  特别提醒:本网内容转载自其他,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容您的权益,请及时联系我们,本站将会在24小时内处理完毕。

  8月12日,BCS 2020安全运营中心建设与发展高峰论坛成功召开。论坛邀请到中国电子信息产业发展研究院...

  8月11日下午,有着网络安全行业“达沃斯”之称的网络安全大会(以下简称BCS 2020),正...

  8月12日,腾讯发布二季报,数据显示,2020年上半年实现收入1148.83亿元,同比增长29%;Non-IFRS净利润301...

  8 月 12 日消息,据国外报道,在此前的报道中,外媒曾提到在 5G 智能手机处理器方面有很大进展...

  据外媒报道,一款型号为XT2081-2的摩托罗拉手机出现在FCC认证网站上。虽然该网站没有透露手机的营销...

  近日,全场景智慧零售服务商苏宁易购与全球化监测和数据分析公司尼尔森联合发布首份零售行业5G应用发...

  8 月 12 日消息,据国外报道,为苹果等公司代工芯片的台积电,近几年在芯片制程工艺方面走在行...

  8 月 12 日消息,京东宣布全资控股五星电器,成立新公司拟定名为京东五星电器集团有限公司。

  8月12日,2020网络安全大会(BCS 2020)技术峰会正式召开。来自中、美、以等全球的网络安全技...

  8 月 12 日消息 据 Business Korea 的最新报道,三星的目标是通过与 ARM 和 AMD 合作,成为第一大 A...

  作为Redmi的旗舰产品,Redmi K30 Pro因60Hz AMOLED屏成为不少米粉心中的小遗憾。

  Facebook 最近又面临一项新的,称该公司非法收集用户的生物识别数据。这次诉讼的对象是 Faceboo...

  据外媒消息,一加将于10月初推出一加Nord新配色——尘灰色(Gray Ash)。

  在了各种认证信息后不久,Realme 已将向印度市场投放 C12 和 C15 入门新机。早些时候,售价...

  TCL 发布了最新一代 5 系列和 6 系列 Roku 电视,其中 6 系列电视最大特点是有 Mini LED 显示背光技...

  携手AWS,Nutanix Clusters支持应用云间无缝迁移及统一操作,助力企业加速云上旅程

  关于可折叠 iPad 的讨论已经在进行中,有传言称该平板电脑的显示尺寸与 MacBook 相当。今天,推特爆...

  非结构化数据正以前所未有的速度增长。IDC的预测表明,到2025年,全球将有80%的数据结构化的。...

  暑假过半,考研复习进入关键时期。考研是一项全靠主观能动性的学习,调整好复习状态固然重要,但学...

      和记娱乐,和记h88,h88平台官网