成都超玥智博教育科技有限公司

中国国际象棋协会战略合作伙伴

当前位置: > 新闻详情

王玥老师的纯干货6——与死神共舞的人工智能(深度思考)

发表时间:2019-07-02 16:25


*国际象棋是一门充满变幻的项目,下面所有内容皆为个人观点且有时效性,如觉不适还请谅解。(文末有AlphaGoZero与StockFish的对抗赛讲解视频获取方法,请仔细阅读)

大家好,这两天被中国国际象棋杂志要重新出版的事情刷屏了,纸质媒体确实已经没落了很多年了,作为一个从小看着杂志长大的小棋手,也希望这次前辈们在长沙的探讨能够带给杂志一个更好的未来。这段时间有点懒,事情也多,看到了这个消息,我又手痒了,想写点东西。当然这一篇并不是一篇传统意义上的“技术”文章,更多的是我对未来国际象棋发展的一些展望,以及人工智能思路AI的理解,如果可以给各位一些启发,那我深感荣幸。


微信图片_20210731102333.jpg


言归正传,前段时间从美国回来,看了不少新鲜事物,也唤起了我对“未来”这个话题在之前的一些思考,关于人工智能(AI)在智力领域上的种种想法。相信这也是一个大家都多多少少有些关心的概念。

虽然目前AI还没有达到普及人类生活方方面面的地步,但在某些领域,AI已经超越了人类,象征着世界最强实力。

其中,AI在智力运动领域的攻击力量已经达到了侵略的地步,可能我们国内对AI在智力运动上的了解大多来自于2017年AlphaGoMaster战胜了世界第一的世界围棋冠军柯洁,当时由于媒体的高度关注,全国上下火爆一时;现在,无论是围棋、国际象棋、中国象棋,甚至是五子棋,你都可以随意打开手机上的应用商店找到与之相关的引擎应用。

今天我要和大家聊的话题,起源于AI,但更加关注的是我们人类自己。

先说说这几年我一直都在关注的智力运动类AI—AlphaGo,这个软件的开发者叫戴密斯·哈萨比斯,他4岁开始下国际象棋,13岁就获得了国际象棋大师称号,对智力运动本身保持着高度热爱。他的团队选择开发以围棋对弈为主的AlphaGo,是因为围棋是所有棋类中计算量最大的一种,不同于国际象棋,它基本上算是一项零和博弈,没有办法去产生和棋,棋子也似乎没有分值,不存在类似于国际象棋中最优结果(和棋)的出现;一直被认为是计算量大到计算机没有办法攻克的一个领域。

在开发完成第一版本的AlphaGo后,软件就战胜了法国围棋队总教练樊麾;此后更新的第二版本和第三个版本分别战胜了世界围棋冠军李世石、柯洁;现在最新的版本是第四代AlphaGoZero,在围棋对弈上已经能做到随意秒杀前三代,之所以开发团队把它命名为“0”,是因为第四代阿尔法狗学习任何游戏都可以从零开始。

我们可以来简单看一下AlphaGoZero发布会上公布的视频片段,看看它的学习能力有多么可怕。


微信图片_20210731102443.gif

“0”代的100场表现

起先的100场游戏中,“0”代根本不知道自己在控制什么,甚至连游戏目标都不知道,多半也接不到球。


微信图片_20210731102447.gif

“0”代的200场表现

在游戏进行到200场时,“0”代已经开始掌握窍门,它发现应该让短棍更靠近球。


微信图片_20210731102548.gif

“0”代的400场表现

经过近400场游戏后,“0”代的游戏技巧已经达到了高度熟练,几乎每次都能接到球。

微信图片_20210731102552.gif

0”代的600场表现

接着“0”代又完成了200场游戏,惊人的画面出现了,它发现了最佳策略,就是沿着墙壁边缘挖隧道,让球在砖块和墙壁之间来回弹。

那么问题来了,挖隧道大家都能看得懂,但是“0”代控制短棍的极限操作是否能让人类去掌握?

来看一个AlphaGo与游戏相关的话题;今年年初,在《星际争霸2》游戏中AlphaStar(阿尔法星际)与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。

我简单的看了一下AlphaStar在比赛中的实况,那操作简直变态,能用三个兵守住的关口,它绝对不会用四个兵去守,什么时候去造兵营,什么时候去挖矿,所有即时战略计算得几乎分毫不差,还有完成这些操作所需要的时间几乎可以忽略不计。在这种状态下,人是几乎不可能战胜它的,首先你发送指令得要鼠标和键盘,AI不可能拿个机械手来操作吧,直接就能通过电脑发送指令;其次人类不可能做到极限进攻或者极限防守,AI就可以通过大数据来直接计算战役中需求的输出和血量;这就是一场非常细节化的比拼,AI在战略战术上我们可以理解为神一样的操作,往往在游戏对抗中,比的也就是速度与细节。

如果说,AI在战胜游戏选手的过程中,虽然人类和机器都想到了一起,但是由于人类无法在一秒钟之内完成像AI一样的几十个细微的操作,是占了“手速”的优势,让人看得懂,却做不到(有点类似AI作弊的感觉,因为明显这是一场不公平的战斗);那么AI在与人类下围棋的过程中,就刚好相反,因为下棋不存在什么手速问题,但是有时候AI会下一步很多职业选手都不会去选择的“臭棋”,我记得当时很多职业选手都表示AI下出了“古谱”当中公认的“臭棋”,几乎无人能看懂,但它最后还是毫无悬念的赢了,让人做得到,却看不懂。

再来看看国际象棋,AlphaGoZero与StockFish鳕鱼)是AI国际象棋世界中的一对宿敌,虽然这两个软件都是超强国象引擎,但比赛成绩拉下来看,却是“0”代碾压式的胜利,我研究过它们两个之间的大部分对局,发现“0”代最革命性的一点就是它没有棋子的概念;“0”代在和鳕鱼对抗时,完全不会管棋子的分值,然而鳕鱼会在乎棋盘中每个棋子的分值,“0”代只会在乎这颗棋子在棋盘上现在的分值,假设“0”代的一只马在棋局中被系统判定为4.5分,他会马上舍弃1枚1分的兵来保住这只马,杀伐果断,完全冷血。无论是人类高手还是像鳕鱼这样过去的顶级AI,差不多都是以棋子实力评估为基础的,在这个基础上再去进行“重视中央”之类的局面评估理论。而“0”代却完全对棋子没有概念,只要它认为未来整体局势好,弃子根本不叫事。

其实我们可以理解为鳕鱼的下法更像人的下法,而“0”代的下法更像是一个机器的下法,冷酷中带着疯狂。形象的说,“0”代在对阵鳕鱼中采取的攻击方式,更像是科幻小说中外星文明对地球的降维打击。

不过系统来看,“0”代对阵鳕鱼的作战思路也并非那么的匪夷所思,如果单从战略战术上来分析,我认为“0”代毫无疑问是一位绝对完美的战争家,它的每一步落子意图我都很清楚,也能理解,甚至我也可以做到。

因为国际象棋的规则相对来说要比围棋要简单一些,至少没有那么大,在今天我觉得这是刚刚好接近一个人类智力极限的游戏,或者说更贴近于人类;那么,我们是否可以进行猜想,能否效仿AI下国际象棋,就能学到AI的技术?


微信图片_20210731102743.jpg


在这个问题上,我曾付出过不少的精力去跟着“0”代的行棋思路进行研究学习。我发现,我们正常人喜欢给一些事物加一个固定的价值,比如说我做了这件事,我可以得到多少工资、多少酬劳;或者说明白一件事能让我得到多少酬劳,才能方便我去判断要不要去做这个事情,这是一个最简单的依据,同时也最符合人类惯性的一种思维方式。把这种思维方式换到棋盘上来说,我们会去给棋子加上各种分值,这样也方便我们去判断整个对局的一个走向和形式。

这种思路当然是通过学习、揣摩无数前人的经验去积累出来的,无数事实证明,经验是99.99%靠谱的。但是,“0”代在学习国际象棋的时候,实际上它的开发者并没有告诉它棋子的各个分值是多少,开发者只告诉它行棋的规则以及胜利的规则,就像上面那个打砖块的游戏,所有东西全是要靠他自学,完全摒弃了人类对国际象棋的所有思考。所以,“0”代在学习国际象棋的时候,它其实没有任何的概念。

除了行棋规则,它只知道,我要把对方的王ko了我就可以赢,其他的任何都不知道,它不知道小兵是一分、马是三分,他什么都不知道,他完全做到了从“0”开始。

只要你看过几盘“0”代与鳕鱼的对局,你就不难发现,“0”代对于主动权的掌控,实际上是更加激烈的。它更喜欢去作为进攻的一方。而对于鳕鱼来说,至少有80%往上的对局,它都是作为防守的一方。如果从正常角度去判断,我会更贴近支持于鳕鱼这一方,因为我毕竟把实实在在的东西去拿到手了。“0”代完全不一样,它更喜欢弃子,但是我能感觉得到,它在弃子时要求些什么,同时也知道它为了什么去弃子。

这可能得益于开发者赋予了“0”代世界上最先进的计算理念,当然鳕鱼也不差,它也是目前世界上相当先进的软件,也是运用了相当先进的计算技术,那么它们的区别到底在哪里?

在我的想象中,“0”代应该是基于一种类似计算尽头这样的概念,你别看国际象棋要比围棋简单一些,但是如果只是靠一种粗暴的计算,就是说,再简单的一步棋,你也一定要去通过所谓的分析和判断,而不是进行无休止的,粗暴的计算。这也许就是“0”代比鳕鱼或者说以前的计算机要更强的一个地方,就是说它可能到一个地方,它就停止计算了,因为在这个地方,他已经有了自己的判断在里面。

毫无疑问,“0”代拥有极为先进的国际象棋理念,技术上也更加完美,行棋思路也更加具有力量,无论各个方面吧,我是找不出任何问题。但是我还是学习不了,为什么呢?

我可以举一个比较简单的例子,比如说我要去过一个独木桥,就跟游乐场里的独木桥是一样,底下是小溪,然后有草地,有花园,什么都有。然后这个独木桥并不长,可能就是3米,一本书这么宽,对正常的成年人来说,我觉得不要说是经过专门训练了,直接去走一趟就过去了,是吧?我觉得没有什么太高的难度。

但是,如果说我把这个场景换一下,桥不变,但是它的场景换成了桥底下是悬崖万丈,掉下去就直接完蛋了。这个时候我就不一定愿意去冒这个险了,就算没有什么难度,但是因为外部因素的改变,很容易决定自己本身水平的发挥。实际上对于我们本身要做的东西,难度并没有增加,它增加的只是一些外部的客观原因;但是如果我是一台机器,我不管放在哪里,我都不会去理会客观原因,就往前走就可以了,这是一种绝对自信的状态,因为我知道自己100%不可能有失误,不会有任何漏算的情况,即使是被千军万马所包围,但是我只要确定有一个羊肠小道,我就可以快速脱离危险,我就可以走出去。

“0”代的想法就是这样,几乎上来就是弃子,弃子可能会长达几十个回合,它都要求自己是绝对精确的,通过弃子来掌控局面。而如果换作是正常人,在这几十个回合当中,棋盘上一直是少分值的;作战时人心理压力会非常大,人不可能像“0”代那样一直去搞定。(当然,从“0”代与鳕鱼的整个对局赛况来看,也没有全胜,它也输棋了,说明它也会有错的地方,它也并不是战无不胜。)

对于我们正常人来说,我觉得不可能会去选择这条路,不可能把自己每盘棋都置之死地而后生,不可能去把自己先逼入到绝境当中去;我们更喜欢站在中心,有条条大路通罗马的感觉,这个时候我们的心态会更加的放松,然后我们才可以选择出来更好的路线。换句话说,“0”代虽然告诉了我最正确的路,但是并不代表人类可以去模仿和学习他。因为这条路是仅仅适配于它自己的路

特别是放在比赛中,对于人类来说,首先不可能有这样的比赛风格,因为你要面对的是几轮的比赛,你的体力是不是能去跟得上?如果你每一盘棋都这样,你的神经能不能受得了?其次,你会不会出现漏算,你是不是出现了一盘失误以后,你还可以用这种钢铁般的意志保持绝对自信,毫无压力,我下一盘还可以采取这样的方式,绝对不会去动摇?综合以上这些客观因素表明,我个人觉得人类是没有办法去走这条路的。

我想说到这里,上文中提到的那个“能否效仿AI下国际象棋,就能学到AI的技术”的猜想已经有了明确的答案;在国际象棋的实战中AI与人类终究还是殊途陌路

我们在训练的时候,如果一味的跟着引擎走,这样的话最终只是他觉得OK,而我们未必觉得OK,因为它总是在告诉你,那条独木桥你走吧,不会掉下去的,你天天都在走;但是我们没有办法不去考虑客观因素,这对于我们人类来说全方位的素质要求实在是太高了;所以说,一定要首先想清楚自己要什么,一定要以自我为中心,相关的引擎或软件只能帮助我去找到我要的东西,适合于我的路线;包括布局选择也是一样,就像干货5里面提到的那些后手布局一样,你要先知道你的行棋风格,然后再去寻找适合的布局,并不是最好的就一定适合每一个人,能不能吃得下才是主要问题。

“0”代确实代表了国际象棋目前的世界最高水平;一对一战斗,我觉得它是无敌的,尽管我现在还没有亲身体验过这个软件,从国际象棋的理念上,包括它的大部分招式来看,我真心觉得好,赏心悦目般的漂亮。然后每一个回合我也能理解,并不是说像围棋一样模模糊糊的理解,我清清楚楚的知道它想干什么。

但是,它是死神派来的舞者;它把原本3米的独木桥可能增加到了30米、50米,甚至100米,它觉得我只要能走过3米,我就一定能去走过100米;它是类似于这样的一个行棋思路。

毫无疑问,“0”代配得上最先进;因为我们知道想要高回报的同时,一定会面临着高风险和高付出;在它的程式中,它觉得自己是可以掌控住所有风险的,它对什么打击、比赛、荣誉等等都不在乎。输完一盘棋以后,它还是有一种钢铁般的意志,我下盘棋还是要这样下,只要我认为好就是这样想。

简单总结一下,我们在学习中,并不是说最好的东西就意味着一定适合自己。我们得要想办法,要让最好的东西去给自己服务,这个才是最好的,如果单纯去模仿最好的,比如现在像很多国际象棋软件告诉你下什么你就下什么,这样是未必行得通的,因为软件可能会带你走到一个九死一生、置之死地而后生的绝路上,它当然有能力去冲过去,而我们正常人就不一定了。我们更喜欢康庄大道,条条大路通罗马,可以让我们拥有更多的选择和更多的退路,在这样的一个情景下,我们才可以更容易把100%或者是120%的实力和水平去发挥出来。

作为我个人,一切的出发点,都是为了帮助小棋手能更好的理解国际象棋,拥有一个更好的学习方式;不同于引擎教学,在超玥微课堂中,我们更在乎的是让小棋手能够去掌握、去吃透一些国际象棋的知识点,形成一套适合自己的知识体系。

王玥老师的干货系列
*本次干货内容将区别以往文章中所保留的谨慎态度,是一篇浓缩了大量由本人亲身鉴证及众多优秀棋手总结出的事实性文章。早...
2019-08-01
最近又有不少家长向我咨询:为什么我的孩子只喜欢下棋,不喜欢做题?其实在我从事国际象棋教育工作有限的时间里,这个问题...
*国际象棋是一门充满变幻的项目,下面所有内容皆为个人观点且有时效性,如觉不适还请谅解。(文末有AlphaGoZer...
*国际象棋是一门充满变化的项目,下面所有内容皆为个人观点且有时效性,如觉不适还请谅解。大家好,很久没有与大家见面了...
这里先给大家说声抱歉,最近比较忙,耽搁了些时间。干货4主要分享小棋手处在成长阶段时,家长如果不懂棋,该去如何辅助训...
以下内容仅代表个人观点,如觉不适请见谅,请勿对号入座。影子教练的入门理念一眨眼做教练已经七年了,经常有家长问我,你...
爱好到职业前的准备以下内容仅代表我个人观点,如觉不适请谅解,请勿对号入座。我小时候特别崇拜那些世界名手,睡觉前总是...
导读 :这是一篇干货文章,以下的部分内容可能会让您感到些许不适,我只能保证内容和数据绝对真实,也请不要对号入座。已...
新闻资讯

新闻资讯

副标题