当前位置: > 新闻详情 王玥老师的纯干货6——与死神共舞的人工智能(深度思考)发表时间:2019-07-02 16:25 *国际象棋是一门充满变幻的项目,下面所有内容皆为个人观点且有时效性,如觉不适还请谅解。(文末有AlphaGoZero与StockFish的对抗赛讲解视频获取方法,请仔细阅读) 大家好,这两天被中国国际象棋杂志要重新出版的事情刷屏了,纸质媒体确实已经没落了很多年了,作为一个从小看着杂志长大的小棋手,也希望这次前辈们在长沙的探讨能够带给杂志一个更好的未来。这段时间有点懒,事情也多,看到了这个消息,我又手痒了,想写点东西。当然这一篇并不是一篇传统意义上的“技术”文章,更多的是我对未来国际象棋发展的一些展望,以及人工智能思路AI的理解,如果可以给各位一些启发,那我深感荣幸。 言归正传,前段时间从美国回来,看了不少新鲜事物,也唤起了我对“未来”这个话题在之前的一些思考,关于人工智能(AI)在智力领域上的种种想法。相信这也是一个大家都多多少少有些关心的概念。 虽然目前AI还没有达到普及人类生活方方面面的地步,但在某些领域,AI已经超越了人类,象征着世界最强实力。 其中,AI在智力运动领域的攻击力量已经达到了侵略的地步,可能我们国内对AI在智力运动上的了解大多来自于2017年AlphaGoMaster战胜了世界第一的世界围棋冠军柯洁,当时由于媒体的高度关注,全国上下火爆一时;现在,无论是围棋、国际象棋、中国象棋,甚至是五子棋,你都可以随意打开手机上的应用商店找到与之相关的引擎应用。 今天我要和大家聊的话题,起源于AI,但更加关注的是我们人类自己。 先说说这几年我一直都在关注的智力运动类AI—AlphaGo,这个软件的开发者叫戴密斯·哈萨比斯,他4岁开始下国际象棋,13岁就获得了国际象棋大师称号,对智力运动本身保持着高度热爱。他的团队选择开发以围棋对弈为主的AlphaGo,是因为围棋是所有棋类中计算量最大的一种,不同于国际象棋,它基本上算是一项零和博弈,没有办法去产生和棋,棋子也似乎没有分值,不存在类似于国际象棋中最优结果(和棋)的出现;一直被认为是计算量大到计算机没有办法攻克的一个领域。 在开发完成第一版本的AlphaGo后,软件就战胜了法国围棋队总教练樊麾;此后更新的第二版本和第三个版本分别战胜了世界围棋冠军李世石、柯洁;现在最新的版本是第四代AlphaGoZero,在围棋对弈上已经能做到随意秒杀前三代,之所以开发团队把它命名为“0”,是因为第四代阿尔法狗学习任何游戏都可以从零开始。 我们可以来简单看一下AlphaGoZero发布会上公布的视频片段,看看它的学习能力有多么可怕。 “0”代的100场表现 起先的100场游戏中,“0”代根本不知道自己在控制什么,甚至连游戏目标都不知道,多半也接不到球。 “0”代的200场表现 在游戏进行到200场时,“0”代已经开始掌握窍门,它发现应该让短棍更靠近球。 “0”代的400场表现 经过近400场游戏后,“0”代的游戏技巧已经达到了高度熟练,几乎每次都能接到球。 0”代的600场表现 接着“0”代又完成了200场游戏,惊人的画面出现了,它发现了最佳策略,就是沿着墙壁边缘挖隧道,让球在砖块和墙壁之间来回弹。 那么问题来了,挖隧道大家都能看得懂,但是“0”代控制短棍的极限操作是否能让人类去掌握? 来看一个AlphaGo与游戏相关的话题;今年年初,在《星际争霸2》游戏中AlphaStar(阿尔法星际)与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。 我简单的看了一下AlphaStar在比赛中的实况,那操作简直变态,能用三个兵守住的关口,它绝对不会用四个兵去守,什么时候去造兵营,什么时候去挖矿,所有即时战略计算得几乎分毫不差,还有完成这些操作所需要的时间几乎可以忽略不计。在这种状态下,人是几乎不可能战胜它的,首先你发送指令得要鼠标和键盘,AI不可能拿个机械手来操作吧,直接就能通过电脑发送指令;其次人类不可能做到极限进攻或者极限防守,AI就可以通过大数据来直接计算战役中需求的输出和血量;这就是一场非常细节化的比拼,AI在战略战术上我们可以理解为神一样的操作,往往在游戏对抗中,比的也就是速度与细节。 如果说,AI在战胜游戏选手的过程中,虽然人类和机器都想到了一起,但是由于人类无法在一秒钟之内完成像AI一样的几十个细微的操作,是占了“手速”的优势,让人看得懂,却做不到(有点类似AI作弊的感觉,因为明显这是一场不公平的战斗);那么AI在与人类下围棋的过程中,就刚好相反,因为下棋不存在什么手速问题,但是有时候AI会下一步很多职业选手都不会去选择的“臭棋”,我记得当时很多职业选手都表示AI下出了“古谱”当中公认的“臭棋”,几乎无人能看懂,但它最后还是毫无悬念的赢了,让人做得到,却看不懂。 再来看看国际象棋,AlphaGoZero与StockFish(鳕鱼)是AI国际象棋世界中的一对宿敌,虽然这两个软件都是超强国象引擎,但比赛成绩拉下来看,却是“0”代碾压式的胜利,我研究过它们两个之间的大部分对局,发现“0”代最革命性的一点就是它没有棋子的概念;“0”代在和鳕鱼对抗时,完全不会管棋子的分值,然而鳕鱼会在乎棋盘中每个棋子的分值,“0”代只会在乎这颗棋子在棋盘上现在的分值,假设“0”代的一只马在棋局中被系统判定为4.5分,他会马上舍弃1枚1分的兵来保住这只马,杀伐果断,完全冷血。无论是人类高手还是像鳕鱼这样过去的顶级AI,差不多都是以棋子实力评估为基础的,在这个基础上再去进行“重视中央”之类的局面评估理论。而“0”代却完全对棋子没有概念,只要它认为未来整体局势好,弃子根本不叫事。 其实我们可以理解为鳕鱼的下法更像人的下法,而“0”代的下法更像是一个机器的下法,冷酷中带着疯狂。形象的说,“0”代在对阵鳕鱼中采取的攻击方式,更像是科幻小说中外星文明对地球的降维打击。 不过系统来看,“0”代对阵鳕鱼的作战思路也并非那么的匪夷所思,如果单从战略战术上来分析,我认为“0”代毫无疑问是一位绝对完美的战争家,它的每一步落子意图我都很清楚,也能理解,甚至我也可以做到。 因为国际象棋的规则相对来说要比围棋要简单一些,至少没有那么大,在今天我觉得这是刚刚好接近一个人类智力极限的游戏,或者说更贴近于人类;那么,我们是否可以进行猜想,能否效仿AI下国际象棋,就能学到AI的技术? 在这个问题上,我曾付出过不少的精力去跟着“0”代的行棋思路进行研究学习。我发现,我们正常人喜欢给一些事物加一个固定的价值,比如说我做了这件事,我可以得到多少工资、多少酬劳;或者说明白一件事能让我得到多少酬劳,才能方便我去判断要不要去做这个事情,这是一个最简单的依据,同时也最符合人类惯性的一种思维方式。把这种思维方式换到棋盘上来说,我们会去给棋子加上各种分值,这样也方便我们去判断整个对局的一个走向和形式。 这种思路当然是通过学习、揣摩无数前人的经验去积累出来的,无数事实证明,经验是99.99%靠谱的。但是,“0”代在学习国际象棋的时候,实际上它的开发者并没有告诉它棋子的各个分值是多少,开发者只告诉它行棋的规则以及胜利的规则,就像上面那个打砖块的游戏,所有东西全是要靠他自学,完全摒弃了人类对国际象棋的所有思考。所以,“0”代在学习国际象棋的时候,它其实没有任何的概念。 除了行棋规则,它只知道,我要把对方的王ko了我就可以赢,其他的任何都不知道,它不知道小兵是一分、马是三分,他什么都不知道,他完全做到了从“0”开始。 只要你看过几盘“0”代与鳕鱼的对局,你就不难发现,“0”代对于主动权的掌控,实际上是更加激烈的。它更喜欢去作为进攻的一方。而对于鳕鱼来说,至少有80%往上的对局,它都是作为防守的一方。如果从正常角度去判断,我会更贴近支持于鳕鱼这一方,因为我毕竟把实实在在的东西去拿到手了。“0”代完全不一样,它更喜欢弃子,但是我能感觉得到,它在弃子时要求些什么,同时也知道它为了什么去弃子。 这可能得益于开发者赋予了“0”代世界上最先进的计算理念,当然鳕鱼也不差,它也是目前世界上相当先进的软件,也是运用了相当先进的计算技术,那么它们的区别到底在哪里? 在我的想象中,“0”代应该是基于一种类似计算尽头这样的概念,你别看国际象棋要比围棋简单一些,但是如果只是靠一种粗暴的计算,就是说,再简单的一步棋,你也一定要去通过所谓的分析和判断,而不是进行无休止的,粗暴的计算。这也许就是“0”代比鳕鱼或者说以前的计算机要更强的一个地方,就是说它可能到一个地方,它就停止计算了,因为在这个地方,他已经有了自己的判断在里面。 毫无疑问,“0”代拥有极为先进的国际象棋理念,技术上也更加完美,行棋思路也更加具有力量,无论各个方面吧,我是找不出任何问题。但是我还是学习不了,为什么呢? 我可以举一个比较简单的例子,比如说我要去过一个独木桥,就跟游乐场里的独木桥是一样,底下是小溪,然后有草地,有花园,什么都有。然后这个独木桥并不长,可能就是3米,一本书这么宽,对正常的成年人来说,我觉得不要说是经过专门训练了,直接去走一趟就过去了,是吧?我觉得没有什么太高的难度。 但是,如果说我把这个场景换一下,桥不变,但是它的场景换成了桥底下是悬崖万丈,掉下去就直接完蛋了。这个时候我就不一定愿意去冒这个险了,就算没有什么难度,但是因为外部因素的改变,很容易决定自己本身水平的发挥。实际上对于我们本身要做的东西,难度并没有增加,它增加的只是一些外部的客观原因;但是如果我是一台机器,我不管放在哪里,我都不会去理会客观原因,就往前走就可以了,这是一种绝对自信的状态,因为我知道自己100%不可能有失误,不会有任何漏算的情况,即使是被千军万马所包围,但是我只要确定有一个羊肠小道,我就可以快速脱离危险,我就可以走出去。 “0”代的想法就是这样,几乎上来就是弃子,弃子可能会长达几十个回合,它都要求自己是绝对精确的,通过弃子来掌控局面。而如果换作是正常人,在这几十个回合当中,棋盘上一直是少分值的;作战时人心理压力会非常大,人不可能像“0”代那样一直去搞定。(当然,从“0”代与鳕鱼的整个对局赛况来看,也没有全胜,它也输棋了,说明它也会有错的地方,它也并不是战无不胜。) 对于我们正常人来说,我觉得不可能会去选择这条路,不可能把自己每盘棋都置之死地而后生,不可能去把自己先逼入到绝境当中去;我们更喜欢站在中心,有条条大路通罗马的感觉,这个时候我们的心态会更加的放松,然后我们才可以选择出来更好的路线。换句话说,“0”代虽然告诉了我最正确的路,但是并不代表人类可以去模仿和学习他。因为这条路是仅仅适配于它自己的路。 特别是放在比赛中,对于人类来说,首先不可能有这样的比赛风格,因为你要面对的是几轮的比赛,你的体力是不是能去跟得上?如果你每一盘棋都这样,你的神经能不能受得了?其次,你会不会出现漏算,你是不是出现了一盘失误以后,你还可以用这种钢铁般的意志保持绝对自信,毫无压力,我下一盘还可以采取这样的方式,绝对不会去动摇?综合以上这些客观因素表明,我个人觉得人类是没有办法去走这条路的。 我想说到这里,上文中提到的那个“能否效仿AI下国际象棋,就能学到AI的技术”的猜想已经有了明确的答案;在国际象棋的实战中AI与人类终究还是殊途陌路。 我们在训练的时候,如果一味的跟着引擎走,这样的话最终只是他觉得OK,而我们未必觉得OK,因为它总是在告诉你,那条独木桥你走吧,不会掉下去的,你天天都在走;但是我们没有办法不去考虑客观因素,这对于我们人类来说全方位的素质要求实在是太高了;所以说,一定要首先想清楚自己要什么,一定要以自我为中心,相关的引擎或软件只能帮助我去找到我要的东西,适合于我的路线;包括布局选择也是一样,就像干货5里面提到的那些后手布局一样,你要先知道你的行棋风格,然后再去寻找适合的布局,并不是最好的就一定适合每一个人,能不能吃得下才是主要问题。 “0”代确实代表了国际象棋目前的世界最高水平;一对一战斗,我觉得它是无敌的,尽管我现在还没有亲身体验过这个软件,从国际象棋的理念上,包括它的大部分招式来看,我真心觉得好,赏心悦目般的漂亮。然后每一个回合我也能理解,并不是说像围棋一样模模糊糊的理解,我清清楚楚的知道它想干什么。 但是,它是死神派来的舞者;它把原本3米的独木桥可能增加到了30米、50米,甚至100米,它觉得我只要能走过3米,我就一定能去走过100米;它是类似于这样的一个行棋思路。 毫无疑问,“0”代配得上最先进;因为我们知道想要高回报的同时,一定会面临着高风险和高付出;在它的程式中,它觉得自己是可以掌控住所有风险的,它对什么打击、比赛、荣誉等等都不在乎。输完一盘棋以后,它还是有一种钢铁般的意志,我下盘棋还是要这样下,只要我认为好就是这样想。 简单总结一下,我们在学习中,并不是说最好的东西就意味着一定适合自己。我们得要想办法,要让最好的东西去给自己服务,这个才是最好的,如果单纯去模仿最好的,比如现在像很多国际象棋软件告诉你下什么你就下什么,这样是未必行得通的,因为软件可能会带你走到一个九死一生、置之死地而后生的绝路上,它当然有能力去冲过去,而我们正常人就不一定了。我们更喜欢康庄大道,条条大路通罗马,可以让我们拥有更多的选择和更多的退路,在这样的一个情景下,我们才可以更容易把100%或者是120%的实力和水平去发挥出来。 作为我个人,一切的出发点,都是为了帮助小棋手能更好的理解国际象棋,拥有一个更好的学习方式;不同于引擎教学,在超玥微课堂中,我们更在乎的是让小棋手能够去掌握、去吃透一些国际象棋的知识点,形成一套适合自己的知识体系。
2019-07-12
最近又有不少家长向我咨询:为什么我的孩子只喜欢下棋,不喜欢做题?其实在我从事国际象棋教育工作有限的时间里,这个问题...
2019-07-02
*国际象棋是一门充满变幻的项目,下面所有内容皆为个人观点且有时效性,如觉不适还请谅解。(文末有AlphaGoZer...
2019-04-25
*国际象棋是一门充满变化的项目,下面所有内容皆为个人观点且有时效性,如觉不适还请谅解。大家好,很久没有与大家见面了...
2019-03-04
这里先给大家说声抱歉,最近比较忙,耽搁了些时间。干货4主要分享小棋手处在成长阶段时,家长如果不懂棋,该去如何辅助训...
2019-02-25
以下内容仅代表个人观点,如觉不适请见谅,请勿对号入座。影子教练的入门理念一眨眼做教练已经七年了,经常有家长问我,你...
2019-02-18
爱好到职业前的准备以下内容仅代表我个人观点,如觉不适请谅解,请勿对号入座。我小时候特别崇拜那些世界名手,睡觉前总是...
2019-02-16
导读 :这是一篇干货文章,以下的部分内容可能会让您感到些许不适,我只能保证内容和数据绝对真实,也请不要对号入座。已... |
|