创客联盟网

标题: 面对AI碾压性的计算力,人类是否还有深入研究围棋等对弈游戏的必要? [打印本页]

作者: 创客    时间: 2016-3-18 11:56
标题: 面对AI碾压性的计算力,人类是否还有深入研究围棋等对弈游戏的必要?
按:作者高飞龙,北大研究生毕业,围棋业余5段,本文更新于作者知乎。
渴求真理的好奇心,是人类前进的永恒驱动力。而宇宙的广袤及世界的庞大,又是人的想象力和行动力所难以企及的。
还记得那个流传了数千年的故事吗?
印度的某位国王要奖赏国际象棋的发明者,发明者提要求说:“在国际象棋棋盘的第一格里放一颗麦子,第二格里放两颗麦子,第三格里放四颗麦子......依此类推,每下一格的麦子数是上一格的两倍,放满全部64个格子,将这么多麦子奖赏给我就行了。
(, 下载次数: 18)

然而国王却发现这是一个他想象不出有多大的数字,即使将全国的麦子都拿来也摆不满哪怕半个棋盘。然而国王却发现这是一个他想象不出有多大的数字,即使将全国的麦子都拿来也摆不满哪怕半个棋盘。
我们大家应该都是在小学时就知道这个故事了,也知道这个数字其实是个天文数字。
实际上,这个数字大小为:1+2+2^2+2^3+...+2^63=18446744073709551615
这是一个普通的科学计算器都无法完全显示的数字。
而国际象棋的全部合法局面数(可能对局数还要更多一些数量级),量级为:10^46=10000000000000000000000000000000000000000000000,面对这个比刚才那个数字更长的数字,请大家体会一下这个全世界最流行的棋种的博大。
但上面那个数字并不是大家可以借助实物去想象的最大数字。在现在的天文学研究中,根据一定的理论模型,已经可以大致估计出宇宙中的总物质量。
上世纪初,曾经的英国剑桥大学天文台台长、世界级著名天文学家亚瑟·艾丁顿,估算出了宇宙中质子总数的量级,这个数字为:136*2^256=15747724136275002577605653961181555468044717914527116709366231425076185631031296。这个数字也被称为“艾丁顿数”。
虽然这个精确数字只是估算值的展开,与现实情况可能不相等,但量级应该大致是一样的。
想象一下,在我们的宇宙中,一共有着这么多的质子,这么多的物质。
(, 下载次数: 20)

这就是我们的整个宇宙。
(, 下载次数: 18)

本来就闻名世界,最近更是赚足了全世界人类眼球的美国谷歌公司,其英文名google其实是从googol演化而来的,而后者其实是一个数字:本来就闻名世界,最近更是赚足了全世界人类眼球的美国谷歌公司,其英文名google其实是从googol演化而来的,而后者其实是一个数字:googol=10^100=1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000。
这是一个比上面的宇宙全部质子数更大的数字,我从这个数字中,体会到了谷歌创始人们对未知世界的好奇心,以及探究未知世界的野心。
而就在距今不久之前,荷兰国立数学和计算科学研究所的科学家JohnTromp,计算出了一个数字:208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935≈2.08*10^170
上面那个数字,就是围棋在19路棋盘的条件下,全部合法局面数的精确值(实际可能对局数还要远高于这个数量级)。
(, 下载次数: 18)

大家感觉如何?大家感觉如何?
我摆出这几个数字不是为了吓唬谁,或者显示我的数学很好,而是因为如果我在没有对比的情况下直接摆出最后这个数字,大家很难凭借人类自身的想象力,体会它的巨大。
在数学形式上有穷,而在实际操作中等效于无穷,这就是围棋的变化空间。
说到底,按照上面提过的相关数字,宇宙也不过是有穷的,而我们人类发明“无穷”这个词,也不过是为了在我们自身想象力、计算力和行动力都有限的情况下,表达和体会那种我们自身无法企及的几乎“无限”的巨大。
大家觉得,哪怕耗尽人类在宇宙中存在的全部时长,凭借我们现在还无法想象的未来科技进步,有可能穷尽这个数字所代表的19*19路棋局数吗?
我不知道。
提起围棋,容易立刻想到的除了它庞大的变化空间之外,就数其简单而朴素的规则了。
围棋的规则大致可以简单归纳为以下三条:
1、黑先白后交替落子于交叉点上,最终占点多者为胜,且黑贴白目以平衡先手优势。
2、与子相邻的空点为其气,气尽则亡,无气点禁入。
3、禁止全盘同型,即在一局棋中,棋盘上不可出现之前出现过的棋型,以避免棋局陷入循环。
围棋就是建立在如上的简单规则上的世界,从这几条规则开始演化出眼、两真眼成活、简单对杀规则等一系列可以用数学语言精确表达出的规律。
以获取全盘胜利为最终目的,在这些第一层的规律之上,又有着更多的规律,这些规律形成和解释了从空白的开局开始直指最终胜利的最优解。
而且,不只是从空棋盘开始,对黑白任何一方来说,从任何一个可能局面开始,直达最终的最大期望获胜目数,都有最优解,而且一般都是很多条路。
人类在自身计算力有限的前提下,为了追求获胜,并进一步在此基础上追求最优解,不得不依据自身的经验和逻辑总结和提炼出了无数的下棋规律。
这些规律经历无数代人的传承和发展,不断的扬弃,并一层一层的迭代起来,形成了现在我们所知的围棋理论。
看到这里,大家明白了吗?
从规则定下来开始,围棋的规律就是客观存在的了,甚至可以说是客观真理。而人类的围棋理论,是基于自身经验和逻辑的总结和推演,是主观的,未必与客观真理完全相符的。
一直以来,在人类当中,越是擅长在棋盘上战胜他人的人,也即棋力越强的人,自然也就是掌握和践行规律越多越合理的人。甚至可以说,是离真理越近的人。
让我们想象一下,有一位能够穷尽围棋所有变化的“围棋上帝”,能够获知将所有棋局导向最大期望胜利的全部最优途径,那他也就能在任何局面下下出最优解。
这最优解,就是我们俗称的“神之一手”。
无数代人类所追求的每个局面下的最佳一手,也就是最能导向胜利的一手,就是这个“神之一手”。
对“神之一手”的追求,也即单个局面最优解的追求,迭代起来也就组合成了对全局最优解的追求。
人类对“神之一手”的追求,归根结底是对棋盘上的真理的追求。
我们人类有时候也能下出“神之一手”,虽然我们并不确定那到底是不是“神之一手”。
(, 下载次数: 13)

但我们知道,如果是这位代表客观真理的“围棋上帝”来下,它的每一手,都将是“神之一手”。但我们知道,如果是这位代表客观真理的“围棋上帝”来下,它的每一手,都将是“神之一手”。
人力有穷,而人的创造力无穷。
有一天,我们创造出了计算力远大于自身的计算工具,我们可以凭借其更好的追求“神之一手”,更好的追求每个局面下乃至全局的最优解,更好的追求棋盘上的客观真理。那我们会因为自己没有工具计算的更快更准而放弃对真理的追求吗?
我们派工具去追求真理,难道最终不是为了自己更好的获知真理吗?难道我们只是让工具自己去追求真理吗?我们制造天文望远镜,难道是为了让望远镜自己接收光线,让它自己去“看”星空吗?难道不是为了让我们自己看的更远吗?
我相信,人类渴求真理的好奇心永远都不会停止前进。而仅就围棋来说,哪怕只是在19*19路的围棋盘上,这空间也足够人类穷尽整个生存历史时长都无法全部探明。
多元化,不仅是人类社会不断繁荣的象征,更是整个世界降低存续风险的有效方式。
我曾在台北的圆山饭店见过这样一桌菜:有田园和风活鲍鱼、松茸三宝鱼翅盅、蒜蓉鲜露蒸大明虾、壕皇鹅掌烧花胶、澳洲御制牛小排、金华火腿海鲜皇、天麻雪蛤蒸乌鸡、原笼樱花虾东坡骨米糕等八个菜。
现在,假设你最喜欢吃的是澳洲御制牛小排,那么你是愿意吃上面那个八个不重样菜的一桌呢,还是愿意吃只有八份你最喜欢吃的澳洲御制牛小排、而别的什么都没有的一桌呢?我想正常人类都不会给出第二种答案吧。
其实,这在微观经济学的消费者理论中,是一个非常简单的现象。
(, 下载次数: 19)

如果你对这个理论感到陌生,不妨看看上面的这张图。如果你对这个理论感到陌生,不妨看看上面的这张图。图中横轴和纵轴分别代表一位消费者小石头喜欢或者需要的两种商品。而I1、I2、I3这三条曲线,则代表小石头个人偏好的无差异曲线,经济学理论和行为学研究实践都指出,绝大多数这种时候人的无差异曲线都是如图中这样下凸的。
这三条曲线从低到高,分别代表了小石头不断提升的满足感。
而直的线段AB,表示他的预算集,也就是他在能力范围内能够得着的消费选择。而A、B、M、N、C等五个点,就是他在能力范围内的五种代表性消费选择。A点显然表示小石头把所有钱都花在X2而一点X1都不买,而B点则完全反之。我们完全看不到这两个点在什么偏好曲线上,总之肯定是在很低的曲线上。而M和N则分别代表小石头将绝大部分的钱花在一种商品上,而只选择很少的另一种商品。我们可以看到这两个选择处在曲线I1上,这是小石头现在的满足度。
代表最高满足的度的选择在哪里?是C,它位于小石头所能达到的最高偏好曲线I2上,代表小石头大致均衡的选择了两种商品。
这种现象,被大量的消费者行为学研究实践所支持,并得到了行为心理学上的充分解释。对着一张图啰嗦地讲了这么久,其实不过是这么一个简单的道理:面对大量自己喜好或需要的东西,人类总是倾向于什么都选择、什么都留下一点,而不会将所有资源都孤注一掷的投到某一种东西上,而放弃其他的全部。
也即人类偏好多样性。你以为只有人类才偏好多样性吗?其实“上帝”也这样。
自生命起源以来,从原核生物的时代开始,生命就向着不同的方向进化,不断的进化出新的形式,品种变得越来越丰富。
(, 下载次数: 17)

经历亿万年直到今天,才成为我们所看到的这个拥有丰富物种的生态圈。经历亿万年直到今天,才成为我们所看到的这个拥有丰富物种的生态圈。

越是拥有丰富的物种,越是存在多样化的进化方向,才最能够在环境变迁时保证生命不被全部摧毁。
在金融学上,这是简单的分散风险,而造物主显然很擅长“投资”。当很多人谈论起棋类项目的复杂性时,经常喜欢将几大棋类放在一起对比。就现有的世界性智力运动来说,受到公认的有四项棋类运动,而他们的合规复杂度排行为:围棋 > 中国象棋 > 国际象棋 > 国际跳棋
棋类运动作为人类追求智力开发的产物,既然围棋的复杂度最高,那是不是留下围棋就行了?其他比围棋简单的都不要了?尽管我本人可能属于围棋的领域,也希望更多的人可以接触到围棋,但我绝不希望活在一个只有围棋,而没有象棋和跳棋的世界里。甚至连孩童都能懂得这个道理。
随着科技革命的大爆炸,人类社会中的领域和行业将愈加丰富。很多人都惧怕着随着人工智能的发展,很多领域和项目将被“消灭”。可我认为会被取代的只有旧行业中的重复性机械劳动,人工智能的发展最终是为了将人从这种劳动中解放出来,从而能有更多的时间精力去做那些更有创造性的工作。
人工智能领域的发展,不是为了“消灭”其他领域,当然也不会“消灭”围棋。
人工智能相关的程序员和科学家们,要做的是创造新事物并改变世界,而不是为了消灭世界或者世界的一部分。甚至像很多新兴的交叉领域一样,随着人工智能领域的发展,它和围棋领域的重叠也会加强,甚至成为一个真正的交叉领域。
Google和Deepmind倾尽全力发展人工智能围棋程序,不是仅仅为了在围棋盘上创造出能击败人类的人工智能程序,而是为了借助围棋为工具来开发未来的“通用机”。
而面对围棋,就像曹政老师一直提醒我们的那样,是“降维打击”。但“降维打击”只是事实全貌的一面而已。
最近,已经有多位机器学习领域的朋友主动对我说,将来如果有条件,很愿意参加将深度神经网络习得的围棋规律翻译给棋手们的项目,同时他们也表示,这对人工智能领域本身也是极其重要的课题。破解DNN的“黑盒”属性,的确对整个人类都非常重要。这不仅将深刻的影响人工智能领域和围棋领域,而早晚会影响到其他的领域,直至世界的方方面面。
当我将这些话转述给一些职业棋手时,他们大多感到非常激动。而其实一小部分围棋界乃至其他棋界的人士在很早之前,就已经意识到了这个交叉领域的重要意义,并亲自参与甚至投身到了相应的研究和讨论中去。比如当年的陈志行教授,曾经的俞斌九段、余平六段,近几年的李喆六段等人,还有大量现在转入程序员领域的曾经的冲段少年。
甚至连这次的AlphaGo背后的男人哈萨比斯和黄士杰等,也都有棋手背景,要么是国象大师,要么是围棋的业余高段。舆论中的一些表面上的对立只是两个领域中,少数有话语权的偏激人士半当真半炒作的种下的种子,而又经过大量媒体诱导宣传造成的假象。将来,在这个交叉领域,将充满共识与合作。
人工智能的发展不会破坏或降低人类社会的多样性,而只会反之。不断对内追求自我提升的主观愿望,是人类之所以进化为人类的重要原因。
奥林匹克格言“更快、更高、更强”是这种主观愿望的一种最为简单粗暴的表达方式。
(, 下载次数: 17)

而在此之上,其实还有奥林匹克精神所定义的“理解、友谊、团结和公平竞争”。而在此之上,其实还有奥林匹克精神所定义的“理解、友谊、团结和公平竞争”。

简单粗暴的竞争,为什么还会有后面这种虚化的精神追求呢?
其实这种追求在东方哲学中,自古至今都是重要的内容。儒家对内的自我提升和个人修养,道家追寻的内心宁静和顺法自然,还是墨家恪守的道义、释家追求的顿悟,都是在不断的追求个人精神力乃至整个精神境界的提升。
因此人类对自我提升的追求,不但有体力锻炼的追求,还有智力锻炼的追求,以及精神力锻炼的追求。
人类互相之间的竞争,最终追求的是战胜自我。个人的战胜自我意味着进步,而人类整体的战胜自我则意味着进化。
为什么我们创造出会下围棋的人工智能程序,然后又会去跟它比赛?还会努力的战胜它,并为了战胜它而感到高兴?
这并不是说人类是自相矛盾的动物,一边前进一边拒绝前进,而是这压根就是两个维度的问题。程序员们创造出人工智能,是对不断提升人类创造力的追求;而棋手乃至运动员们自我锻炼并参加比赛,是对提升体力、智力和精神力等纯人类自我因素的追求。正如我们跳高时越过了自己摆好的杆子,我们难道不会觉得高兴吗?
而当李世石在身心俱疲、压力如天,同时几乎所有人对他感到绝望时,他却仍然以坚韧的意志力和强大的实力不懈的追赶,在绝境的狭缝中觅得生机,用“神之一手”从更强大的对手手中夺得了一盘宝贵的胜利,并在这比赛过程中挑战了人类自身的极限,这难道不是人类追求自我提升的最好表现吗?
(, 下载次数: 9)

我们为此感到感动,对此表示崇敬和赞扬,并不意味着对对手的贬低和仇视。我们为此感到感动,对此表示崇敬和赞扬,并不意味着对对手的贬低和仇视。
不急左就急右,认为世界是非黑即白的,所有立场都是对立的,这是幼稚的孩子气。围棋除了争胜之外,代代传承的棋道规范也是极为重要的内容,而棋道规范的核心就是尊重。这尊重包括尊重对手、尊重自己,还有尊重围棋,尊重一切存在。
未来,我们还将不断的创造出新的更强的人工智能围棋程序;我们还将继续与之比赛,努力的战胜它,并寻找它的毛病和弱点;我们还将继续修正和弥补这些毛病,让人工智能变的更强;我们还将向人工智能学习,以让自己变得更强;更强的我们还与更强的人工智能不断竞争,以追求更多的自我提升。
以上过程将在未来的历史中循环往复,其存在的长期性在于其逻辑是自洽的。因此竞技围棋永不会褪色,人类永远不会放弃借助围棋追求自我提升。而人工智能,将成为我们凭借的更好工具。
人工智能,绝不会成为人类追求自我提升的阻碍,而只会给我们带来新的工具和标杆。人工智能在棋盘上战胜人类,也绝不会磨灭人类在棋盘上追求将自己变得更强的愿望,而只会成为我们锻炼的良好工具。
你问我围棋的未来如何,这就是我的答案。
也有朋友曾提醒过我,你是不是过于乐观了?可我一向都是这样乐观。我坚信所有的愚昧、偏见、傲慢、误解与疑惑都终将湮没在历史的尘埃中,留下的只有人类的进步。
最后,我想要恭喜Google、Deepmind和昨天刚被授予名誉九段的AlphaGo。
(, 下载次数: 18)

AlphaGo“九段”,欢迎来到这个世界并加入我们。




欢迎光临 创客联盟网 (https://immaker.org/) Powered by Discuz! X3.3