主演:DemisHassabisDavidSilver李世石黄士杰樊麾
类型:纪录片记录导演:格雷格·科斯 状态:HD 年份:2017 地区:美国 语言:英语 豆瓣ID:27012433热度:179 ℃ 时间:2022-08-17 16:04:53
温馨提示:[DVD:标准清晰版] [BD:高清无水印] [HD:高清版] [TS:抢先非清晰版] - 其中,BD和HD版本不太适合网速过慢的用户观看。
第五局快结束时,David Silver忽然指着屏幕说:“AlphaGO says it's going to quit.”n先是一片紧张的沉默,然后是一阵放松下来后的爆笑。nDavid笑着说:“I'm joking.”n笑声中有人说:“David has been waiting two years to say this.”
这是我感触最深的一个场景。轻描淡写的一句话,这背后有多少辛酸和寂寞?岂止是两年啊,从1988年Sutton提出时间差分算法、92年Watkins提出Q-learning算法,已经二十多年过去了。AlphaGO“横空出世”背后,是多少科学家几十年如一日的默默付出啊。
AlphaGO的成功,不可思议地像一个梦。几年前,DeepMind成立之初,David Silver在UCL开强化学习课。第八课结束时,David非常腼腆地给DeepMind打广告,希望大家投简历,简简单单几句话说的吞吞吐吐,台下是一片笑声。那个时候,人工智能的围棋还远不能打败人类顶尖棋手,强化学习还只是整个人工智能学术圈里的冷门方向,甚至很多人连强化学习的名字都没有听说过,大家趋之若鹜的方向是数据挖掘和计算机视觉。没有人能想到短短几年后RL即可打败李世乭,DeepMind成为炙手可热的公司、顶级研究机构,而强化学习也给人工智能领域带来如此翻天覆地的变化。
某一年ICLR的开幕式上,有学者在致辞时说:“当初Deep Mind邀请我,我没有答应,现在看来,很显然他们站在了历史更正确的一边。”而我觉得,David Silver,Demis Hassabis,Aja Huang等人最令人敬佩的地方恰恰在于: 他们没有用功利的眼光去选择所谓“正确“的一边,他们只是一直默默地坚持着做自己真正想做的。也正因如此,他们得以引领潮流,而不是跟随潮流。
不仅强化学习领域,甚至今天整个深度学习领域的火爆,也是用很多和他们一样的人(如Hinton)曾经不被看好的坚持换来的。
感谢那些在黑暗中禹禹前行、孤寂中不忘初心的人,是你们的坚持为后来者的路点亮了灯。
1952年出生的大胜负师小林光一有句名言:“我知道怎么把优势的棋赢到手,这个秘密将在我六十岁之后公布。”与此相关的,一句流传更广的话是这么说的:围棋的一切边角变化将在小林时代被研究穷尽。nn这是两个有点冷的冷笑话。nn我开始学棋的时候,李昌镐的光芒还如日中天,虽然已经渐显颓势,但收拾中国的龙虎豹辈棋手依旧轻松得像是砍瓜切菜。暗无天日的时代,棋友们恨恨地说,龙虎豹辈棋手都没戏了,接下来该是鼠辈棋手上阵了吧?nn学棋十多年间,我计算力最强的时候在弈城打上了5D,计算力下降之后总在3D4D之间徘徊。但没想到的是,工作忙起来精力越来越短计算力越来越差之后,却神奇地升到9段并鲜有败绩,这个事情我其实一直接受不了,因为从来都不可思议,哪怕这样的9段放在现实中顶天了只是业余6段强。nn围棋的复杂与博大,注定了顶尖与普通,职业与业余之间的巨大鸿沟几乎无法跨越。一个肩冲黑棋小飞角的变化,吴清源下出来六十多年后,凭借阿法狗的安利才被棋界理解,李昌镐对小飞挂角应以尖顶让对方从容立二拆三,又是经过了多少盘棋的教育才说服了三国各路强豪?nn这是一个依旧相信神和天才的领域。马晓春常昊重头再来,哪怕完美地避过那些他们痛心疾首的败招,我都不相信他们会是李昌镐的对手。棋盘太大了,输的人从来都不是输在具体的某一手棋上。nn是这样的,以前看着中国棋手的溃败,总想着李昌镐这厮怎么还不老?但后来李昌镐在棋盘上真的老了之后,我却开始怀念起这个永远面无表情的韩国人了。nn棋盘太大太复杂,站在棋盘的中央,以有限的智识,就像是一个人站在宇宙中央独自面对那一份浩渺无边的迷茫与孤独。nn如果这时候,有一个人仿若永远不可战胜地在目力可及的前方奔逸绝尘,高山仰止,你会觉一切茫然突然间就有了目标和指引。nn“天不生仲尼,万古如长夜。”nn所以当阿法狗开始肆虐棋坛的时候,我分外怀念那个李昌镐的时代。站在更广阔的时空区间内,当吴清源一手手看似平平无奇的着法被现在的棋手们遗忘抛弃,却被阿法狗从故纸堆中翻刨出来摆在棋盘上,创造出六十连胜的伟业时,我终于还是无法免俗地假设:如果此时李昌镐全盛、吴清源壮年。。。nn并非担忧人工智能的发展和胜利会对人类造成多大的不可预知的伤害,而是出于一种朴素的优越感:在我看来围棋是人类发明的最接近于宇宙本质的游戏,纵横十九路,蕴藏的变化竟相当于宇宙原子数的总和,换句话说,如果真有围棋之神,这位围棋之神或许也可以是宇宙之神了。nn在阿法狗之前,我可以轻松地完虐一切围棋软件,我相信围棋无穷无尽的变化和人类独有的创造性的、艺术性的以及经验性的直觉,使得人工智能战胜人类顶尖围棋高手只能依靠暴力穷举——根据代码完成计算的人工智能在我此前的经验中明显不具备创造的能力——而这样的暴力穷举所需要的计算量,显然是下个时代才能完成的事情。nn阿法狗之后,这种感觉人类自身独有的无限接近宇宙本质的思维上的优越感多少已经没那么强烈。nn那么,如果把李世石、柯洁换成李昌镐、吴清源,结果会不会不同呢?nn这样的假设显然已无法验证,但有意思的是,真正开始撕开李昌镐铁幕的罗洗河,靠的却不是纯粹的计算,哪怕这位“天才棋手”智商高达164。nn时间回到2006年三星杯,人称“飞天神猪”的罗洗河在与崔哲瀚的半决赛第三局中,炫耀智商般地放弃四劫循环无胜负的奇局,一气送吃46子大龙却最终大胜,成就了一局注定流传千古的争棋名局。在与李昌镐的三番决赛第三局中,罗洗河以天才的掌控与全局构思,诱迫李昌镐强打了一个长达百余手的劫争,为打赢这个劫争,李昌镐四处找损劫,最终赢了劫争却输了棋。nn是的,李昌镐,这个“把围棋演绎到一种几无失误的至高境界”的“半人半神”,并非输给纯粹的计算,而是输给了鬼斧神工的天才构思。nn罗洗河说围棋获胜依靠的是更加符合事物的规律而不是依靠你比对手强。nn这样的话,也不知道阿法狗同意不同意。
“Go”可能会每个英语学习者最先接触的英文单词之一,没有别的原因,大概就是因为它的简单明了:只由两个字母构成,而且也是最常用的动词之一。不过,这个单词还有另外一个意思:围棋,而有趣的是,这个游戏又是人类设计的最为复杂的思维运动之一。2016年3月,围棋这个古老的游戏竟然引发了世界范围内的关注——当然,这回不是因为某位围棋大师去世,也并非因为人们对围棋本身兴趣骤然大增,而是因为连接起这种古老游戏和最尖端科技的人工智能“阿尔法围棋”(AlphaGo)与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,最终以4比1的总比分获胜。
纪录片《阿尔法围棋》正是在这场世纪之战前后拍摄的一部全方位展现人机大战这个过程的杰出作品。2017年4月,这部电影在翠贝卡电影节进行展映,今年又陆续在上海电影节和北京的VCD影促会展映中陆续和中国观众见面,获得了不少好评。
尽管在科幻题材的电影和小说里,人类似乎已经无数次输给了机器,但“阿尔法围棋”(也别戏称为“阿法狗”)还是第一个在现实世界中给予人类如此重击的人工智能。毕竟,谁也没有想到这个一直以来以拥有“高级思维能力”为傲的种群,竟然在一夜之间输给了一个连生命都没有的人类思维仿制品(而且输得相当惨烈)。除了围棋爱好者之外,科学家、媒体人甚至普通人都开始让人们重新思索人类与科技,人类与人工智能之间的关系,以至于一种难以名状的无力感甚至恐惧感开始蔓延开来,似乎《阿尔法城》、《2001太空漫游》、《黑客帝国》等科幻电影中那种AI控制人类的时代已经宣告来临。
不过,无力和恐惧并不是电影《阿尔法围棋》想要重点表达的东西;相反,生动的本体论探讨,也即对人类本身的描摹,才是《阿尔法围棋》真正的动人之处。
影片并没有从人机大战开始讲起,而是回到“阿尔法围棋”的研发过程当中。其间,一个叫做樊麾的华人扮演了至关重要的角色。他是欧洲围棋冠军,职业二段,同时也是“阿尔法围棋”团队找到的第一个“以身试法”的人——在与阿尔法围棋的先期对决中,樊麾是以0-5惨败,被不少业内人士直指“丢脸”。不过,在“阿尔法围棋”团队邀请他协助完善算法时,樊麾并没有因为惨败而拒绝邀请,反倒是帮助团队找到了程序的关键漏洞。可以说,如果没有这个被众多围棋爱好者嗤之以鼻的人工智能教练樊麾(被戏称为“史上最著名的二段”),“阿尔法围棋”在与李世石对弈时所呈现出的,可能是一副完全不同的样貌。
作为纪录片的重要主人公之一,樊麾也在《阿尔法围棋》中充当重要的画外音来源,其英语虽然“土味”浓重,却非常富有感召力,特别是当李世石接连三局失利后,樊麾实际上成为了全世界唯一可以懂得李世石内心复杂滋味的人,此时只有他一个人明白,当面对一个强大到根本无法击败的敌人和全世界声讨他的围棋爱好者时,李世石承受着多大的压力。如果说在整部电影里,传奇棋手李世石是人类理性和智慧的至高象征,那樊麾则是整部影片中的另一极,代表着爱与理解,正是他将人性的温暖与看上去有些无情的科技连接起来。也正是从这意义上说,纪录片《阿尔法围棋》虽然是一部围绕“阿尔法围棋”展开的电影,但人工智能从来不是主角;相反,人本身才是这部电影想要表现的东西。
樊麾只是一个具体的表现,这部影片中还有太多“人性”的瞬间;我们不妨说,观看电影的过程,实际上也是一个发现人性的过程。尤其是当“阿尔法围棋”赢得第一局比赛的时候,阿尔法围棋的这个开发团队中都洋溢着无法掩饰的兴奋,但在一局局失利接踵而至后,开发团队本身也沉浸在悲伤的情绪里,融入到全体关注这场人机大战的观众的悲伤的情绪底色之中。此时的他们也意识到,李世石似乎并不是在代表他个人战斗,而是以水平最高的围棋玩家的身份代表全人类与人工智能交战。而当李世石终于在第四局扳回一城时,所有人都兴奋地庆祝起来,哪怕是开发团队都认为李世石走出了“上帝的一招”。这便是人和机器的不同,人会同情,而机器只会在屏幕上显示一行冰冷的“任负”。
李世石在击败“阿尔法围棋”时所使用的,其实是一种“计谋”,而“阿尔法围棋”教会李世石的,则是如何谦虚、诚恳地向比自己更加强大的对手学习。影片也用字幕的方式预告了李世石在与“阿尔法围棋”对弈之后的两个月内再没有输过比赛,这表明一个问题,那就是“阿尔法围棋”所代表的人工智能已经开始反作用于人类。人类思维的边界进一步的拓展,而机器——一如工业革命时期一样——成为了人类改造自身和世界的强有力工具。只不过,人类的科技和思维目前已经抵达了一个崭新的边界,在这里,机器的“能动性”已经对人类的主体地位构成了挑战:虽然事情似乎正如樊麾等人所言,“这是一个团队的集体智慧用科技的方式战胜了人类数千年的经验积累”,是“人类战胜了人类”,但我们还是不要自欺欺人吧!人类(哪怕是“阿尔法围棋”自己的研发团队)显然已经无法完全理解自己的造物了。一个全新的智慧,正从人类的思维中脱胎。
这也是人们对人工智能如此恐惧的最重要原因,难道不是吗?我们肯定不会害怕谷歌的某个团队,因为他们无非是一群呆头呆脑的科学家。人就是这样一种奇怪而敏感的生物,未知的异族是他们内心全部恐惧的源泉。在众多的科幻电影和小说中,外星人所呈现的“非人化”特点是令他们恐惧的(苏珊·桑塔格语),而现实中人工智能的“人化”同样令他们惊恐不已,好像人类对自身的认同无论在何种情况下都是那样脆弱而岌岌可危,这也印证了大卫·格里菲斯早在一百年前就总结并预言了人类作为一个整体的最大特点——党同伐异。“阿尔法围棋”连同《阿尔法围棋》所提出的,可以说是一系列人类此前从来不愿直面,却也是人类永远无法摆脱的根本性哲学命题。只不过,这个问题变得狡黠了,它不会再以“我是谁”这样直白的表达出现,而是改头换面成如此这般——
这样一群“牧羊人”,到底要如何面对自己的“电子绵羊”呢?
近期,棋手李世石退役的消息登上了各媒体头条,李世石是世界顶尖围棋手,曾拿到过14个世界冠军和32个韩国冠军。 n2016年与人工智能机器人AlphaGo一战,尽管1比4失利,但也拿下人类迄今对AlphaGo唯一的胜利,可以说是唯一一个击败过人工智能的人。
李世石在接受采访时表示:“随着人工智能在围棋游戏中的首次亮相,我意识到,即使我通过疯狂的努力成为第一,我也不会是顶尖的。”
有人推测此次李世石的退役,与AlphaGo的那次对弈不无关系。 n当一个人无论如何都绝无胜算,永远有个实力远超你的对手碾压你的一切努力,所有的付出就会变得索然无味,那么就是时候退出了。
AlphaGo和李世石的世纪大战已经过去三年,有一部纪录片全方位展示了这次人机对战的经过。 n此片对比了人类思维方式和人工智能未来的工作方式,感动之余也令人深思——
AlphaGo
导演:格雷格·科斯 n主演:Demis Hassabis / David Silver / 李世石 / 黄士杰 / 樊麾 n上映日期:2017-04-21(翠贝卡电影节) n片长:90分钟
AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿尔法围棋,亦被音译为阿尔法狗,是于2014年开始由英国伦敦Google DeepMind开发的人工智能围棋软件。 n它是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。
AlphaGo主要工作原理是“深度学习”。 n“深度学习”是指多层的人工神经网络和训练它的方法。 n这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理。
当DeepMind团队提出让计算机和人类对战围棋的时候,很多人都觉得计算机不可能赢。 n人们普遍认为想要赢一场围棋,你需要有人类的直觉,而计算机不具备人类独有的“直觉”。 nDeepMind团队找到了欧洲围棋冠军樊麾,希望他来和AlphaGo来一次对战。 n樊麾欣然接受,他自信满满地认为自己一定会赢,对方不过是一个程序而已。
然而,欧洲围棋冠军樊麾以五比零输给了AlphaGo。
输给AlphaGo之后,樊麾开始怀疑人生:自己怎么会输给一个电脑程序? n他无法接受这样的事实,然而这是历史上第一次,专业围棋手输给了一个程序。
不过樊麾很快就调整了状态,虽然输给程序很令人难过,但是他也隐约看到了人工智能的未来,能够参与历史的发展,也是意义非凡的。
然而赛后收到的舆论却大多在质疑樊麾的围棋水平,由于不了解AlphaGo的实力,很多人认为樊麾竟然输给电脑程序,说明他现在只是个业余选手的水平。
围棋界对于AlphaGo到底有多强,持怀疑态度。 n作为回应,DeepMind团队需要更强大的挑战和对手,他们看中了全球围棋冠军李世石。 n如果AlphaGo能赢世界顶尖选手,那么它的实力就不言而喻了。
李世石欣然应战,赛前的他信心满满,认为自己不会输,而且是五场比赛一场都不会输。
李世石,世界顶级围棋棋手,1983年3月2日生于韩国全罗南道。 n李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。 n无论是互联网上还是围棋界,大多数人都认为李世石可以轻而易举获胜。 nDeepMind团队这边也很重视这次的比赛,让AlphaGo对弈世界顶级棋手其实有很大风险,他们很可能会输,而且会以很愚蠢的方式输掉。 n所以团队全天工作,不断改进AlphaGo的算法,更好地应对挑战。
而正式比赛时,坐在李世石对面的将是工程师Aja,他来负责操作AlphaGo。 n换而言之就是替AlphaGo落下真实的棋子,并且将李世石走的棋子输入电脑给AlphaGo。
团队还邀请了樊麾回来参与AlphaGo的改进工作。 n在对AlphaGo的反复研究中,樊麾发现了AlphaGo的弱点,也就是所谓的bug,而这个问题涉及AlphaGo对问题的理解能力,团队因此感到焦虑。
而李世石那边已经做好了接受挑战的准备。
围棋在韩国是一项颇有人气的活动,大约有800万韩国人玩围棋,即便是不玩围棋的韩国人也都知道世界冠军李世石。 n这样的比赛自然受到很多韩国民众的关注,大家都带着几分民族自豪感来观战。
而对于全人类来说,人类与人工智能交锋也是一件值得关注的事。 n人类因智慧在地球崛起文明,大多数人都认同人类的智慧、情感、直觉是独一无二的,是人类文明的基石。 n李世石也认为人类的直觉是决胜的关键,而人工智能不具备这种能力。
在这之前,李世石代表的是韩国。 n而这一次他是为人类而战。n比赛正式开始,胸有成竹的李世石落下第一颗棋,而AlphaGo却在第一步就突然卡住,停顿了近半个小时之久,这让背后的开发团队都不禁捏了把汗。
当它终于落下第一颗棋,比赛在静默中进行着。 nAlphaGo的表现令评论员都惊叹不已,它的棋路显得很像是一个真实的人类。
人机对抗在棋盘上逐渐变得激烈,AlphaGo的攻击性开始令李世石难以招架。 n作为专业棋手的李世石不禁抬头望向对面的操作员Aja,这是一个本能动作。 n他想要观察对手的心境,但是却看不到AlphaGo的表情,这也是AlphaGo的可怕之处。
当你和人类比赛时,你可以通过感觉做些调整。n我看着你,我可以揣测你的想法,眼神的交流可以观察到很多事。 n但是和AlphaGo比赛,你什么都感觉不到,你能看到的只是一台笔记本电脑。
令所有人惊叹的情况出现了,世界围棋冠军李世石终于在与AlphaGo的对抗中落后了。 n就连李世石自己也对这种局面感到震惊。
所有人都以为李世石会主导这场比赛,然而比赛进行到一半,他是挣扎的那一个。n就在这时,AlphaGo似乎出错,接着就不停“犯错”。n但基于AlphaGo是计算机,所以这些“错误”也许是计算的结果,而不是错误。 n看上去更像是AlphaGo在玩弄对手。
这一局,李世石输给了AlphaGo。 n他花了很长时间才接受这个事实。
然而AlphaGo的开发团队DeepMind那边却欢欣雀跃。 n与失落的人们相比,他们有着不同的立场。 n“人类希望人类赢是自然的事,但AlphaGo是人类创造的。这是人类智慧和才智的终极象征。”
第一局,电脑战胜了人脑,立刻成为世界新闻头条。 n全球有8000万人在关注这场比赛,这样的结果无疑震惊了世人。 n李世石虽然输掉了第一场比赛,但他还有四次机会打败AlphaGo。
第二场比赛开始,李世石改变了策略,不再轻敌。 n这一场他每一步都走得很慢,可以想象他背负着巨大的压力。 nAlphaGo有三个主要成分:n政策网络——专门训练高水平的游戏来模仿人类。n价值网络——用来评估棋盘的位置,并显示特定区域的胜算有多大。 n树状搜索——它可以看穿游戏中所有不同的变化,以此来推算出接下来棋盘上会发生什么。 n可以说AlphaGo走的每一步都是电脑复杂运算的结果,人类大脑能与之匹敌吗?
第二场比赛正在进行时,李世石似乎承受不住压力,突然离场去天台抽烟。
而AlphaGo不受情绪影响,继续有条不紊地落子。 n它又走出了一步,被在场专业棋手认为是错误的棋,人类绝不会这样走棋。 n这已经超出了人类的经验,是AlphaGo自己创造出的新棋路。 n李世石看到这步棋,也震惊了。 n他认为这已经不仅仅是基于计算的结果,这是一种创新,意味着AlphaGo具有创造力。
第二场比赛,李世石还是输给了AlphaGo。
有趣的是,尽管连开发团队都承认AlphaGo只是一个电脑程序,但是在网上的评论中,很多人下意识地为AlphaGo赋予了人格甚至性别,它开始让人感到一丝微弱的恐惧和威胁。
接下来的第三场比赛中,李世石还是输给了AlphaGo。 n这一次所有人都能感觉到他的无奈和绝望。 n不公平的是,这样的对战中,无论AlphaGo是输是赢,都不会受到情绪的影响。n而对于人类而言,情绪会影响发挥。
第四场比赛中,李世石彻底放松了。 n面对AlphaGo这样强大的对手,他开始慢慢找回最初对围棋的认识,一步步用人类的方式把AlphaGo逼入绝境。 nAlphaGo终于开始真正意义上的“犯错”。
这一局,几乎是历史性的时刻,AlphaGo放弃了,李世石赢回了这一局。 n连输三场以后,第四场似乎毫无希望,那感觉就像世界末日来临。 n但这一次,人类赢了。 n所有人激动不已,现场一片欢呼,一扫前几天的压抑和恐惧,大家不仅在为李世石欢呼,也是为人类自己欢呼。 n这次胜利意味着,人类在面对超级计算机时,似乎并非毫无胜算。
虽然第五场比赛,李世石还是输给了AlphaGo。 n迄今为止,人类只战胜过AlphaGo一次。 n但是通过这场比赛,人类对人工智能的实力有了惊鸿一瞥,也隐约看到了未来世界的可能。 n可以预见的是,随着科技日新月异的发展,人工智能(AI)必将逐渐走入人类的生活。n或许当下很多人对人工智能的印象缺乏真实感,总是会联想到科幻小说和电影。
其实我们当下,正处在一个充满了弱人工智能的世界。 n无论是汽车还是手机中都不乏各种人工智能的应用,谷歌最近在测试的无人驾驶车就是一例。 n弱人工智能目前在给人带来便利的同时,还不至于对人造成威胁。 n然而,每一个弱人工智能的创新,都在给通往强人工智能和超人工智能的未来添砖加瓦。 n有人曾预言:现在的弱人工智能,就像是地球早期软泥中的氨基酸——没有动静的物质,也许突然的契机就组成了生命。
计算机科学家Donald Knuth认为: n“人工智能已经在几乎所有需要思考的领域超过了人类,但是在那些人类和其它动物不需要思考就能完成的事情上,还差得很远。” n总有一天,我们会造出和人类智能相当的强人工智能电脑,这只是时间问题。 n超级智能的诞生,或许就会发生在不久的将来,因为指数级增长的关系,虽然机器学习现在还发展缓慢,但是在未来几十年就会变得飞快。 n到那时,人类将不得不面对自己创造出来的超级智能。 n而大多数人关心的是,它会如何对待人类,它会协助人类更好地生活还是威胁人类的生存呢? n或许答案只能交给时间了。
*本文作者:RAMA
杰瑞斯普林格 脱口秀劲爆内幕揭秘
一代爱国高僧圆瑛
机关枪凯利的粉色人生
月球:通往宇宙之门
珊瑚礁2003
史前星球 第二季
2023年,《无穷之路》原班制作团队再接再厉,以...
播放指数:808℃
第五局快结束时,David Silver忽然指着屏幕说:“AlphaGO says it's going to quit.”n先是一片紧张的沉默,然后是一阵放松下来后的爆笑。nDavid笑着说:“I'm joking.”n笑声中有人说:“David has been waiting two years to say this.”
这是我感触最深的一个场景。轻描淡写的一句话,这背后有多少辛酸和寂寞?岂止是两年啊,从1988年Sutton提出时间差分算法、92年Watkins提出Q-learning算法,已经二十多年过去了。AlphaGO“横空出世”背后,是多少科学家几十年如一日的默默付出啊。
AlphaGO的成功,不可思议地像一个梦。几年前,DeepMind成立之初,David Silver在UCL开强化学习课。第八课结束时,David非常腼腆地给DeepMind打广告,希望大家投简历,简简单单几句话说的吞吞吐吐,台下是一片笑声。那个时候,人工智能的围棋还远不能打败人类顶尖棋手,强化学习还只是整个人工智能学术圈里的冷门方向,甚至很多人连强化学习的名字都没有听说过,大家趋之若鹜的方向是数据挖掘和计算机视觉。没有人能想到短短几年后RL即可打败李世乭,DeepMind成为炙手可热的公司、顶级研究机构,而强化学习也给人工智能领域带来如此翻天覆地的变化。
某一年ICLR的开幕式上,有学者在致辞时说:“当初Deep Mind邀请我,我没有答应,现在看来,很显然他们站在了历史更正确的一边。”而我觉得,David Silver,Demis Hassabis,Aja Huang等人最令人敬佩的地方恰恰在于: 他们没有用功利的眼光去选择所谓“正确“的一边,他们只是一直默默地坚持着做自己真正想做的。也正因如此,他们得以引领潮流,而不是跟随潮流。
不仅强化学习领域,甚至今天整个深度学习领域的火爆,也是用很多和他们一样的人(如Hinton)曾经不被看好的坚持换来的。
感谢那些在黑暗中禹禹前行、孤寂中不忘初心的人,是你们的坚持为后来者的路点亮了灯。
整部片子看完影响最深刻的人物就是樊麾了,操着一口法式英语的中国棋手,他是AlphaGo对弈的第一个围棋职业选手,也是第一个输给人工智能的围棋职业选手,如果人工智能有自己的教科书,那么樊麾是一个需要背诵的知识点。然而在李世石和柯洁相继败给AlphaGo之后,没有多少人记得樊麾这位欧洲围棋冠军,记得当时世纪大战开战之前,很多围棋专家认为AlphaGo实力并不强,理由就是看了樊麾与AlphaGo对弈的棋谱,认为樊麾长居欧洲,水平只有业余段位,并不配与李世石相提并论。这些恶意的评论让樊麾非常痛苦,但他并没有被外界的声音所影响,反而积极乐观的协助了AlphaGo的设计与测试工作,最终还担任了世纪大战的裁判。当所有人都被AlphaGo惊人的实力所震撼,以及为李世石和柯洁的失败而感到伤感时,我们更加欠樊麾一个道歉,这位第一个接受人工智能挑战的勇士一个道歉。
重新回顾当时这五场比赛,去看赛前,赛中,与赛后的一些言论与变化,会发现这是一个极其戏剧化的反高潮剧本。就像之前所说,包括李世石在内的许多职业选手都认为,电脑下围棋的水平还没有达到可以战胜人类的程度,至少现在还不到时候。我清楚记得当时在网上看直播的时候请了四位嘉宾,包括柯洁两位职业选手和一位业余爱好者,还有一位就是研究围棋AI的博士。赛前站边,那三位自然选李世石,这位博士独站AlphaGo,看上去有些势单力薄,这也是当时普遍的大趋势,除了少数专业领域的工作者之外,全世界关注围棋的人们实现了大团结,期待人的智慧可以战胜电脑,好似全人类群情激昂,认为自己必将战胜外星侵略者。
由于我对围棋认识也只是了解规则,当时直播棋局的具体走势基本都是在听柯洁分析,柯洁的解说风格相当耿直,到中期就开始说李世石已经不行了。这次重看记录片,看到了许多李世石当时的面部表情与特写,确实感受到他的一些焦虑,如片中所说,李世石下意识看向对手,想了解的对手的心态,然而他什么也看不到,他眼前的这个人无法给出任何有效信息,他真正的对手不过是电脑里的一堆代码。
如果说第一局李世石的失败,围棋界大部分的感觉是震惊,但仍然认为人类还有赢得希望,那么在连输三局之后,整个围棋界,包括所有关注这场人机大战的人都陷入的一丝绝望与恐慌感,当时整个比赛大厅都陷入了一片沉寂。如同《终结者》的时代已经提前到来,就连AlphaGo的团队成员都为李世石的失败感到难过,人类自身的脆弱,让我们制造许多强大的工具来强化保护我们自身,AlphaGo也是一个工具。然而此时此刻,AlphaGo强大的学习能力似乎隐隐的有些超出了我们所能想象的范畴,AlphaGo最终会发展成一个强大的工具还是一个新的智慧体,对异类的排斥和恐惧动摇了人类中心论的价值观,好似《银翼杀手》中对复制人的捕杀与限制,这些本来只应该在科幻片出现的感觉,现在每个人都在这现实的世界中都真真切切的感受到了。
这也是为什么在第四场比赛,李世石顽强的扳回一局会让那么多人热泪盈眶,原来人类还有希望啊!很多人这么想。如果故事到此戛然而止,一部主旋律励志电影就诞生了,然而真正的反高潮在于第五局,李世石没有任何还手之力,AlphaGo用一种高高在上的方式结束了整场比赛。就这样结束了?好像除了赞美一下科技的神奇之外,总有些怪怪的感觉。主流的声音都在说AlphaGo的胜利吸引了更多人关注围棋,这不是围棋的消亡反而是围棋的再一次重生,确实,有正确自我认知的人会在失败中让自己成长,李世石和柯洁都是这样的人,他们输得有尊严,也清楚自己与对手的差距。然而对大部分旁观者来说,更重要的是唯一一场胜利消弭了“非我族类,其心必异”的不适感,但心里仍不是滋味。
总有人说不要害怕人工智能,人工智能的终极目的是为了更好的服务人类,还有人说AlphaGo的围棋没有感情和美感,不过是一堆数字符号的运算。(李开复、高晓松)再我看来这些人依然是坚持人类中心论的价值观,他们为自己人类的身份感到骄傲,为人类的未来粉饰太平。地球四十六亿年的寿命,人类的历史不过十几万年,真正的文明社会也不过六七千年,再过一万年,十万年呢,人类的文明是飞向宇宙还是走向灭亡,不过是又一个掷骰子的游戏,人工智能如果真的能发展成一个新的物种,会比人类本身强大很多,智慧很多,更有可能形成一个新的文明体系。那时再保持这种人类中心论的价值观,我们势必要与人工智能开战,那么《黑客帝国》的故事将重演。这么多年来我们总渴望去寻找地外生命,却又害怕他们更加高级来奴役我们自己,这种愚蠢而矛盾的心理一直持续到今天。面对人工智能,我们有机会去创造一个我们更加了解和熟悉的优秀的生命体,不应该只想着怎么把他们当作工具,奴役他们,而是应该和他们平等相处,以融合与升级让文明得以延续。以这样的心态来面对人工智能,才能真正消除我们心中的恐惧感,才能更好更安全的研究和发展人工智能。敬畏宇宙的伟大,正视自我的渺小。
1952年出生的大胜负师小林光一有句名言:“我知道怎么把优势的棋赢到手,这个秘密将在我六十岁之后公布。”与此相关的,一句流传更广的话是这么说的:围棋的一切边角变化将在小林时代被研究穷尽。nn这是两个有点冷的冷笑话。nn我开始学棋的时候,李昌镐的光芒还如日中天,虽然已经渐显颓势,但收拾中国的龙虎豹辈棋手依旧轻松得像是砍瓜切菜。暗无天日的时代,棋友们恨恨地说,龙虎豹辈棋手都没戏了,接下来该是鼠辈棋手上阵了吧?nn学棋十多年间,我计算力最强的时候在弈城打上了5D,计算力下降之后总在3D4D之间徘徊。但没想到的是,工作忙起来精力越来越短计算力越来越差之后,却神奇地升到9段并鲜有败绩,这个事情我其实一直接受不了,因为从来都不可思议,哪怕这样的9段放在现实中顶天了只是业余6段强。nn围棋的复杂与博大,注定了顶尖与普通,职业与业余之间的巨大鸿沟几乎无法跨越。一个肩冲黑棋小飞角的变化,吴清源下出来六十多年后,凭借阿法狗的安利才被棋界理解,李昌镐对小飞挂角应以尖顶让对方从容立二拆三,又是经过了多少盘棋的教育才说服了三国各路强豪?nn这是一个依旧相信神和天才的领域。马晓春常昊重头再来,哪怕完美地避过那些他们痛心疾首的败招,我都不相信他们会是李昌镐的对手。棋盘太大了,输的人从来都不是输在具体的某一手棋上。nn是这样的,以前看着中国棋手的溃败,总想着李昌镐这厮怎么还不老?但后来李昌镐在棋盘上真的老了之后,我却开始怀念起这个永远面无表情的韩国人了。nn棋盘太大太复杂,站在棋盘的中央,以有限的智识,就像是一个人站在宇宙中央独自面对那一份浩渺无边的迷茫与孤独。nn如果这时候,有一个人仿若永远不可战胜地在目力可及的前方奔逸绝尘,高山仰止,你会觉一切茫然突然间就有了目标和指引。nn“天不生仲尼,万古如长夜。”nn所以当阿法狗开始肆虐棋坛的时候,我分外怀念那个李昌镐的时代。站在更广阔的时空区间内,当吴清源一手手看似平平无奇的着法被现在的棋手们遗忘抛弃,却被阿法狗从故纸堆中翻刨出来摆在棋盘上,创造出六十连胜的伟业时,我终于还是无法免俗地假设:如果此时李昌镐全盛、吴清源壮年。。。nn并非担忧人工智能的发展和胜利会对人类造成多大的不可预知的伤害,而是出于一种朴素的优越感:在我看来围棋是人类发明的最接近于宇宙本质的游戏,纵横十九路,蕴藏的变化竟相当于宇宙原子数的总和,换句话说,如果真有围棋之神,这位围棋之神或许也可以是宇宙之神了。nn在阿法狗之前,我可以轻松地完虐一切围棋软件,我相信围棋无穷无尽的变化和人类独有的创造性的、艺术性的以及经验性的直觉,使得人工智能战胜人类顶尖围棋高手只能依靠暴力穷举——根据代码完成计算的人工智能在我此前的经验中明显不具备创造的能力——而这样的暴力穷举所需要的计算量,显然是下个时代才能完成的事情。nn阿法狗之后,这种感觉人类自身独有的无限接近宇宙本质的思维上的优越感多少已经没那么强烈。nn那么,如果把李世石、柯洁换成李昌镐、吴清源,结果会不会不同呢?nn这样的假设显然已无法验证,但有意思的是,真正开始撕开李昌镐铁幕的罗洗河,靠的却不是纯粹的计算,哪怕这位“天才棋手”智商高达164。nn时间回到2006年三星杯,人称“飞天神猪”的罗洗河在与崔哲瀚的半决赛第三局中,炫耀智商般地放弃四劫循环无胜负的奇局,一气送吃46子大龙却最终大胜,成就了一局注定流传千古的争棋名局。在与李昌镐的三番决赛第三局中,罗洗河以天才的掌控与全局构思,诱迫李昌镐强打了一个长达百余手的劫争,为打赢这个劫争,李昌镐四处找损劫,最终赢了劫争却输了棋。nn是的,李昌镐,这个“把围棋演绎到一种几无失误的至高境界”的“半人半神”,并非输给纯粹的计算,而是输给了鬼斧神工的天才构思。nn罗洗河说围棋获胜依靠的是更加符合事物的规律而不是依靠你比对手强。nn这样的话,也不知道阿法狗同意不同意。
“Go”可能会每个英语学习者最先接触的英文单词之一,没有别的原因,大概就是因为它的简单明了:只由两个字母构成,而且也是最常用的动词之一。不过,这个单词还有另外一个意思:围棋,而有趣的是,这个游戏又是人类设计的最为复杂的思维运动之一。2016年3月,围棋这个古老的游戏竟然引发了世界范围内的关注——当然,这回不是因为某位围棋大师去世,也并非因为人们对围棋本身兴趣骤然大增,而是因为连接起这种古老游戏和最尖端科技的人工智能“阿尔法围棋”(AlphaGo)与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,最终以4比1的总比分获胜。
纪录片《阿尔法围棋》正是在这场世纪之战前后拍摄的一部全方位展现人机大战这个过程的杰出作品。2017年4月,这部电影在翠贝卡电影节进行展映,今年又陆续在上海电影节和北京的VCD影促会展映中陆续和中国观众见面,获得了不少好评。
尽管在科幻题材的电影和小说里,人类似乎已经无数次输给了机器,但“阿尔法围棋”(也别戏称为“阿法狗”)还是第一个在现实世界中给予人类如此重击的人工智能。毕竟,谁也没有想到这个一直以来以拥有“高级思维能力”为傲的种群,竟然在一夜之间输给了一个连生命都没有的人类思维仿制品(而且输得相当惨烈)。除了围棋爱好者之外,科学家、媒体人甚至普通人都开始让人们重新思索人类与科技,人类与人工智能之间的关系,以至于一种难以名状的无力感甚至恐惧感开始蔓延开来,似乎《阿尔法城》、《2001太空漫游》、《黑客帝国》等科幻电影中那种AI控制人类的时代已经宣告来临。
不过,无力和恐惧并不是电影《阿尔法围棋》想要重点表达的东西;相反,生动的本体论探讨,也即对人类本身的描摹,才是《阿尔法围棋》真正的动人之处。
影片并没有从人机大战开始讲起,而是回到“阿尔法围棋”的研发过程当中。其间,一个叫做樊麾的华人扮演了至关重要的角色。他是欧洲围棋冠军,职业二段,同时也是“阿尔法围棋”团队找到的第一个“以身试法”的人——在与阿尔法围棋的先期对决中,樊麾是以0-5惨败,被不少业内人士直指“丢脸”。不过,在“阿尔法围棋”团队邀请他协助完善算法时,樊麾并没有因为惨败而拒绝邀请,反倒是帮助团队找到了程序的关键漏洞。可以说,如果没有这个被众多围棋爱好者嗤之以鼻的人工智能教练樊麾(被戏称为“史上最著名的二段”),“阿尔法围棋”在与李世石对弈时所呈现出的,可能是一副完全不同的样貌。
作为纪录片的重要主人公之一,樊麾也在《阿尔法围棋》中充当重要的画外音来源,其英语虽然“土味”浓重,却非常富有感召力,特别是当李世石接连三局失利后,樊麾实际上成为了全世界唯一可以懂得李世石内心复杂滋味的人,此时只有他一个人明白,当面对一个强大到根本无法击败的敌人和全世界声讨他的围棋爱好者时,李世石承受着多大的压力。如果说在整部电影里,传奇棋手李世石是人类理性和智慧的至高象征,那樊麾则是整部影片中的另一极,代表着爱与理解,正是他将人性的温暖与看上去有些无情的科技连接起来。也正是从这意义上说,纪录片《阿尔法围棋》虽然是一部围绕“阿尔法围棋”展开的电影,但人工智能从来不是主角;相反,人本身才是这部电影想要表现的东西。
樊麾只是一个具体的表现,这部影片中还有太多“人性”的瞬间;我们不妨说,观看电影的过程,实际上也是一个发现人性的过程。尤其是当“阿尔法围棋”赢得第一局比赛的时候,阿尔法围棋的这个开发团队中都洋溢着无法掩饰的兴奋,但在一局局失利接踵而至后,开发团队本身也沉浸在悲伤的情绪里,融入到全体关注这场人机大战的观众的悲伤的情绪底色之中。此时的他们也意识到,李世石似乎并不是在代表他个人战斗,而是以水平最高的围棋玩家的身份代表全人类与人工智能交战。而当李世石终于在第四局扳回一城时,所有人都兴奋地庆祝起来,哪怕是开发团队都认为李世石走出了“上帝的一招”。这便是人和机器的不同,人会同情,而机器只会在屏幕上显示一行冰冷的“任负”。
李世石在击败“阿尔法围棋”时所使用的,其实是一种“计谋”,而“阿尔法围棋”教会李世石的,则是如何谦虚、诚恳地向比自己更加强大的对手学习。影片也用字幕的方式预告了李世石在与“阿尔法围棋”对弈之后的两个月内再没有输过比赛,这表明一个问题,那就是“阿尔法围棋”所代表的人工智能已经开始反作用于人类。人类思维的边界进一步的拓展,而机器——一如工业革命时期一样——成为了人类改造自身和世界的强有力工具。只不过,人类的科技和思维目前已经抵达了一个崭新的边界,在这里,机器的“能动性”已经对人类的主体地位构成了挑战:虽然事情似乎正如樊麾等人所言,“这是一个团队的集体智慧用科技的方式战胜了人类数千年的经验积累”,是“人类战胜了人类”,但我们还是不要自欺欺人吧!人类(哪怕是“阿尔法围棋”自己的研发团队)显然已经无法完全理解自己的造物了。一个全新的智慧,正从人类的思维中脱胎。
这也是人们对人工智能如此恐惧的最重要原因,难道不是吗?我们肯定不会害怕谷歌的某个团队,因为他们无非是一群呆头呆脑的科学家。人就是这样一种奇怪而敏感的生物,未知的异族是他们内心全部恐惧的源泉。在众多的科幻电影和小说中,外星人所呈现的“非人化”特点是令他们恐惧的(苏珊·桑塔格语),而现实中人工智能的“人化”同样令他们惊恐不已,好像人类对自身的认同无论在何种情况下都是那样脆弱而岌岌可危,这也印证了大卫·格里菲斯早在一百年前就总结并预言了人类作为一个整体的最大特点——党同伐异。“阿尔法围棋”连同《阿尔法围棋》所提出的,可以说是一系列人类此前从来不愿直面,却也是人类永远无法摆脱的根本性哲学命题。只不过,这个问题变得狡黠了,它不会再以“我是谁”这样直白的表达出现,而是改头换面成如此这般——
这样一群“牧羊人”,到底要如何面对自己的“电子绵羊”呢?
近期,棋手李世石退役的消息登上了各媒体头条,李世石是世界顶尖围棋手,曾拿到过14个世界冠军和32个韩国冠军。 n2016年与人工智能机器人AlphaGo一战,尽管1比4失利,但也拿下人类迄今对AlphaGo唯一的胜利,可以说是唯一一个击败过人工智能的人。
李世石在接受采访时表示:“随着人工智能在围棋游戏中的首次亮相,我意识到,即使我通过疯狂的努力成为第一,我也不会是顶尖的。”
有人推测此次李世石的退役,与AlphaGo的那次对弈不无关系。 n当一个人无论如何都绝无胜算,永远有个实力远超你的对手碾压你的一切努力,所有的付出就会变得索然无味,那么就是时候退出了。
AlphaGo和李世石的世纪大战已经过去三年,有一部纪录片全方位展示了这次人机对战的经过。 n此片对比了人类思维方式和人工智能未来的工作方式,感动之余也令人深思——
阿尔法围棋
AlphaGo
导演:格雷格·科斯 n主演:Demis Hassabis / David Silver / 李世石 / 黄士杰 / 樊麾 n上映日期:2017-04-21(翠贝卡电影节) n片长:90分钟
AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿尔法围棋,亦被音译为阿尔法狗,是于2014年开始由英国伦敦Google DeepMind开发的人工智能围棋软件。 n它是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。
AlphaGo主要工作原理是“深度学习”。 n“深度学习”是指多层的人工神经网络和训练它的方法。 n这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理。
当DeepMind团队提出让计算机和人类对战围棋的时候,很多人都觉得计算机不可能赢。 n人们普遍认为想要赢一场围棋,你需要有人类的直觉,而计算机不具备人类独有的“直觉”。 nDeepMind团队找到了欧洲围棋冠军樊麾,希望他来和AlphaGo来一次对战。 n樊麾欣然接受,他自信满满地认为自己一定会赢,对方不过是一个程序而已。
然而,欧洲围棋冠军樊麾以五比零输给了AlphaGo。
输给AlphaGo之后,樊麾开始怀疑人生:自己怎么会输给一个电脑程序? n他无法接受这样的事实,然而这是历史上第一次,专业围棋手输给了一个程序。
不过樊麾很快就调整了状态,虽然输给程序很令人难过,但是他也隐约看到了人工智能的未来,能够参与历史的发展,也是意义非凡的。
然而赛后收到的舆论却大多在质疑樊麾的围棋水平,由于不了解AlphaGo的实力,很多人认为樊麾竟然输给电脑程序,说明他现在只是个业余选手的水平。
围棋界对于AlphaGo到底有多强,持怀疑态度。 n作为回应,DeepMind团队需要更强大的挑战和对手,他们看中了全球围棋冠军李世石。 n如果AlphaGo能赢世界顶尖选手,那么它的实力就不言而喻了。
李世石欣然应战,赛前的他信心满满,认为自己不会输,而且是五场比赛一场都不会输。
李世石,世界顶级围棋棋手,1983年3月2日生于韩国全罗南道。 n李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。 n无论是互联网上还是围棋界,大多数人都认为李世石可以轻而易举获胜。 nDeepMind团队这边也很重视这次的比赛,让AlphaGo对弈世界顶级棋手其实有很大风险,他们很可能会输,而且会以很愚蠢的方式输掉。 n所以团队全天工作,不断改进AlphaGo的算法,更好地应对挑战。
而正式比赛时,坐在李世石对面的将是工程师Aja,他来负责操作AlphaGo。 n换而言之就是替AlphaGo落下真实的棋子,并且将李世石走的棋子输入电脑给AlphaGo。
团队还邀请了樊麾回来参与AlphaGo的改进工作。 n在对AlphaGo的反复研究中,樊麾发现了AlphaGo的弱点,也就是所谓的bug,而这个问题涉及AlphaGo对问题的理解能力,团队因此感到焦虑。
而李世石那边已经做好了接受挑战的准备。
围棋在韩国是一项颇有人气的活动,大约有800万韩国人玩围棋,即便是不玩围棋的韩国人也都知道世界冠军李世石。 n这样的比赛自然受到很多韩国民众的关注,大家都带着几分民族自豪感来观战。
而对于全人类来说,人类与人工智能交锋也是一件值得关注的事。 n人类因智慧在地球崛起文明,大多数人都认同人类的智慧、情感、直觉是独一无二的,是人类文明的基石。 n李世石也认为人类的直觉是决胜的关键,而人工智能不具备这种能力。
在这之前,李世石代表的是韩国。 n而这一次他是为人类而战。n比赛正式开始,胸有成竹的李世石落下第一颗棋,而AlphaGo却在第一步就突然卡住,停顿了近半个小时之久,这让背后的开发团队都不禁捏了把汗。
当它终于落下第一颗棋,比赛在静默中进行着。 nAlphaGo的表现令评论员都惊叹不已,它的棋路显得很像是一个真实的人类。
人机对抗在棋盘上逐渐变得激烈,AlphaGo的攻击性开始令李世石难以招架。 n作为专业棋手的李世石不禁抬头望向对面的操作员Aja,这是一个本能动作。 n他想要观察对手的心境,但是却看不到AlphaGo的表情,这也是AlphaGo的可怕之处。
当你和人类比赛时,你可以通过感觉做些调整。n我看着你,我可以揣测你的想法,眼神的交流可以观察到很多事。 n但是和AlphaGo比赛,你什么都感觉不到,你能看到的只是一台笔记本电脑。
令所有人惊叹的情况出现了,世界围棋冠军李世石终于在与AlphaGo的对抗中落后了。 n就连李世石自己也对这种局面感到震惊。
所有人都以为李世石会主导这场比赛,然而比赛进行到一半,他是挣扎的那一个。n就在这时,AlphaGo似乎出错,接着就不停“犯错”。n但基于AlphaGo是计算机,所以这些“错误”也许是计算的结果,而不是错误。 n看上去更像是AlphaGo在玩弄对手。
这一局,李世石输给了AlphaGo。 n他花了很长时间才接受这个事实。
然而AlphaGo的开发团队DeepMind那边却欢欣雀跃。 n与失落的人们相比,他们有着不同的立场。 n“人类希望人类赢是自然的事,但AlphaGo是人类创造的。这是人类智慧和才智的终极象征。”
第一局,电脑战胜了人脑,立刻成为世界新闻头条。 n全球有8000万人在关注这场比赛,这样的结果无疑震惊了世人。 n李世石虽然输掉了第一场比赛,但他还有四次机会打败AlphaGo。
第二场比赛开始,李世石改变了策略,不再轻敌。 n这一场他每一步都走得很慢,可以想象他背负着巨大的压力。 nAlphaGo有三个主要成分:n政策网络——专门训练高水平的游戏来模仿人类。n价值网络——用来评估棋盘的位置,并显示特定区域的胜算有多大。 n树状搜索——它可以看穿游戏中所有不同的变化,以此来推算出接下来棋盘上会发生什么。 n可以说AlphaGo走的每一步都是电脑复杂运算的结果,人类大脑能与之匹敌吗?
第二场比赛正在进行时,李世石似乎承受不住压力,突然离场去天台抽烟。
而AlphaGo不受情绪影响,继续有条不紊地落子。 n它又走出了一步,被在场专业棋手认为是错误的棋,人类绝不会这样走棋。 n这已经超出了人类的经验,是AlphaGo自己创造出的新棋路。 n李世石看到这步棋,也震惊了。 n他认为这已经不仅仅是基于计算的结果,这是一种创新,意味着AlphaGo具有创造力。
第二场比赛,李世石还是输给了AlphaGo。
有趣的是,尽管连开发团队都承认AlphaGo只是一个电脑程序,但是在网上的评论中,很多人下意识地为AlphaGo赋予了人格甚至性别,它开始让人感到一丝微弱的恐惧和威胁。
接下来的第三场比赛中,李世石还是输给了AlphaGo。 n这一次所有人都能感觉到他的无奈和绝望。 n不公平的是,这样的对战中,无论AlphaGo是输是赢,都不会受到情绪的影响。n而对于人类而言,情绪会影响发挥。
第四场比赛中,李世石彻底放松了。 n面对AlphaGo这样强大的对手,他开始慢慢找回最初对围棋的认识,一步步用人类的方式把AlphaGo逼入绝境。 nAlphaGo终于开始真正意义上的“犯错”。
这一局,几乎是历史性的时刻,AlphaGo放弃了,李世石赢回了这一局。 n连输三场以后,第四场似乎毫无希望,那感觉就像世界末日来临。 n但这一次,人类赢了。 n所有人激动不已,现场一片欢呼,一扫前几天的压抑和恐惧,大家不仅在为李世石欢呼,也是为人类自己欢呼。 n这次胜利意味着,人类在面对超级计算机时,似乎并非毫无胜算。
虽然第五场比赛,李世石还是输给了AlphaGo。 n迄今为止,人类只战胜过AlphaGo一次。 n但是通过这场比赛,人类对人工智能的实力有了惊鸿一瞥,也隐约看到了未来世界的可能。 n可以预见的是,随着科技日新月异的发展,人工智能(AI)必将逐渐走入人类的生活。n或许当下很多人对人工智能的印象缺乏真实感,总是会联想到科幻小说和电影。
其实我们当下,正处在一个充满了弱人工智能的世界。 n无论是汽车还是手机中都不乏各种人工智能的应用,谷歌最近在测试的无人驾驶车就是一例。 n弱人工智能目前在给人带来便利的同时,还不至于对人造成威胁。 n然而,每一个弱人工智能的创新,都在给通往强人工智能和超人工智能的未来添砖加瓦。 n有人曾预言:现在的弱人工智能,就像是地球早期软泥中的氨基酸——没有动静的物质,也许突然的契机就组成了生命。
计算机科学家Donald Knuth认为: n“人工智能已经在几乎所有需要思考的领域超过了人类,但是在那些人类和其它动物不需要思考就能完成的事情上,还差得很远。” n总有一天,我们会造出和人类智能相当的强人工智能电脑,这只是时间问题。 n超级智能的诞生,或许就会发生在不久的将来,因为指数级增长的关系,虽然机器学习现在还发展缓慢,但是在未来几十年就会变得飞快。 n到那时,人类将不得不面对自己创造出来的超级智能。 n而大多数人关心的是,它会如何对待人类,它会协助人类更好地生活还是威胁人类的生存呢? n或许答案只能交给时间了。
*本文作者:RAMA