2017年11月25日 , 星期六
首页 / 新闻资讯 / 国际新闻 / 作为人工智能的产物,让人类哭的“阿尔法狗”,究竟是怎样炼成的?

作为人工智能的产物,让人类哭的“阿尔法狗”,究竟是怎样炼成的?

如果说,发生在去年的“阿尔法狗”(AlphaGo)和李世石之间的人机大战给围棋界带来的是一次不小的震动。那么5月27日落幕的另一场人机大战可谓“悲壮”,这一天,围棋世界排名第一的中国选手柯洁以总比分0比3结束了与AlphaGo的三番棋较量,柯洁一度落泪。作为人工智能的产物,AlphaGo的出现被一些人形容为“召唤恶魔”,但它的诞生并不只是为了打败人类。

“它不停地练习,永不停歇”

“Aja学长(黄士杰)说他们每天都喂程序吃很多职业棋士的棋谱,那时我隐约觉得,只要程序吃的棋谱够多,一定能比人类还要强。”台湾围棋教育推广协会秘书长张晓茵关注到AlphaGo的时间可能比很多人都要早。

那是2015年,AlphaGo第一次向人类宣战,它以5比0横扫三次斩获欧洲围棋冠军的职业二段棋手樊麾。樊麾生于中国西安,现任法国围棋队总教练。不过在当时,AlphaGo的第一次亮相并没有引起太多关注,至少在中国,这条消息很快就被淹没在快速滚动更迭的门户新闻里。但张晓茵对这则新闻印象深刻,她除了对AlphaGo战力如此之强感到意外,同时她也有一丝恐惧。更特别的原因是,这让她的脑海中立刻浮现出一个人的名字:她的学长黄士杰(Aja Huang)。此人正是后来坐在李世石对面代替AlphaGo落子的那位男子,也是AlphaGo的开发者之一——谷歌DeepMind团队的核心人员。

AlphaGo已经先后击败韩国棋手李世石、中国棋手柯洁。漫画为2016年3月15日,AlphaGo与韩国棋手李世石进行最后一轮较量并获胜。Financial Times

张晓茵称,当时黄士杰在学校里就设计了一个围棋人工智能程序,该程序还以他的妻子Erica命名。张晓茵至今仍清楚地记得“吃棋谱”这个说法。

事实上,AlphaGo的训练模式之一就是尽可能多地“吃掉”人类棋手的棋谱。它在谷歌强大的云计算系统中,通过大量数据分析学习了3,000多万个职业棋手棋谱,不过,有报道称,2015年10月AlphaGo对阵樊麾时,“吃过”的棋谱是3,000万个,但到了挑战世界棋坛16冠王李世石的时候,嚼进肚子里的棋谱已经达到一亿。此外,AlphaGo还通过增强学习的方法自我博弈,寻找比基础棋谱更好的棋路。在练习时,DeepMind团队让两台几乎没有区别的AlphaGo对弈,即两方能力相当,但下棋的路数有别,最合适下法的一方将胜出。这样的原理,可将之理解为习武之人采取双手左右互搏的练功方法,不断地积累经验。

在英国《金融时报》的报道中,AlphaGo首席程序员戴夫·西尔弗表示,“AlphaGo已变成自己的老师,这令其能够用更一般化的方式学习,意味着不仅棋艺增强,而且还能带来更一般化的应用。”

英国《卫报》曾对DeepMind创始人、“AlphaGo之父”戴密斯·哈萨比斯(Demis Hassabis)进行采访,报道中写道:“哈萨比斯说AlphaGo不休息,即便在圣诞节期间也没有。它就像一台永动机,在拥有庞大计算能力的谷歌云端不停地练习,永不停歇。这意味着它很可能每一秒、每一天都在进步。”

图片来源:ai research

21世纪的“阿波罗工程”

AlphaGo的走红也将哈萨比斯带到聚光灯之下。然而,在公开场合,哈萨比斯却总是显得再普通不过。多家媒体记者在报道AlphaGo时都特别提到,在该团队赢得世界瞩目和惊叹的时候,迎面走来的哈萨比斯则是谦逊温和的形象。甚至于,他身上那容易让人误会是实习生的极为普通的上衣、裤子和鞋子,也会成为报道中的一抹亮色。反差之大,很难让观者将他与“象棋神童”“游戏设计大师”“名牌大学学霸”,以及仅他个人就拿到谷歌8,000万英镑收入联系在一起。

1976年,哈萨比斯出生在英国伦敦,父亲是希腊裔塞浦路斯人,母亲则是华裔新加坡人。在别的孩子还在撒娇的年龄,他就展示出非凡的能力。哈萨比斯四岁学习国际象棋,13岁成为全世界排名第二的少年象棋大师。在象棋界誉满天下的同时“染指”视频游戏,八岁开始写电脑游戏,17岁就创造了第一款包含人工智能的游戏《主题公园》,一发布就销售了数百万份。但到了1997年,他开发的《共和:革命》《邪恶天才》市场表现却很一般。这让哈萨比斯开始反思,甚至对一些大型多人游戏感觉失望。“我无法真正融入游戏,因为虚拟人物看起来傻傻的。他们没有记忆,不会改变,也与环境无关。如果有学习型人工智能,游戏质量就能提升到新水平。”

《环球人物》杂志称,雄心勃勃的哈萨比斯想创造一个通用人工智能系统。在他看来,从智能语音助手Siri到人脸识别系统,这些预设好程序的软件只能掌握某项特定技能,属于弱人工智能。而通用人工智能系统与以往技术最大区别在于自学能力,它可以从零学起,掌握任何技能,“就好像和人类做得一样”,他称之为21世纪的“阿波罗工程”。

DeepMind创始人、“AlphaGo之父”戴密斯·哈萨比斯。网络图片

为此,2005年,哈萨比斯重返校园,到伦敦大学攻读认知神经科学博士学位。“在游戏行业,我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息,这就是神经科学——我希望从大脑解决问题的方式中获得灵感。”

2010年,哈萨比斯与发小穆斯塔法·苏莱曼、人工智能专家谢恩·莱格一起创办了DeepMind公司。2013年12月,DeepMind的第一次公开亮相震惊了众人。在美国加州和内华达州交界的太浩湖畔,DeepMind向公众展示了一款软件。这款软件并没有被编入“如何玩游戏”的指令,但通过控制键盘,观察显示器分数,经过反复试错之后,成为了一个专业级游戏高手。这证明软件可以通过神经模拟网络处理数据,像人脑一样“本能地”学习。这算是在开发AlphaGo前的一种尝试。

如今,当媒体问及哈萨比斯创造出AlphaGo的原因时,他总是一次又一次耐心地讲述团队组建的初衷:创造一个通用学习机器,“一套能像生物系统一样学习的灵活且能自我适应的算法,仅仅凭借原始数据就能掌握任何任务”。然而在AlphaGo横空出世之后,关于人工智能把下围棋的人类逼入绝境的担忧开始不绝于耳。AlphaGo的主人、DeepMind团队被形容为是在“召唤恶魔”。

事实上,英国著名物理学家斯蒂芬·霍金、微软创始人比尔·盖茨、硅谷狂人埃隆·马斯克都曾不止一次公开表达过对超级人工智能的恐慌。盖茨称,人工智能带给人们便利的生活之余终归存在威胁。马斯克则在Twitter上说,“我们需要十分小心人工智能,它可能比核武器更危险。”

在回答这些问题时,哈萨比斯则皱起眉头变得严肃,“我发现那些没有真正研究人工智能的人们并不完全理解这些。他们通常没有跟很多人工智能专家深入交谈。人工智能距离人脑的水平仍有几十年的差距,我们才爬上了梯子的第一级。”

图片来源:zimbio

 

责编/陆拾   设计/王肖
资料来源:《环球人物》2016年4月6日《阿尔法狗之父,低调的天才》、《南方周末》1月19日《人工智能有多“危险”?阿尔法狗是怎样炼成的》、《新京报》5月30日《柯洁0:3完败,科学解释AlphaGo为什么会赢》、界面新闻网5月29日《AlphaGo赢了人类,也输给了人类》、新华社5月28日《“人机大战”第三局:柯洁不敌“阿尔法围棋”》

本文原载于澳洲华语新闻周刊杂志《CITYWEEKLY 城市周刊》第270期,欢迎在线阅读和订阅:CITYWEEKLY

本文由WeSydney微悉尼编辑整理,转载请注明出处,并附上原文链接,否则我公司保留采取法律措施,追究其责任的权利。

关于 CITYWEEKLY

CITYWEEKLY
《城市周刊 CityWeekly》杂志是一本全方位的知性而有品位的华语悉尼生活导航,集全球及澳洲新闻、时事、经济、生活、旅游、时尚、艺术于一体。

你也许感兴趣

看了华为新出的这款手机,多年不换手机的我都心动了!这功能,太!强!大!了!

终于等到你!厉害了,word华为!

发表评论

电子邮件地址不会被公开。 必填项已用*标注

error: 内容已受保护