首页 > IT业界 > 正文

李世石首赢AlphaGo,看看AlphaGo创始人怎么说?

2016-03-14 10:06 来源:新浪科技

  在人工智能AlphaGo和人类棋手李世石的对战中,胜利关键,在于思维。

  人工智能AlphaGo的最大弱点在于还没学会人类的思维,而李世石的优势是拥有着人类的思维,却也拥有着人类的情绪,无法冷静的对每一步棋做出最正确的判断。

  3月13日下午,谷歌人工智能AlphaGo与李世石对战第四场在韩国首尔四季酒店举行,李世石首次战胜AlphaGo,总比分扳回至3:1。双方交战仅剩余最后一场,下场比赛将于北京时间3月15日(周二)中午12点进行。

  之前谷歌AlphaGo已经取得3场比赛的胜利,因此脱去胜负包袱的李世石显得比前一场轻松。

  今天的比赛,AlphaGo执黑先手,李世石执白。开局阶段双方就形成星小目对星小目的局面,但之后李世石会并未走出模仿棋,而是打出了自己的风格。

  和前几局对决相比,李世石今天更多次陷入“长考”,导致耗时太多,在比赛进行到2个半小时后,李世石仅剩下17分钟,比AlphGo剩余时间足足少了1个小时。

  随后,李世石白78挖,下出一招妙手,成为本场比赛的转折点。AlphaGo黑93立,下出一步常理上的废棋,令所有人大惑不解。现场英文解说员麦克雷蒙九段表示,AlphaGo后面跟的这步一下子把局面弄复杂了。

李世石与AlphaGo第四局棋谱(AlphaGo执黑)

  李世石与AlphaGo第四局棋谱(AlphaGo执黑)

  虽然AlphaGo出现了一次“bug”,但李世石仍然不敢松懈,在打吃右侧黑子时还是非常谨慎。在比赛进行到3小时20分钟时。李世石计时全部用完,进入读秒落子阶段。

  此后Alpha由于判断局面对自己不利,每步耗时明显增长,都超出了3分钟。到3小时40分钟时,比赛大局已定,AlphaGo(白)投子认输只剩时间问题,李世石只需要冷静收官即可获得胜利。

  收官阶段,左下角AlphaGo黑159扳再次出现漏洞,黑子没有继续在此处落子,而是到左边立,导致上一步棋成为“无用功”。

  最终,李世石在收官阶段发挥稳定,没有让AlphaGo占到便宜。李世石获得对AlphaGo的第一场胜利,双方总比分变为3:1

  这是人类棋手首次战胜AlphaGo,在赛后发布会上,李世石受到了多方称赞,DeepMind的开发者还谈到了这次比赛中AlphaGo出现的忽然“崩溃”,表示这次“失利”对AlphaGo非常宝贵。

  DeepMind创始人哈萨比斯在赛后发布会上表示:”衷心祝贺李世石获胜,让我们看到他是多么伟大的棋手。看AlphaGo的统计,也知道形势的变化。今天的失利是非常宝贵的,我们回去还要改善AlphaGo。最后非常衷心祝愿李世石获胜。非常期待周二最后一场比赛。“


  哈萨比斯还在推特表示,在李世石白78“神之一手”后,AlphaGo白79误以为胜率达到70%,直到第87手才反应过来!

  以下为发布会媒体问答实录:

  问:AlphaGo以前的失误后来发现是好手,但今天有几手意外的失误,将来也会向医疗领域发展,是否也会有相似情况?

  哈萨比斯:AlphaGo还是初级程序,还不是升级版,并未完善,所以我们就要看看他有何缺陷,希望李世石能帮我们找到缺点。我们需要进一步测试,完善他。目前AlphaGo还只是个程序,尚未进入医疗领域,我们当然还会进行更严格的测试。

  问:AlphaGo是否有失误?

  哈萨比斯:AlphaGo有的棋,从职业棋手角度来看可能并非瞬间直观的选点,感觉是恶手,但事后看反而可能是好手,当然也有可能是失误。因为AlphaGo是通过计算胜率来选择落点,处理方式和人不一样。今天AlphaGo输了,所以确实是有失误的。这也看得出李世石的表现非常强。我们举办比赛,就是希望通过李世石帮助寻找他的缺陷和测试极限。

  问:AlphaGo似乎不会下出差别很大的棋,而是根据对手实力来下棋,是否之前有设置评测对手实力?

  大卫席尔瓦:AlphaGo不会根据对手来下棋,只是通过计算来确定每步棋胜率是多少,选择最有可能获胜的落点。如果胜率低于一定程度就会弹出提示认输,通知黄士杰博士。AlphaGo认为对手总是会下出最强手,所以要增加自己最有可能的胜率。

  问:今天赛前是否有策略,棋局是否按计划进行,获胜是否自己表现好还是因AlphaGo失误?之前说对AlphaGo完全不了解,现在了解多少?信息不对称是否对您有些不公平。因您的棋谱都能搜集到。

  李世石:我觉得AlphaGo并不完美,肯定有弱点的,感觉大致有两点,他执黑下得并不太好,另外当我下出意外一手,AlphaGo应对可能就会出现失误。当我下出完全没有想到的棋,AlphaGo整个程序似乎就会出现问题。关于信息不对等,这并不是最重要的。主要还是我和AlphaGo的棋力对抗,他出现意外失误并不是关键。

  哈萨比斯:AlphaGo并不是针对李世石的棋风或棋谱来训练的,是收集所有人类的棋谱,接着通过自我对局来深度学习,所以没有专门针对李世石。即使我们要针对李世石来培训AlphaGo,是需要上千万棋谱的。

 


 问:三连败后是否会影响信心?最后一局感觉如何?

  李世石:三连败肯定会受到冲击,压力很大。但每次比赛都是很享受的,我并未受到很大冲击,也很有信心。这局执白获胜,下一局能否不猜先,让我执黑,这样获胜更有意义。请问哈萨比斯先生可以吗?

  哈萨比斯和大卫席尔瓦对视点了点头:可以啊,我认为没问题。

  李世石:好的,谢谢。

  问:感谢今天出色的表现,关于78妙手,当时是如何想的?

  李世石:当时局面非常危险,我想了很久,感觉这是我唯一的选点,非常感谢大家给我这么多表扬。

  李世石在赛后的记者招待会上说:“我想起赛前曾经说过会以5比0,或者4:1赢得比赛,如果之前我真的赢了三场,那么今天哪怕失利一场,也会是巨大的 伤害。但正因为我输了三场,如今赢回一场,这一场胜利对我如此弥足珍贵,我不会拿它跟任何东西交换。是你们的鼓励和支持让我赢得这场比赛,非常感谢。”

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected]