Master的智慧

马欢《环球人物》（）

在去年3月的人机围棋大战中，谷歌开发的围棋人工智能程序AlphaGo（阿尔法围棋，亦被戏称为“阿尔法狗”）以4 ：1战胜了韩国围棋名将李世石九段，引发全世界惊呼：围棋这个人类最后的智慧堡垒，已经被人工智能突破了！

但这只是开始。2016年12月29日至31日，国内围棋网站弈城网出现了一个神秘棋手，连胜柯洁九段、陈耀烨九段、朴廷桓九段、芈昱廷九段、唐韦星九段等多位高手。2017年1月，又有神秘棋手Master（大师）在网上大战棋圣聂卫平、柯洁、朴廷桓、井山裕太等数十位中日韩围棋高手，并以每30秒一手的速度拿下了59场全胜。就在所有人争论这个神秘高手到底是谁时，谷歌旗下的人工智能公司Deepmind（深度学习）终于站出来说，这两位神秘高手均为“阿尔法狗”（Master是“阿尔法狗”的改进版）。

“阿尔法狗”实质上是由Deepmind公司设计的一款人工智能围棋程序。为什么Deepmind要设计一款围棋人工智能呢？这要从其创始人、人工智能专家、神经科学家戴密斯·哈萨比斯博士太过喜爱棋类游戏说起。哈萨比斯4岁开始学习国际象棋，13岁就获得了国际象棋大师的称号，17岁进入剑桥大学学习计算机时对围棋这项古老的棋类活动产生了兴趣。哈萨比斯一直被两个问题所困扰：人脑如何学会并完成下棋这样的复杂任务？电脑能否像人类一样学会并完成复杂任务？

于是哈萨比斯团队选择了围棋作为研究领域。“阿尔法狗”的工作原理就是“深度学习”，实质上是一种机器模拟人脑的学习行为，经过数据计算，通过组合多种低层次的人工神经网络，来构建更高层次、更抽象的思维活动。

“阿尔法狗”在架构上主要分为两大神经网络系统：策略网络及价值网络。所谓的策略网络就是通过获取大量的范例资料，来预测棋手下一步落子的位置，核心是尽可能多地录入棋手下棋的棋谱。“阿尔法狗”学习的棋谱以亿为单位，对棋手落子位置判断的准确率已经超过了57%。而价值网络则是“阿尔法狗”分别计算自己和对手每次落子对最终胜率的影响，并通过综合计算来选择胜率最高的下棋方式。

“蒙地卡罗树搜寻技术”则是“阿尔法狗”的最后一步，这项技术把上述两大神经网络完美地结合起来，主要作用就是对棋盘状况进行综合评估，并对敌方下一步落子位置进行反复预测，选择胜率最大的落子组合。但由于“阿尔法狗”的计算能力并非无限，所以每一次落子之前考虑所有可能性并不现实，只能尽量把搜索范围限制在可控范围，然后在有限的选择中选择最优解。

无疑，“阿尔法狗”的出现已经成为人工智能领域一个极为重要的里程碑。哈萨比斯称已经开始将“阿尔法狗”与医疗、机器人领域相结合，其未来应用范围相当广阔。悲观派觉得人工智能未来一定会统治世界；而乐观派则认为人工智能是社会发展和自然科学发展的必经之路，阻挡没有意义，关键是怎么去适应和学习。

返回目录

放大

缩小

全文复制下一篇

	Master的智慧

	情感交流，留住老人的记忆

	物业才是“上帝”

	用红包打怪

	沙博理的乱稿

	“三毛之父”的橡皮

	你免费，我挣钱

	感谢辱骂

	段子