正在阅读:

“人机大战”开幕:柯洁将与AlphaGo对决

扫一扫下载界面新闻APP

“人机大战”开幕:柯洁将与AlphaGo对决

年轻的围棋选手对战AlphaGo,胜率渺茫。但慢棋对人类有利。

柯洁在围棋峰会现场。

已经升级到2.0版本的Google围棋人工智能AlphaGo将与人类选手对战。5月23日10点30分,第一场比赛正式开始。

5月23日至27日,这场人机大战将在中国乌镇举办。此次围棋峰会将有五场赛事,除去柯洁与AlphaGo之间的三场对战外,还包括一场人机配对赛(5月24日)和一场团队人机赛(5月26日)。

其中,人机配对赛将由连笑和古力与AlphaGo组队,了解人类如何与AI配合。而团队人机赛则是由芈昱廷、时越、唐韦星、周睿羊、陈耀烨五位棋手组队,联手向AlphaGo发起挑战。

柯洁97年出生,在微博的自我介绍时表示,自己暂时是“世界围棋第一人”,正式比赛时曾单盘8:2碾压李世石,世界冠军曾获得过三次。柯洁的世界等级分排名第一,九段棋手。

去年AlphaGo对战韩国棋手李世石时,Google提供了100万美元的比赛奖金,今年奖金达到了150万美元。

AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序,是围棋史上最具实力的选手之一。2016 年 3 月,在全世界超过一亿观众的关注下,AlphaGo 经过5局对弈,最终以 4 比 1 的总比分战胜了围棋世界冠军李世石,这场比赛成为了人工智能领域的一个重要里程碑。

过去曾有专家预测人工智能需要十年的时间才有可能战胜人类职业选手,在这场比赛之后,AlphaGo 凭借其“充满创意而又机智”的下法,跻身围棋界最高职业称号——职业九段行列,成为历史上首个获得这一荣誉的非人类棋手。

近期,AlphaGo的2.0版本以"Master/Magister"的称谓与世界顶级的围棋选手进行了60场线上快棋对局,并取得了全胜战绩。当时在AlphaGo仍然匿名时,就有不少人猜出这种连胜局背后可能有人工智能存在。

一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

AlphaGo如何进行训练?根据Google提供的资料,为了应对围棋的巨大复杂性,AlphaGo 采用了一种最新的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。

这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

AlphaGo如何训练示意图

在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

AlphaGo如何落子

职业棋手樊麾认为,AlphaGo最强大的地方,并不体现在具体某一手棋或者某个局部变化中,而是它在每一局棋里所展现出来的独特视角。

虽然AlphaGo的棋风本身并不容易总结,但是总体来说,AlphaGo更倾向于使用一种自由、开放式的行棋风格。在它的世界里,没有什么先入为主的概念,也没有什么必须要遵守的规则,这让它得以打破常规,发现当前棋局中最高效的一手。在接下来的两局棋里,AlphaGo这种独特的对局哲学,常常让它下出违反第一感、但却极具威力的一手棋。

虽然围棋是围地盘的游戏,但事实上最具决定性的部分在于如何平衡棋盘上的各个局部。在这一点上,AlphaGo展现出了卓越的能力。尤其值得一提的是,AlphaGo对于外势的把控可以说到达了出神入化的地步,具体来说,它可以近乎准确地判断棋盘上现有棋子能给周围区域带来多大的影响力。

虽说棋子的影响力本身很难衡量,但是AlphaGo强大的价值网络让它能够把棋盘上所有的棋子当作一个整体来考虑,因此它的判断几近精确。AlphaGo的这种能力,使得它能够把局部棋子的影响力,转变为全局的优势。

在市场上,多名AI工程师认为AlphaGo获胜的概率超过柯洁。英语学习 App 英语流利说首席科学家林晖博士表示:“本次人机对战采用的‘慢棋’赛制,相对于之前在 Master 在网路上打遍天下无敌手的“超快棋”,目前的赛制对人类棋手会有一定利好。但预估柯洁赢面仍低于 10%,AlphaGo 将获得本次升级版人机大战的最终胜利”。

另一位人工智能专家孙怿博士对于人工智能的信心更为强烈,他认为:“除非 AlphaGo 出现致命程序错误,AlphaGo 将取得三盘全胜的战绩”。

他强调:“AlphaGo2.0 相对于 1.0,由于人工智能可以无时无刻进行对弈训练,AlphaGo2.0 在算法和经验上都比对阵李世石时提升不少。今年年初 AlphaGo 2.0 以 Master 为化身,在快棋的赛制中,以 60 战不败成绩完胜包括柯洁在内的世界顶尖棋手也印证了这一点”。

在比赛前,柯洁态度状态轻松,不仅在乌镇发自拍,还发表了一篇名为《最后的对决》微博表达情绪。柯洁平时也是一名在微博上十分活跃的棋手。

附柯洁微博全文:《最后的对决》

@棋士柯洁

决战前夕,感慨万千...

在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢,这都将是我与人工智能最后的三盘对局

很多人可能会问为什么?

其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了...我相信未来是属于人工智能的。

可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。

我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...

拼尽全力后,无论结果...管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到...

不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

“人机大战”开幕:柯洁将与AlphaGo对决

年轻的围棋选手对战AlphaGo,胜率渺茫。但慢棋对人类有利。

柯洁在围棋峰会现场。

已经升级到2.0版本的Google围棋人工智能AlphaGo将与人类选手对战。5月23日10点30分,第一场比赛正式开始。

5月23日至27日,这场人机大战将在中国乌镇举办。此次围棋峰会将有五场赛事,除去柯洁与AlphaGo之间的三场对战外,还包括一场人机配对赛(5月24日)和一场团队人机赛(5月26日)。

其中,人机配对赛将由连笑和古力与AlphaGo组队,了解人类如何与AI配合。而团队人机赛则是由芈昱廷、时越、唐韦星、周睿羊、陈耀烨五位棋手组队,联手向AlphaGo发起挑战。

柯洁97年出生,在微博的自我介绍时表示,自己暂时是“世界围棋第一人”,正式比赛时曾单盘8:2碾压李世石,世界冠军曾获得过三次。柯洁的世界等级分排名第一,九段棋手。

去年AlphaGo对战韩国棋手李世石时,Google提供了100万美元的比赛奖金,今年奖金达到了150万美元。

AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序,是围棋史上最具实力的选手之一。2016 年 3 月,在全世界超过一亿观众的关注下,AlphaGo 经过5局对弈,最终以 4 比 1 的总比分战胜了围棋世界冠军李世石,这场比赛成为了人工智能领域的一个重要里程碑。

过去曾有专家预测人工智能需要十年的时间才有可能战胜人类职业选手,在这场比赛之后,AlphaGo 凭借其“充满创意而又机智”的下法,跻身围棋界最高职业称号——职业九段行列,成为历史上首个获得这一荣誉的非人类棋手。

近期,AlphaGo的2.0版本以"Master/Magister"的称谓与世界顶级的围棋选手进行了60场线上快棋对局,并取得了全胜战绩。当时在AlphaGo仍然匿名时,就有不少人猜出这种连胜局背后可能有人工智能存在。

一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

AlphaGo如何进行训练?根据Google提供的资料,为了应对围棋的巨大复杂性,AlphaGo 采用了一种最新的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。

这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

AlphaGo如何训练示意图

在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

AlphaGo如何落子

职业棋手樊麾认为,AlphaGo最强大的地方,并不体现在具体某一手棋或者某个局部变化中,而是它在每一局棋里所展现出来的独特视角。

虽然AlphaGo的棋风本身并不容易总结,但是总体来说,AlphaGo更倾向于使用一种自由、开放式的行棋风格。在它的世界里,没有什么先入为主的概念,也没有什么必须要遵守的规则,这让它得以打破常规,发现当前棋局中最高效的一手。在接下来的两局棋里,AlphaGo这种独特的对局哲学,常常让它下出违反第一感、但却极具威力的一手棋。

虽然围棋是围地盘的游戏,但事实上最具决定性的部分在于如何平衡棋盘上的各个局部。在这一点上,AlphaGo展现出了卓越的能力。尤其值得一提的是,AlphaGo对于外势的把控可以说到达了出神入化的地步,具体来说,它可以近乎准确地判断棋盘上现有棋子能给周围区域带来多大的影响力。

虽说棋子的影响力本身很难衡量,但是AlphaGo强大的价值网络让它能够把棋盘上所有的棋子当作一个整体来考虑,因此它的判断几近精确。AlphaGo的这种能力,使得它能够把局部棋子的影响力,转变为全局的优势。

在市场上,多名AI工程师认为AlphaGo获胜的概率超过柯洁。英语学习 App 英语流利说首席科学家林晖博士表示:“本次人机对战采用的‘慢棋’赛制,相对于之前在 Master 在网路上打遍天下无敌手的“超快棋”,目前的赛制对人类棋手会有一定利好。但预估柯洁赢面仍低于 10%,AlphaGo 将获得本次升级版人机大战的最终胜利”。

另一位人工智能专家孙怿博士对于人工智能的信心更为强烈,他认为:“除非 AlphaGo 出现致命程序错误,AlphaGo 将取得三盘全胜的战绩”。

他强调:“AlphaGo2.0 相对于 1.0,由于人工智能可以无时无刻进行对弈训练,AlphaGo2.0 在算法和经验上都比对阵李世石时提升不少。今年年初 AlphaGo 2.0 以 Master 为化身,在快棋的赛制中,以 60 战不败成绩完胜包括柯洁在内的世界顶尖棋手也印证了这一点”。

在比赛前,柯洁态度状态轻松,不仅在乌镇发自拍,还发表了一篇名为《最后的对决》微博表达情绪。柯洁平时也是一名在微博上十分活跃的棋手。

附柯洁微博全文:《最后的对决》

@棋士柯洁

决战前夕,感慨万千...

在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢,这都将是我与人工智能最后的三盘对局

很多人可能会问为什么?

其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了...我相信未来是属于人工智能的。

可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。

我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...

拼尽全力后,无论结果...管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到...

不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。

未经正式授权严禁转载本文,侵权必究。