正在阅读:

人工智能战胜人类顶尖的围棋选手后 又在《Dota2》中打败人类冠军

扫一扫下载界面新闻APP

人工智能战胜人类顶尖的围棋选手后 又在《Dota2》中打败人类冠军

我们已经进入了一个AI研究的游戏化时代。

图片来源:Valve

人工智能挑落人类顶尖选手的故事可不再仅限于国际象棋和围棋,这次,沦陷的项目是《Dota2》。

在刚刚结束的第七届《Dota2》国际邀请赛(TI)中,8月11日的正式比赛结束后,一场表演赛开始了。一方是人类选手Dendi——乌克兰传奇选手,第一届TI的冠军获得者。而另一方来自一段AI,这个由OpenAI开发的人工智能程序在表演赛中出场,试图验证自己的实力。

这仍是一场人为设定规则的简化版对抗:Dendi和AI只能从中路出击;在双方同时使用一个英雄雄影魔(Shadow Fiend)的情况下,没有中立生物,没有神符,以及不能使用一些关键装备。减少了随机性的同时,让比赛看起来更像是类似围棋般的硬实力对抗。

“你觉得你对抗的是一个真人吗?”在第一局比赛过程中主持人向Dendi问道。Dendi的回答是:“不。”在过往的游戏练习中,Dendi也在少数时候被《Dota》的内置机器人(bot)击杀,OpenAI控制的对手看起来并没没有人类选手操作得那么有“流畅感”,甚至在前往中路的时候,OpenAI有时候还被己方小兵所卡住。

但这样仍不妨碍结果的一边倒,第一场比赛中OpenAI仅用10分钟就击败Dendi。而在第二局,当AI打出一个漂亮的越塔击杀后,Dendi爽快GG认负。

“它太强大了。”比赛结束后Dendi接受采访时说,“也许我得再多练习一段时间,才能发现如何击败它。”

Dendi的自我评价尚算中肯。实际上从现场直播来看,这位前世界冠军在比赛中可不是非常走心:主持人不时在比赛过程中向Dendi追问,干扰其操作。而后者的表现更像是“玩票”,一直和主持人谈笑风生。也许Dendi在游戏中的ID“HF(Have Fun,玩得开心)”更能体现他对这次比赛的态度。

而OpenAI却体现了一名职业玩家的应有素养。把握好出招时机后,OpenAI的正补、反补恰到好处,或是以一个合适的距离攻击Dendi。这让Dendi的英雄血量时常处于尴尬的贫血阶段。

很难想象,如果这不是一场表现赛,而Dendi又收起自己的戏谑态度全力应对的话,谁又会是最后的胜利者。

但至少在OpenAI开发人员眼里,这场胜利是一次顺理成章的成功。

“对AI来说,《Dota》是一个非常适合的对抗性游戏,游戏本身很复杂,也拥有高强度对抗场景。这意味着你需要一种新技术,来努力扩展、推进AI的边界。”OpenAI的首席技术官Greg Brockman(下称Brockman)透露。这也是他们为何选择《Dota》作为AI训练主战场的原因。

Brockman表示,在《Dota》中取胜更依赖于选手的直觉,而这已经通过AI学会了:通过自我对弈(Self-play)进行高强度训练,预测其他玩家的下一步操作,提高应对陌生环境的表现,帮助友军单位取胜。在经过仅仅两周的实时训练后,AI就达到了目前专业选手的水准。

最终,从对于自己所处的世界全无认识,再经历过大量和自身拷贝的对战后(这意味着它和对手永远是旗鼓相当的),AI的游戏技巧有了一日千里的进步。按照Brockman介绍,OpenAI在此之前已经战胜了现役的Arteezy、SumaiL等多个世界冠军级的《Dota》选手。

“OpenAI第一次打败了世界上最好的电竞选手。”

当然, OpenAI作为由硅谷大亨Elon Musk投资创立的非营利科研机构,其目的并非局限于游戏,Brockman透露,通过游戏中的训练,OpenAI希望帮助机器人建立系统性学习复杂技能的能力,这有助于帮助AI应对现实世界中的任务,如外科手术。

愿景很伟大,至少Elon Musk本人对这场比赛的结果还是很满意的,他专门发布了一条推特消息,称“OpenAI第一次打败了世界上最好的电竞选手。电竞比象棋、围棋这样的传统棋盘游戏要复杂得多。”还顺便小小嘲讽了一下对手AlphaGo。

DeepMind将研究重心放到了《星际争霸2》上。

不过,AlphaGo的拥有者DeepMind,也早已经将AI研究方向转移到游戏上了,几个月之前,他们选择了《星际争霸2》作为围棋之后的下一个测试对象。8月初,DeepMind开源了《星际争霸2》研究训练平台SC2LE。据《财富》报道,DeepMind的目标是让计算机击败最顶级的人类《星际争霸》玩家。

我们已经进入了一个AI研究的游戏化时代。AI巨头纷纷选择游戏作为研究入口,已经成为AI研究领域的重要风向。《经济学人》评论认为,电子游戏受追捧有几个原因:将游戏作为现实世界的训练场;不同的游戏需要不同的认知技能,游戏可以帮助他们了解如何把智能问题分解成更易处理的小模块;基于以上两种原因,认为游戏可以帮助他们发展出一套合适的人工(甚至自然)智能理论。

甚至电子游戏还可以简化现实AI研究中机器人的维护、调试过程:虚拟机器人没有重量,无需维护,改变规格也只要在键盘上敲几下就足够了。

而在明年,OpenAI的《Dota》选手将更加“名副其实”,开发团队计划在TI8前做出可以参加5V5比赛的AI,并且规则与人类比赛规则相同,可以预料,到时候这场人类与AI的游戏大战会更加精彩和戏剧化。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

人工智能战胜人类顶尖的围棋选手后 又在《Dota2》中打败人类冠军

我们已经进入了一个AI研究的游戏化时代。

图片来源:Valve

人工智能挑落人类顶尖选手的故事可不再仅限于国际象棋和围棋,这次,沦陷的项目是《Dota2》。

在刚刚结束的第七届《Dota2》国际邀请赛(TI)中,8月11日的正式比赛结束后,一场表演赛开始了。一方是人类选手Dendi——乌克兰传奇选手,第一届TI的冠军获得者。而另一方来自一段AI,这个由OpenAI开发的人工智能程序在表演赛中出场,试图验证自己的实力。

这仍是一场人为设定规则的简化版对抗:Dendi和AI只能从中路出击;在双方同时使用一个英雄雄影魔(Shadow Fiend)的情况下,没有中立生物,没有神符,以及不能使用一些关键装备。减少了随机性的同时,让比赛看起来更像是类似围棋般的硬实力对抗。

“你觉得你对抗的是一个真人吗?”在第一局比赛过程中主持人向Dendi问道。Dendi的回答是:“不。”在过往的游戏练习中,Dendi也在少数时候被《Dota》的内置机器人(bot)击杀,OpenAI控制的对手看起来并没没有人类选手操作得那么有“流畅感”,甚至在前往中路的时候,OpenAI有时候还被己方小兵所卡住。

但这样仍不妨碍结果的一边倒,第一场比赛中OpenAI仅用10分钟就击败Dendi。而在第二局,当AI打出一个漂亮的越塔击杀后,Dendi爽快GG认负。

“它太强大了。”比赛结束后Dendi接受采访时说,“也许我得再多练习一段时间,才能发现如何击败它。”

Dendi的自我评价尚算中肯。实际上从现场直播来看,这位前世界冠军在比赛中可不是非常走心:主持人不时在比赛过程中向Dendi追问,干扰其操作。而后者的表现更像是“玩票”,一直和主持人谈笑风生。也许Dendi在游戏中的ID“HF(Have Fun,玩得开心)”更能体现他对这次比赛的态度。

而OpenAI却体现了一名职业玩家的应有素养。把握好出招时机后,OpenAI的正补、反补恰到好处,或是以一个合适的距离攻击Dendi。这让Dendi的英雄血量时常处于尴尬的贫血阶段。

很难想象,如果这不是一场表现赛,而Dendi又收起自己的戏谑态度全力应对的话,谁又会是最后的胜利者。

但至少在OpenAI开发人员眼里,这场胜利是一次顺理成章的成功。

“对AI来说,《Dota》是一个非常适合的对抗性游戏,游戏本身很复杂,也拥有高强度对抗场景。这意味着你需要一种新技术,来努力扩展、推进AI的边界。”OpenAI的首席技术官Greg Brockman(下称Brockman)透露。这也是他们为何选择《Dota》作为AI训练主战场的原因。

Brockman表示,在《Dota》中取胜更依赖于选手的直觉,而这已经通过AI学会了:通过自我对弈(Self-play)进行高强度训练,预测其他玩家的下一步操作,提高应对陌生环境的表现,帮助友军单位取胜。在经过仅仅两周的实时训练后,AI就达到了目前专业选手的水准。

最终,从对于自己所处的世界全无认识,再经历过大量和自身拷贝的对战后(这意味着它和对手永远是旗鼓相当的),AI的游戏技巧有了一日千里的进步。按照Brockman介绍,OpenAI在此之前已经战胜了现役的Arteezy、SumaiL等多个世界冠军级的《Dota》选手。

“OpenAI第一次打败了世界上最好的电竞选手。”

当然, OpenAI作为由硅谷大亨Elon Musk投资创立的非营利科研机构,其目的并非局限于游戏,Brockman透露,通过游戏中的训练,OpenAI希望帮助机器人建立系统性学习复杂技能的能力,这有助于帮助AI应对现实世界中的任务,如外科手术。

愿景很伟大,至少Elon Musk本人对这场比赛的结果还是很满意的,他专门发布了一条推特消息,称“OpenAI第一次打败了世界上最好的电竞选手。电竞比象棋、围棋这样的传统棋盘游戏要复杂得多。”还顺便小小嘲讽了一下对手AlphaGo。

DeepMind将研究重心放到了《星际争霸2》上。

不过,AlphaGo的拥有者DeepMind,也早已经将AI研究方向转移到游戏上了,几个月之前,他们选择了《星际争霸2》作为围棋之后的下一个测试对象。8月初,DeepMind开源了《星际争霸2》研究训练平台SC2LE。据《财富》报道,DeepMind的目标是让计算机击败最顶级的人类《星际争霸》玩家。

我们已经进入了一个AI研究的游戏化时代。AI巨头纷纷选择游戏作为研究入口,已经成为AI研究领域的重要风向。《经济学人》评论认为,电子游戏受追捧有几个原因:将游戏作为现实世界的训练场;不同的游戏需要不同的认知技能,游戏可以帮助他们了解如何把智能问题分解成更易处理的小模块;基于以上两种原因,认为游戏可以帮助他们发展出一套合适的人工(甚至自然)智能理论。

甚至电子游戏还可以简化现实AI研究中机器人的维护、调试过程:虚拟机器人没有重量,无需维护,改变规格也只要在键盘上敲几下就足够了。

而在明年,OpenAI的《Dota》选手将更加“名副其实”,开发团队计划在TI8前做出可以参加5V5比赛的AI,并且规则与人类比赛规则相同,可以预料,到时候这场人类与AI的游戏大战会更加精彩和戏剧化。

未经正式授权严禁转载本文,侵权必究。