正在阅读:

DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼:通用智能就是空谈

扫一扫下载界面新闻APP

DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼:通用智能就是空谈

抱着质疑和批判的态度去看待每一项研究,你支持马库斯吗?

文|新智元

编辑|大明、张佳

Gary Marcus最近似乎和DeepMind杠上了。

针对DeepMind前几日发布的《星际争霸2》智能体AlphaStar进化版,他在Twitter再次提出了自己的质疑。不过这次,Marcus的质疑点并不是AlphaStar游戏表现本身,而是指向了更高的层面:对未来通用智能研究的意义。

Marcus在Twitter上表示:

DeepMind最近的《星际争霸2》 AlphaStar取得了很不错的结果,但这能称得上通向通用智能的重要一步吗?这里有几个问题:

星际争霸要比Atari游戏难得多,这次DeepMind推出的新版Alphastar性能比1月份那版强力了很多,与真实世界中的玩家实现了复杂场景交互中的对战。但是:

1、在不经修改的情况下,AlphaStar能制霸其他游戏吗?虽然AlphaStar的雏形继承了击败围棋世界冠军的AlphaZero,但此次发布的模型是高度结构化的,其中单位、表示和训练域等要素都是高度针对《星际争霸2》开发并调试的。

2、对AlphaStar专有模型的训练,能否降低和《星际争霸2》类似的策略游戏AI的训练时间?比如《魔兽争霸3》?人类玩家是可以进行这种跨游戏的“经验转移“的。

3、游戏内的AlphaStar对于不同地图、不同种族都能胜任吗?人类玩家至少会擅长多张地图和不止一个种族。

4、只凭借大量人类精英玩家生成的数据,AlphaStar的未来迭代版本还能保持成功吗?系统所需的大量“replay”数据在现实世界中可能很难获取。

5、人类专业知识对于AlphaStar有多重要?2017年,DeepMind推出了AlphaZero因为宣称“无需任何人类知识”而引发大量关注,此次AlphaStar的成功离不开在《星际争霸2》的人类知识和真人对战的演示视频。也许现在是时候承认人类知识的重要价值了。

6、在《星际争霸》领域表现优异的AlphaStar,能否同样在其他开放端领域同样出色?如自然语言理解,该领域的句子范围基本上是无限的。

和上一次对OpenAI魔方机器手的“开炮”相比,本次的6点问题在语气上和深度上都弱了不少。产生的影响似乎也没有上次那么广泛了。毕竟DeepMind这次发布的AlphaStar是一款游戏AI,对于泛化性能也不是重点,只是在博客中提了一嘴。

从Twitter的网友回复中,也可以看出这一点。大部分网友认为Marcus说的有一定道理,但其实DeepMind在博客中已经承认,不利用人类的先验知识,几乎是不可能成功的。

还有网友表示,其实星际争霸这个游戏,精通多个种族可不是一件容易的事情,比如他自己,就只会玩人族,其它两个种族就是菜。

还有网友提出了新的问题:AlphaStar对战斗单位的强度修正(加强和削弱)的变化能做出有效应对吗?如果一些单位完全被移除,又会出现什么情况?

不过,这条Twitter目前为止热度一般,回复和讨论比前些日子Marcus质疑OpenAI"魔方机械手”时的热度差了不少。

到目前为止,DeepMind还没有做出回应。

DeepMind的《星际争霸2》游戏AI “AlphaStar”碾压99.8%人类玩家

接下来给大家补充一下剧情,马库斯这次质疑的DeepMind研究到底是什么。

今年1月,DeepMind的《星际争霸2》游戏AI “AlphaStar”初级版本的发布曾引发广泛关注。当时AlphaStar使用神族挑战了《星际争霸2》中的两个专业玩家并获得了胜利。

时隔9个多月,AlphaStar进化成为完全版,并实现了在战网真实对战中的宗师级水平,分位超过了99.8%的人类玩家。刊载相关成果的论文已发表在Nature上。

DeepMind在近日发布了博客中特意将新版AlphaStar与旧版做了对比。具体来说,此次的“完全体AlphaStar”与旧版有4点主要区别:

1、 AlphaStar现在和人类在相同的限制条件下游戏,包括通过摄像头观察世界,对其动作操作频率也作出了更严格的限制,不会再发生APM高到离谱的现象。

2、 AlphaStar现在可以使用游戏中三个种族(人族、虫族、神族)的任意一种与人类玩家进行1v1对战,而不是像1月份时那样只会用神族。使用每个种族的智能体都是一个单独的神经网络。

3、 智能体在战网中的训练是完全自动化的,开始只由监督学习训练,而不像原来那样凭借过去的游戏经验进行训练学习。

4、 此次AlphaStar在暴雪官方战网和游戏服务器上进行游戏,使用的是和人类玩家相同的地图和条件。

DeepMind表示,新版AlphaStar智能体采用通用机器学习技术,包括神经网络、通过强化学习的自对战、多智能体学习、模仿学习等技术。利用这些技术,新版AlphaStar的游戏水平超过了战网99.8%的活跃玩家,使用三个种族都拿到了宗师级称号。

马库斯:深度学习怀疑论者,曾质疑OpenAI“单手解魔方”

加里·马库斯(Gary Marcus)是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官,Geometric Intelligence 公司(2016 年被优步收购)的创始人兼首席执行官,出版著作包括《代数思维》、《怪诞脑科学(Kluge)》、《思维的诞生》等,最新著作是与 Ernest Davis 合著的《Rebooting AI :构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家,他一直高调参与人工智能辩论,与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

他曾撰文批判深度学习(Marcus, 2018),称深度学习实际上并没解决什么问题。这篇文章引起了人工智能圈极大的反响,几天之内,成千上万的人在推特上发表了自己对这个问题的看法,有些人热情支持马库斯的论点(例如,“这是我多年来读到的有关深度学习和 AI 的最好的观点),有些相反(例如,“有思考...... 但大部分都是错误的”)。

在那篇批判深度学习的文章中,马库斯概括了深度学习的十大挑战,直言深度学习本身虽然有用,但它不可能实现通用人工智能。他建议把深度学习视为“一种非普遍的解决方法,而只是一种工具。”

他说:“相比纯粹的深度学习,我呼吁混合模型,不仅包括深度学习的监督形式,还包括其他技术,例如符号处理(symbol-manipulation),以及无监督学习(它本身也可能被重新概念化)。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

就在前不久,马库斯对OpenAI“单手解魔方”提出质疑,认为 OpenAI 还原魔方的博客内容存在误导性,并表示:“鉴于 OpenAI 仍然没有更改关于“解决魔方”的误导性博客帖子(博客标题是“Solving Rubik’s Cube with a Robot Hand),所以我附上了详细的分析,将他们的说法和暗示与实际所做的进行了比较。依我之见,这些误导性对大多数对非专业人士来说并不明显。”

马库斯对 OpenAI“解决魔方”的 7 条质疑如下:

1、这不是神经网络解决的;而是有 17 年历史的符号算法做到的。

2、这种算法是先天的,而不是学习的。

3、强化学习在选择转向哪个方向(即大多数人所说的解决了魔方)时不起作用。

4、所学到的是物体操纵,而不是解魔方。

5、只有一个物体被操纵,并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器(如蓝牙传感器),机器手也安装了 LED。

7、成功率只有 20%;魔方经常从机器人手中掉落。

他说:“我强调一下,这个成果本身给人留下了深刻的印象,但描述有误导,更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展”或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba注意到马库斯的帖子,反驳道:

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实,而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100%吗?

马库斯回应道:

1. 我的前两个论点完全不同:先天性≠象征性。这些是不同的。第三个论点有一点重叠,但并不明显。

2.我当然知道,但是为了稳健性,你需要推广到新物体上

3&4:我期待看到其他结果;我相信你们最终会做得更好。

尽管是马库斯率先提出质疑,但不少人的回复并不赞同马库斯的说法,有人回复道:

“这是一个有缺陷的批评,基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务,而是需要记忆解法和熟练操作的任务;人类玩魔方也遵循一种算法。”

马库斯仍表示:总的来说,他们(OpenAI)没有对我的观点做出回应,我的观点是那篇博客的框架与论文的内容不相符合,虽然我同意这个工作很重要,但炒作是有误导性的。

抱着质疑和批判的态度去看待每一项研究,你支持马库斯吗?

参考来源:Twitter

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼:通用智能就是空谈

抱着质疑和批判的态度去看待每一项研究,你支持马库斯吗?

文|新智元

编辑|大明、张佳

Gary Marcus最近似乎和DeepMind杠上了。

针对DeepMind前几日发布的《星际争霸2》智能体AlphaStar进化版,他在Twitter再次提出了自己的质疑。不过这次,Marcus的质疑点并不是AlphaStar游戏表现本身,而是指向了更高的层面:对未来通用智能研究的意义。

Marcus在Twitter上表示:

DeepMind最近的《星际争霸2》 AlphaStar取得了很不错的结果,但这能称得上通向通用智能的重要一步吗?这里有几个问题:

星际争霸要比Atari游戏难得多,这次DeepMind推出的新版Alphastar性能比1月份那版强力了很多,与真实世界中的玩家实现了复杂场景交互中的对战。但是:

1、在不经修改的情况下,AlphaStar能制霸其他游戏吗?虽然AlphaStar的雏形继承了击败围棋世界冠军的AlphaZero,但此次发布的模型是高度结构化的,其中单位、表示和训练域等要素都是高度针对《星际争霸2》开发并调试的。

2、对AlphaStar专有模型的训练,能否降低和《星际争霸2》类似的策略游戏AI的训练时间?比如《魔兽争霸3》?人类玩家是可以进行这种跨游戏的“经验转移“的。

3、游戏内的AlphaStar对于不同地图、不同种族都能胜任吗?人类玩家至少会擅长多张地图和不止一个种族。

4、只凭借大量人类精英玩家生成的数据,AlphaStar的未来迭代版本还能保持成功吗?系统所需的大量“replay”数据在现实世界中可能很难获取。

5、人类专业知识对于AlphaStar有多重要?2017年,DeepMind推出了AlphaZero因为宣称“无需任何人类知识”而引发大量关注,此次AlphaStar的成功离不开在《星际争霸2》的人类知识和真人对战的演示视频。也许现在是时候承认人类知识的重要价值了。

6、在《星际争霸》领域表现优异的AlphaStar,能否同样在其他开放端领域同样出色?如自然语言理解,该领域的句子范围基本上是无限的。

和上一次对OpenAI魔方机器手的“开炮”相比,本次的6点问题在语气上和深度上都弱了不少。产生的影响似乎也没有上次那么广泛了。毕竟DeepMind这次发布的AlphaStar是一款游戏AI,对于泛化性能也不是重点,只是在博客中提了一嘴。

从Twitter的网友回复中,也可以看出这一点。大部分网友认为Marcus说的有一定道理,但其实DeepMind在博客中已经承认,不利用人类的先验知识,几乎是不可能成功的。

还有网友表示,其实星际争霸这个游戏,精通多个种族可不是一件容易的事情,比如他自己,就只会玩人族,其它两个种族就是菜。

还有网友提出了新的问题:AlphaStar对战斗单位的强度修正(加强和削弱)的变化能做出有效应对吗?如果一些单位完全被移除,又会出现什么情况?

不过,这条Twitter目前为止热度一般,回复和讨论比前些日子Marcus质疑OpenAI"魔方机械手”时的热度差了不少。

到目前为止,DeepMind还没有做出回应。

DeepMind的《星际争霸2》游戏AI “AlphaStar”碾压99.8%人类玩家

接下来给大家补充一下剧情,马库斯这次质疑的DeepMind研究到底是什么。

今年1月,DeepMind的《星际争霸2》游戏AI “AlphaStar”初级版本的发布曾引发广泛关注。当时AlphaStar使用神族挑战了《星际争霸2》中的两个专业玩家并获得了胜利。

时隔9个多月,AlphaStar进化成为完全版,并实现了在战网真实对战中的宗师级水平,分位超过了99.8%的人类玩家。刊载相关成果的论文已发表在Nature上。

DeepMind在近日发布了博客中特意将新版AlphaStar与旧版做了对比。具体来说,此次的“完全体AlphaStar”与旧版有4点主要区别:

1、 AlphaStar现在和人类在相同的限制条件下游戏,包括通过摄像头观察世界,对其动作操作频率也作出了更严格的限制,不会再发生APM高到离谱的现象。

2、 AlphaStar现在可以使用游戏中三个种族(人族、虫族、神族)的任意一种与人类玩家进行1v1对战,而不是像1月份时那样只会用神族。使用每个种族的智能体都是一个单独的神经网络。

3、 智能体在战网中的训练是完全自动化的,开始只由监督学习训练,而不像原来那样凭借过去的游戏经验进行训练学习。

4、 此次AlphaStar在暴雪官方战网和游戏服务器上进行游戏,使用的是和人类玩家相同的地图和条件。

DeepMind表示,新版AlphaStar智能体采用通用机器学习技术,包括神经网络、通过强化学习的自对战、多智能体学习、模仿学习等技术。利用这些技术,新版AlphaStar的游戏水平超过了战网99.8%的活跃玩家,使用三个种族都拿到了宗师级称号。

马库斯:深度学习怀疑论者,曾质疑OpenAI“单手解魔方”

加里·马库斯(Gary Marcus)是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官,Geometric Intelligence 公司(2016 年被优步收购)的创始人兼首席执行官,出版著作包括《代数思维》、《怪诞脑科学(Kluge)》、《思维的诞生》等,最新著作是与 Ernest Davis 合著的《Rebooting AI :构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家,他一直高调参与人工智能辩论,与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

他曾撰文批判深度学习(Marcus, 2018),称深度学习实际上并没解决什么问题。这篇文章引起了人工智能圈极大的反响,几天之内,成千上万的人在推特上发表了自己对这个问题的看法,有些人热情支持马库斯的论点(例如,“这是我多年来读到的有关深度学习和 AI 的最好的观点),有些相反(例如,“有思考...... 但大部分都是错误的”)。

在那篇批判深度学习的文章中,马库斯概括了深度学习的十大挑战,直言深度学习本身虽然有用,但它不可能实现通用人工智能。他建议把深度学习视为“一种非普遍的解决方法,而只是一种工具。”

他说:“相比纯粹的深度学习,我呼吁混合模型,不仅包括深度学习的监督形式,还包括其他技术,例如符号处理(symbol-manipulation),以及无监督学习(它本身也可能被重新概念化)。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

就在前不久,马库斯对OpenAI“单手解魔方”提出质疑,认为 OpenAI 还原魔方的博客内容存在误导性,并表示:“鉴于 OpenAI 仍然没有更改关于“解决魔方”的误导性博客帖子(博客标题是“Solving Rubik’s Cube with a Robot Hand),所以我附上了详细的分析,将他们的说法和暗示与实际所做的进行了比较。依我之见,这些误导性对大多数对非专业人士来说并不明显。”

马库斯对 OpenAI“解决魔方”的 7 条质疑如下:

1、这不是神经网络解决的;而是有 17 年历史的符号算法做到的。

2、这种算法是先天的,而不是学习的。

3、强化学习在选择转向哪个方向(即大多数人所说的解决了魔方)时不起作用。

4、所学到的是物体操纵,而不是解魔方。

5、只有一个物体被操纵,并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器(如蓝牙传感器),机器手也安装了 LED。

7、成功率只有 20%;魔方经常从机器人手中掉落。

他说:“我强调一下,这个成果本身给人留下了深刻的印象,但描述有误导,更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展”或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba注意到马库斯的帖子,反驳道:

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实,而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100%吗?

马库斯回应道:

1. 我的前两个论点完全不同:先天性≠象征性。这些是不同的。第三个论点有一点重叠,但并不明显。

2.我当然知道,但是为了稳健性,你需要推广到新物体上

3&4:我期待看到其他结果;我相信你们最终会做得更好。

尽管是马库斯率先提出质疑,但不少人的回复并不赞同马库斯的说法,有人回复道:

“这是一个有缺陷的批评,基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务,而是需要记忆解法和熟练操作的任务;人类玩魔方也遵循一种算法。”

马库斯仍表示:总的来说,他们(OpenAI)没有对我的观点做出回应,我的观点是那篇博客的框架与论文的内容不相符合,虽然我同意这个工作很重要,但炒作是有误导性的。

抱着质疑和批判的态度去看待每一项研究,你支持马库斯吗?

参考来源:Twitter

本文为转载内容,授权事宜请联系原著作权人。