人工智能还没有通过关键的考验，机器学习必须以大量的数据为基础|界面新闻

记者：胡秋实

在Pankai Mehra看来，人工智能还没有通过关键的考验，机器学习必须以大量的数据为基础，增强整个人工智能系统的稳定性，否则再良好的模型也无济于事。

1994年，Pankaj Mehra还在美国国家航空航天局（NASA）工作期间，风洞差一点就被拆掉了。最终没被拆掉的唯一原因，是风洞对设计机器人降落在火星的降落伞非常有用。

利用风洞测试，美国科学家们做了额外的工作，根据测试的结果对降落伞的材质进行选择，从而成功研制出了降落伞。而这一切并不是建立在模拟的基础上。

22 年后的今天，已经是Western Digital（西部数据公司）企业技术策略副总裁的PankajMehra，在回想起NASA对于风洞的态度转变时评价道，模拟的限制在于模拟是一个工具，它需要验证数据。

“如果给它垃圾，它也还给你垃圾，剩下来的只有良好的模型。所以，机器学习的重要性在于它是一套浸入式的技术。它是一个真正意义上充满适应力的系统，可以完全沉浸在一个新的环境里。它必须有一个环境，有各种数据。你设计了一个完美的模型，没有足够的数据，任何技术也帮不了。”PankajMehra在接受《科技50》采访时如是说。

对他来说，人工智能这个词的含义每十年都有变化。这些改变来自于，电脑通过了图灵测试的要求，让科技看起来更聪明，变得与人类很像，并呈现出拟人化的体验。“程序员完成的工作量与机器完成的工作量，这个比例正在发生改变。”

人工智能还未通过关键考验

今年（编者注：2016年）7月1日，美国国家公路交通安全管理局（NHTSA）发布消息，证实其5月7日在佛罗里达州发生的一起车祸中，一辆车是特斯拉Model S，车主使用了自动驾驶模式，并且在车祸中死亡。这也是全球第一例自动驾驶事故致死案例。

在Pankaj Mehra看来，人工智能还没有通过关键的考验。“当我们让机器学习去适应周围的环境，你不知道它会向哪个方向发展。这会引起问题。”

对此，他提出了关于系统稳定性的思考。

以电梯为例。当一台电梯在学习使用者进出的方式，会不会酿成一个不稳定的行为？在一个动态系统里，稳定性是一个常见的概念，比如说输入端的一个微小变化可能会完全影响和改变输出的结果。

Pankaj Mehra认为，即使是很简单的系统，人们也应该问一个问题，即这些系统是稳定的吗？而实际上，对于系统稳定性的测试，人工智能领域在技术层面还很不成熟。

目前的情况是，机器学习系统在实验室里被使用、再展示，设置因此逐渐地被改进。产生变化的是设置，而不是机器本身。但是，一个真正能够深度学习的系统将不会停止学习，会在它所属的环境中不断调整它的行为。

“问题是，我们是否成功设计了一个微分动力学系统并具有合适的稳定性计算？它能够超出实验室的范围，持续学习新事物，并展示出稳定的行为，能够处理所属操作范围以外的情况。它对自己有效的操作范围是有意识的，并清楚自己所应该学习的范围限制。当在操作范围以外，不应该作出适应的行为。应该停止学习，会询问发生了什么，并与用户互动。”PankajMehra对《科技50》表示，这些理念在基于统计学的系统中是不存在的，反而存在于基于逻辑的学习系统中，而未来的发展，取决于这些理论能否融合在一起，最终推动系统的成熟。

当系统存在设计缺陷或失效的时候，便会造成危害，即使是很简单的系统。以无人机为例。大型的无人驾驶机的飞行使用了算法或其他技术，因为不良的算法，造成对环境和范围的错误估算而坠落。它们能引起很大的危害，还会引起更大的事故，特别是降落在一些敏感区域，比如说核电厂，或是一堆储存了危险化学品的仓库。

Pankaj Mehra指出，当人类在设计大型复杂的智能系统时，人类应该遵循在汽车行业里常见的“不伤害原则”来设计系统。了解系统的局限性在哪里，从而发展出自己对工作范围的把握感。

“人工智能就像人类一样，两者都有可能造成危害。我认为，我们不该害怕，而是去重视。健康地辩论，公开地讨论，科学地分享各自看法、文化、代码以及技术，这对于人类的存亡至关重要，而不仅仅是国家的存亡。”PankajMehra对《科技50》说，“一些怪

异的错误可以来自于系统设计上的小失误。随着科技的发展，做好事和做坏事的可能性一样大。作为一个推动此领域发展的社区，我们应该畏惧，畏惧是因为我们在乎。”

捕捉更多情境数据

Pankaj Mehra认为，人工智能和机器学习发展到下一个阶段，至少需要10-20年的时间。理由在于，必须测试系统的稳定性，而实验室和实际生活环境很不同。而这些数据背后是不是有人作弊，采样取得的样本是不是有偏误，是不是这样的偏误让系统看起来没问题，都是未知的问题。

因此，在他看来，人工智能有三个关键因素，一是海量的数据，二是基础（运算）设施的规模，三是稳定强大的算法。

据Pankaj Mehra透露，在设计内存的过程中，五个核心特性里有三个是人类无法设计的。正因为如此，设计内存中的很多工作都是由黑箱算法来完成。这让PankajMehra及其团队对工作充满了自信。

“通过不断地设计和测试我们的系统，来达到某些特性，这些特性是我们根据经验预测到的。所以，我们依靠算法，了解这个设计好不好，如果好，便开始设计。”Pankaj Mehra说。

他坦言，团队在特性测试以及程序数据里用到了很多机器学习的技术，并获得了不同程度的成功。“现在，我已经很难分出多少工作是被我们的数据科学家完成的，多少是被我们的机器学习算法完成的。”

未来，情境计算将成为发展趋势。这一概念主要是由佐治亚理工学院研究人员阿宁德·戴伊（Anind Dey）和格里高利·阿宝德（Gregory Abowd）在13年前提出的。这种计算机堪称无处不在，能够随时对特定情境进行主观和客观的感知。它对人类的地理位置、身边伴侣和过往经验进行分析，从而使人类更好地感知和应对周围环境。这就是人类的第六感、第七感乃至第八感。

近十年来，Pankaj Mehra一直在努力推动情境计算的发展，并就此发表了一些论文。根据他的观察和研究，在情境计算或是情境感知上，我们仍处于初始阶段。“我们在内容上过度设计 (overengineering)，而没有捕捉到收录和使用情境。情境数据比内容数据大多了。正像Netflix Prize随着时间的推移显示的，即使是一点点情境信息，也可以极大地改善对用户推送电影的精确度。”

那么，人类应该怎么去建造一个人工智能和机器学习系统，从而获取更多的情境数据？

在Pankaj Mehra看来，相比起预测什么样的模型能获得成功，人类想要解决什么问题显得更重要，同时需要思考的是，这个问题被解决的可能性又有多大。

来自牛津大学的逻辑小组，与另一个致力于量子计算机运算的小组合作，发现情境内在的复杂性产生了很大的数据集。只有解决这些庞大的数据矩阵，把数据整理成稳定的子集，人类才能有效地推理。

“ 我们需要量子计算机。这很有趣，它指出了接下来的50年里机器学习和人工智能的发展。”Pankaj Mehra说。

他认为，人类要考虑到，兴趣点是什么数据，需要怎样的规模来处理这些数据。按照他的说法，人类不需要一个系统抓取的内容数据多过情境数据，而是需要系统去调节一些量子位；不需要传统算法去计算大量不一致的数据，而是算法可以自动地根据情境来给数据分类，使用情境来建造将来的推送系统和评分系统。

Pankaj Mehra对《科技50》解释道：“你走路时的推荐跟开车时的推荐不一样，在地图设计里，我们看到了一些这样的元素，可还是需要我们持续地努力。我相信这需要量子计算机运算的成熟，需要捕捉到更多情境。

本文源自科技50创业杂志：《科技50》

记者：胡秋实

人工智能还未通过关键考验

在Pankaj Mehra看来，人工智能还没有通过关键的考验。“当我们让机器学习去适应周围的环境，你不知道它会向哪个方向发展。这会引起问题。”

对此，他提出了关于系统稳定性的思考。

捕捉更多情境数据

因此，在他看来，人工智能有三个关键因素，一是海量的数据，二是基础（运算）设施的规模，三是稳定强大的算法。

那么，人类应该怎么去建造一个人工智能和机器学习系统，从而获取更多的情境数据？

在Pankaj Mehra看来，相比起预测什么样的模型能获得成功，人类想要解决什么问题显得更重要，同时需要思考的是，这个问题被解决的可能性又有多大。

“ 我们需要量子计算机。这很有趣，它指出了接下来的50年里机器学习和人工智能的发展。”Pankaj Mehra说。

本文源自科技50创业杂志：《科技50》

历史搜索全部删除

热门搜索

人工智能还没有通过关键的考验，机器学习必须以大量的数据为基础

人工智能还未通过关键考验

捕捉更多情境数据

评论

人工智能还没有通过关键的考验，机器学习必须以大量的数据为基础

人工智能还未通过关键考验

捕捉更多情境数据