记者:胡秋实
在Pankai Mehra看来,人工智能还没有通过关键的考验,机器学习必须以大量的数据为基础,增强整个人工智能系统的稳定性,否则再良好的模型也无济于事。
1994年,Pankaj Mehra还在美国国家航空航天局(NASA)工作期间,风洞差一点就被拆掉了。最终没被拆掉的唯一原因,是风洞对设计机器人降落在火星的降落伞非常有用。
利用风洞测试,美国科学家们做了额外的工作,根据测试的结果对降落伞的材质进行选择,从而成功研制出了降落伞。而这一切并不是建立在模拟的基础上。
22 年后的今天,已经是Western Digital(西部数据公司)企业技术策略副总裁的PankajMehra,在回想起NASA对于风洞的态度转变时评价道,模拟的限制在于模拟是一个工具,它需要验证数据。
“如果给它垃圾,它也还给你垃圾,剩下来的只有良好的模型。所以,机器学习的重要性在于它是一套浸入式的技术。它是一个真正意义上充满适应力的系统,可以完全沉浸在一个新的环境里。它必须有一个环境,有各种数据。你设计了一个完美的模型,没有足够的数据,任何技术也帮不了。”PankajMehra在接受《科技50》采访时如是说。
对他来说,人工智能这个词的含义每十年都有变化。这些改变来自于,电脑通过了图灵测试的要求,让科技看起来更聪明,变得与人类很像,并呈现出拟人化的体验。“程序员完成的工作量与机器完成的工作量,这个比例正在发生改变。”
人工智能还未通过关键考验
今年(编者注:2016年)7月1日,美国国家公路交通安全管理局(NHTSA)发布消息,证实其5月7日在佛罗里达州发生的一起车祸中,一辆车是特斯拉Model S,车主使用了自动驾驶模式,并且在车祸中死亡。这也是全球第一例自动驾驶事故致死案例。

在Pankaj Mehra看来,人工智能还没有通过关键的考验。“当我们让机器学习去适应周围的环境,你不知道它会向哪个方向发展。这会引起问题。”
对此,他提出了关于系统稳定性的思考。
以电梯为例。当一台电梯在学习使用者进出的方式,会不会酿成一个不稳定的行为?在一个动态系统里,稳定性是一个常见的概念,比如说输入端的一个微小变化可能会完全影响和改变输出的结果。
Pankaj Mehra认为,即使是很简单的系统,人们也应该问一个问题,即这些系统是稳定的吗?而实际上,对于系统稳定性的测试,人工智能领域在技术层面还很不成熟。
目前的情况是,机器学习系统在实验室里被使用、再展示,设置因此逐渐地被改进。产生变化的是设置,而不是机器本身。但是,一个真正能够深度学习的系统将不会停止学习,会在它所属的环境中不断调整它的行为。
“问题是,我们是否成功设计了一个微分动力学系统并具有合适的稳定性计算?它能够超出实验室的范围,持续学习新事物,并展示出稳定的行为,能够处理所属操作范围以外的情况。它对自己有效的操作范围是有意识的,并清楚自己所应该学习的范围限制。当在操作范围以外,不应该作出适应的行为。应该停止学习,会询问发生了什么,并与用户互动。”PankajMehra对《科技50》表示,这些理念在基于统计学的系统中是不存在的,反而存在于基于逻辑的学习系统中,而未来的发展,取决于这些理论能否融合在一起,最终推动系统的成熟。
当系统存在设计缺陷或失效的时候,便会造成危害,即使是很简单的系统。以无人机为例。大型的无人驾驶机的飞行使用了算法或其他技术,因为不良的算法,造成对环境和范围的错误估算而坠落。它们能引起很大的危害,还会引起更大的事故,特别是降落在一些敏感区域,比如说核电厂,或是一堆储存了危险化学品的仓库。
Pankaj Mehra指出,当人类在设计大型复杂的智能系统时,人类应该遵循在汽车行业里常见的“不伤害原则”来设计系统。了解系统的局限性在哪里,从而发展出自己对工作范围的把握感。

“人工智能就像人类一样,两者都有可能造成危害。我认为,我们不该害怕,而是去重视。健康地辩论,公开地讨论,科学地分享各自看法、文化、代码以及技术,这对于人类的存亡至关重要,而不仅仅是国家的存亡。”PankajMehra对《科技50》说,“一些怪
异的错误可以来自于系统设计上的小失误。随着科技的发展,做好事和做坏事的可能性一样大。作为一个推动此领域发展的社区,我们应该畏惧,畏惧是因为我们在乎。”
捕捉更多情境数据
Pankaj Mehra认为,人工智能和机器学习发展到下一个阶段,至少需要10-20年的时间。理由在于,必须测试系统的稳定性,而实验室和实际生活环境很不同。而这些数据背后是不是有人作弊,采样取得的样本是不是有偏误,是不是这样的偏误让系统看起来没问题,都是未知的问题。
因此,在他看来,人工智能有三个关键因素,一是海量的数据,二是基础(运算)设施的规模,三是稳定强大的算法。
据Pankaj Mehra透露,在设计内存的过程中,五个核心特性里有三个是人类无法设计的。正因为如此,设计内存中的很多工作都是由黑箱算法来完成。这让PankajMehra及其团队对工作充满了自信。
“通过不断地设计和测试我们的系统,来达到某些特性,这些特性是我们根据经验预测到的。所以,我们依靠算法,了解这个设计好不好,如果好,便开始设计。”Pankaj Mehra说。
他坦言,团队在特性测试以及程序数据里用到了很多机器学习的技术,并获得了不同程度的成功。“现在,我已经很难分出多少工作是被我们的数据科学家完成的,多少是被我们的机器学习算法完成的。”
未来,情境计算将成为发展趋势。这一概念主要是由佐治亚理工学院研究人员阿宁德·戴伊(Anind Dey)和格里高利·阿宝德(Gregory Abowd)在13年前提出的。这种计算机堪称无处不在,能够随时对特定情境进行主观和客观的感知。它对人类的地理位置、身边伴侣和过往经验进行分析,从而使人类更好地感知和应对周围环境。这就是人类的第六感、第七感乃至第八感。
近十年来,Pankaj Mehra一直在努力推动情境计算的发展,并就此发表了一些论文。根据他的观察和研究,在情境计算或是情境感知上,我们仍处于初始阶段。“我们在内容上过度设计 (overengineering),而没有捕捉到收录和使用情境。情境数据比内容数据大多了。正像Netflix Prize随着时间的推移显示的,即使是一点点情境信息,也可以极大地改善对用户推送电影的精确度。”
那么,人类应该怎么去建造一个人工智能和机器学习系统,从而获取更多的情境数据?
在Pankaj Mehra看来,相比起预测什么样的模型能获得成功,人类想要解决什么问题显得更重要,同时需要思考的是,这个问题被解决的可能性又有多大。
来自牛津大学的逻辑小组,与另一个致力于量子计算机运算的小组合作,发现情境内在的复杂性产生了很大的数据集。只有解决这些庞大的数据矩阵,把数据整理成稳定的子集,人类才能有效地推理。
“ 我们需要量子计算机。这很有趣,它指出了接下来的50年里机器学习和人工智能的发展。”Pankaj Mehra说。
他认为,人类要考虑到,兴趣点是什么数据,需要怎样的规模来处理这些数据。按照他的说法,人类不需要一个系统抓取的内容数据多过情境数据,而是需要系统去调节一些量子位;不需要传统算法去计算大量不一致的数据,而是算法可以自动地根据情境来给数据分类,使用情境来建造将来的推送系统和评分系统。
Pankaj Mehra对《科技50》解释道:“你走路时的推荐跟开车时的推荐不一样,在地图设计里,我们看到了一些这样的元素,可还是需要我们持续地努力。我相信这需要量子计算机运算的成熟,需要捕捉到更多情境。
本文源自科技50创业杂志:《科技50》


评论