人工智能的下一个前沿：能够识别语言的机器|界面新闻

机器到底能不能够参透复杂的人类语言？这是人工智能的研究者们一直试图解决的问题。现在看来，对自然语言进行简单读取、判别、归纳、模仿似乎已经不是不可能完成的任务，但真的要深入领会文章的意味和情感，判别不同语境下词的含义，甚至进行人类都觉得犯难的不同语言互译，无疑将成为人工智能的下一个前沿。

日前，美国著名科技类网站Wire.com刊文《人工智能的下一个前沿：能够识别语言的机器》（AI's Next Frontier: Machines that Understand Language），介绍了该领域的创业公司MetaMind的最新研究成果。本文由凯盛汇编译。

感谢类神经网络——也就是通过机器网络在模拟人脑中的神经网络——脸书现在已经可以对你的脸进行智能识别了，谷歌现在可以识别你喊出的声音并录入安卓手机了，微软现在可以把你的演讲即时翻译成另一种语言了……现在，摆在面前的任务就是教会这些在线服务如何理解自然语言；不仅仅是简单捕捉每个词的意思，而是要将整句话甚至整篇文章融会贯通。

脸书的人工智能研究者们最近展示了一款新开发的系统，可以阅读《指环王》（The Lord of the Rings）的片段摘要，并回答与此书相关的一些问题。谷歌也采用了一种叫做Word2Vec的类神经网络算法，让机器更好地理解网络文章中词与词之间的内在关系—— 他们也希望通过此举来推广谷歌即时（Google Now），那是一款能让用户随时获取所需信息，甚至不用主动搜索的神奇产品。脸书人工智能方面的负责人伊安·勒昆表示，自然语言处理将是人工智能的“下一个前沿”。

一家专注于人工智能领域的创业公司MetaMind同样在为上述目标而努力着。 MetaMind最近公布了一项基于类神经网络系统研究的细节，可以利用人造的短期记忆，回答与自然语言处理相关的多类问题。据MetaMind介绍，此系统几乎可以对一切问题进行回答，无论是基于文本的详细询问，还是诸如“文章所表达的感情是什么”、“这段文字用法语怎样表述”这样需要提炼、转化的问题。这项研究的成果已经与本周在Arxiv.org（一个收集物理学、数学、计算机科学与生物学论文预印本的网站）正式发布，与此前脸书和谷歌的研究交相呼应，而MetaMind又向前迈了一步。

“这是一个讨论得很热的话题，而这篇论文的作者不仅追上了该领域的最先进科技，甚至超越了十万八千里。”加拿大蒙特利尔大学的计算机科学教授约书亚·本吉奥如是评价。本吉奥教授是人工治疗领域的专家，也参与了MetaMind这篇最新论文的审阅。“他们所做研究的整个建构非常有趣，雄心勃勃地瞄准了一个潜力巨大的领域。他们的研究试图依序对大量的文本进行语法分析——没准那天会把维基百科上所有的词条都玩遍吧——然后，通过详实的语义学展示，对上述问题逐一进行应答。

MetaMind的界面

一件人人皆可用的工具

现代类神经网络算法通常被称作“深度学习”，无比强大，可以解决许多不同类型的任务。其他领域的研究者也可以利用同样的算法，来提高汽车性能，或是制造会开瓶盖的机器人。谷歌工程师杰夫·迪恩介绍，该公司的类神经元网络系统为十多项在线服务功能提供驱动，譬如谷歌+（Google+）、谷歌即时（Google Now）、谷歌街景（Street View）等。在最新发表的这篇论文中，MetaMind证明了这一算法被应用到一系列宽领域的自然语言处理任务时，效率能有多高。“这一突破毫无疑问展现了机器智能的美感、趣味性和重要性。”本吉奥评价说，“也展示了一种多领域共通的解决方案。”

MetaMind也为其他企业构建深度学习系统，他们此次还展示了一款名为“动态记忆网络”的产品。这与脸书之前的一款产品很相似，让机器能够回答诸如“一个词在特定的语境下是什么意思”这样的问题。理查德·佐赫尔（MetaMind的创始人、 CTO）还展示了最新的问答系统，该系统与脸书是基于同一套数据组的。“和网络搜索很像。”佐赫尔说，“不同之处在于，你得到的是真实成型的回答，而不是一堆链接。”

根据论文内容，你若是在系统中输入如下文字：

简走进了走廊。

玛丽走进了浴室。

桑德拉走进了花园。

丹尼尔走回了花园。

桑德拉把牛奶拿到了那里。

然后再输入问题：“牛奶在哪里？”回答显示是：“花园。”

回答所有的问题

与此同时，该系统还能判定情感——说得明白些，就是字里行间透露出的情感。它可以识别一段演讲中的一部分，也可以判定一个特定代词的所指。它甚至可以实现两种文字之间的互译。基本上说，系统是把这些任务作为需要回答的问题来处理的。这段文字表达的是积极还是消极的意味？这段文字是以第几人称叙述的？文中的“他们的”、“那个”、“他”分别指代着谁？这整段文字用法语表述是怎样的？”

MetaMind的界面

“对于该领域的深刻见解——听起来仿佛有点琐碎——就是，自然语言处理涉及的每项任务说到底都是问与答的模式。”佐赫尔说。他当年在斯坦福大学的博士论文就是关注机器智能、电脑成像、自然语言处理等问题的。

该系统能做到这些，靠的都是佐赫尔所说的“间歇性记忆”。如果把类神经网络比作大脑皮层——即信息处理的关键部位的话，那“间歇性记忆”就相当于海马体，这是为人类提供短期记忆的部位。还是举上文所述的花园与牛奶的例子，系统必须“记住”丹尼尔在花园中这一事实，然后再判定牛奶到底在哪儿。“若是没有间歇性记忆，就无法完成传递性推导。”佐赫尔解释说。

他进一步解释说，通过运用同样的设置，就可以分析文字所蕴含的情感，或是将文字翻译成另一种语言。“一种模型——一套动态记忆网络，就可以解决许多不同的问题。”他说。本吉奥指出，MetaMind为每一类任务培植出一套有些许差别的解决模式。但最终的目的，还是将所有这些任务整合化。这就需要朝着新的前沿，再迈出一步。

MetaMind的界面

一件人人皆可用的工具

根据论文内容，你若是在系统中输入如下文字：

简走进了走廊。

玛丽走进了浴室。

桑德拉走进了花园。

丹尼尔走回了花园。

桑德拉把牛奶拿到了那里。

然后再输入问题：“牛奶在哪里？”回答显示是：“花园。”

回答所有的问题

MetaMind的界面

历史搜索全部删除

热门搜索

人工智能的下一个前沿：能够识别语言的机器

一件人人皆可用的工具

回答所有的问题

评论

人工智能的下一个前沿：能够识别语言的机器

一件人人皆可用的工具

回答所有的问题