正在阅读:

人工智能的下一个前沿:能够识别语言的机器

扫一扫下载界面新闻APP

人工智能的下一个前沿:能够识别语言的机器

机器到底能不能够参透复杂的人类语言?这是人工智能的研究者们一直试图解决的问题。美国著名科技类网站Wire.com刊文《人工智能的下一个前沿:能够识别语言的机器》介绍了该领域的创业公司MetaMind的最新研究成果。

机器到底能不能够参透复杂的人类语言?这是人工智能的研究者们一直试图解决的问题。现在看来,对自然语言进行简单读取、判别、归纳、模仿似乎已经不是不可能完成的任务,但真的要深入领会文章的意味和情感,判别不同语境下词的含义,甚至进行人类都觉得犯难的不同语言互译,无疑将成为人工智能的下一个前沿。

日前,美国著名科技类网站Wire.com刊文《人工智能的下一个前沿:能够识别语言的机器》(AI's Next Frontier: Machines that Understand Language),介绍了该领域的创业公司MetaMind的最新研究成果。本文由凯盛汇编译。

感谢类神经网络——也就是通过机器网络在模拟人脑中的神经网络——脸书现在已经可以 对你的脸进行智能识别了,谷歌现在可以识别你喊出的声音并录入安卓手机了,微软现在可以把你的演讲即时翻译成另一种语言了……现在,摆在面前的任务就是教 会这些在线服务如何理解自然语言;不仅仅是简单捕捉每个词的意思,而是要将整句话甚至整篇文章融会贯通。

脸书的人工智能研究者们最近展示了一款新开发的系统,可以阅读《指环王》(The Lord of the Rings) 的片段摘要,并回答与此书相关的一些问题。谷歌也采用了一种叫做Word2Vec的类神经网络算法,让机器更好地理解网络文章中词与词之间的内在关系—— 他们也希望通过此举来推广谷歌即时(Google Now),那是一款能让用户随时获取所需信息,甚至不用主动搜索的神奇产品。脸书人工智能方面的负责人伊安·勒昆表示,自然语言处理将是人工智能的“下一 个前沿”。

一家专注于人工智能领域的创业公司MetaMind同样在为上述目标而努力着。 MetaMind最近公布了一项基于类神经网络系统研究的细节,可以利用人造的短期记忆,回答与自然语言处理相关的多类问题。据MetaMind介绍,此系统几乎可以对一切问题进行回答,无论是基于文本的详细询问,还是诸如“文章所表达的感情是什么”、“这段文字用法语怎样表述”这样需要提炼、转化的问 题。这项研究的成果已经与本周在Arxiv.org(一个收集物理学、数学、计算机科学与生物学论文预印本的网站)正式发布,与此前脸书和谷歌的研究交相 呼应,而MetaMind又向前迈了一步。

“这是一个讨论得很热的话题,而这篇论文的作者不仅追上了该领域的最先进科技,甚至 超越了十万八千里。”加拿大蒙特利尔大学的计算机科学教授约书亚·本吉奥如是评价。本吉奥教授是人工治疗领域的专家,也参与了MetaMind这篇最新论 文的审阅。“他们所做研究的整个建构非常有趣,雄心勃勃地瞄准了一个潜力巨大的领域。他们的研究试图依序对大量的文本进行语法分析——没准那天会把维基百 科上所有的词条都玩遍吧——然后,通过详实的语义学展示,对上述问题逐一进行应答。

MetaMind的界面

一件人人皆可用的工具

现代类神经网络算法通常被称作“深度学习”,无比强大,可以解决许多不同类型的任 务。其他领域的研究者也可以利用同样的算法,来提高汽车性能,或是制造会开瓶盖的机器人。谷歌工程师杰夫·迪恩介绍,该公司的类神经元网络系统为十多项在 线服务功能提供驱动,譬如谷歌+(Google+)、谷歌即时(Google Now)、谷歌街景(Street View)等。在最新发表的这篇论文中,MetaMind证明了这一算法被应用到一系列宽领域的自然语言处理任务时,效率能有多高。“这一突破毫无疑问展 现了机器智能的美感、趣味性和重要性。”本吉奥评价说,“也展示了一种多领域共通的解决方案。”

MetaMind也为其他企业构建深度学习系统,他们此次还展示了一款名为“动态记忆网络”的 产品。这与脸书之前的一款产品很相似,让机器能够回答诸如“一个词在特定的语境下是什么意思”这样的问题。理查德·佐赫尔(MetaMind的创始人、 CTO)还展示了最新的问答系统,该系统与脸书是基于同一套数据组的。“和网络搜索很像。”佐赫尔说,“不同之处在于,你得到的是真实成型的回答,而不是 一堆链接。”

根据论文内容,你若是在系统中输入如下文字:

简走进了走廊。

玛丽走进了浴室。

桑德拉走进了花园。

丹尼尔走回了花园。

桑德拉把牛奶拿到了那里。

然后再输入问题:“牛奶在哪里?”回答显示是:“花园。”

回答所有的问题

与此同时,该系统还能判定情感——说得明白些,就是字里行间透露出的情感。它可以识 别一段演讲中的一部分,也可以判定一个特定代词的所指。它甚至可以实现两种文字之间的互译。基本上说,系统是把这些任务作为需要回答的问题来处理的。这段 文字表达的是积极还是消极的意味?这段文字是以第几人称叙述的?文中的“他们的”、“那个”、“他”分别指代着谁?这整段文字用法语表述是怎样的?”

MetaMind的界面

“对于该领域的深刻见解——听起来仿佛有点琐碎——就是,自然语言处理涉及的每项任务说到底都是问与答的模式。”佐赫尔说。他当年在斯坦福大学的博士论文就是关注机器智能、电脑成像、自然语言处理等问题的。

该系统能做到这些,靠的都是佐赫尔所说的“间歇性记忆”。如果把类神经网络比作大脑 皮层——即信息处理的关键部位的话,那“间歇性记忆”就相当于海马体,这是为人类提供短期记忆的部位。还是举上文所述的花园与牛奶的例子,系统必须“记 住”丹尼尔在花园中这一事实,然后再判定牛奶到底在哪儿。“若是没有间歇性记忆,就无法完成传递性推导。”佐赫尔解释说。

他进一步解释说,通过运用同样的设置,就可以分析文字所蕴含的情感,或是将文字翻译 成另一种语言。“一种模型——一套动态记忆网络,就可以解决许多不同的问题。”他说。本吉奥指出,MetaMind为每一类任务培植出一套有些许差别的解 决模式。但最终的目的,还是将所有这些任务整合化。这就需要朝着新的前沿,再迈出一步。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

人工智能的下一个前沿:能够识别语言的机器

机器到底能不能够参透复杂的人类语言?这是人工智能的研究者们一直试图解决的问题。美国著名科技类网站Wire.com刊文《人工智能的下一个前沿:能够识别语言的机器》介绍了该领域的创业公司MetaMind的最新研究成果。

机器到底能不能够参透复杂的人类语言?这是人工智能的研究者们一直试图解决的问题。现在看来,对自然语言进行简单读取、判别、归纳、模仿似乎已经不是不可能完成的任务,但真的要深入领会文章的意味和情感,判别不同语境下词的含义,甚至进行人类都觉得犯难的不同语言互译,无疑将成为人工智能的下一个前沿。

日前,美国著名科技类网站Wire.com刊文《人工智能的下一个前沿:能够识别语言的机器》(AI's Next Frontier: Machines that Understand Language),介绍了该领域的创业公司MetaMind的最新研究成果。本文由凯盛汇编译。

感谢类神经网络——也就是通过机器网络在模拟人脑中的神经网络——脸书现在已经可以 对你的脸进行智能识别了,谷歌现在可以识别你喊出的声音并录入安卓手机了,微软现在可以把你的演讲即时翻译成另一种语言了……现在,摆在面前的任务就是教 会这些在线服务如何理解自然语言;不仅仅是简单捕捉每个词的意思,而是要将整句话甚至整篇文章融会贯通。

脸书的人工智能研究者们最近展示了一款新开发的系统,可以阅读《指环王》(The Lord of the Rings) 的片段摘要,并回答与此书相关的一些问题。谷歌也采用了一种叫做Word2Vec的类神经网络算法,让机器更好地理解网络文章中词与词之间的内在关系—— 他们也希望通过此举来推广谷歌即时(Google Now),那是一款能让用户随时获取所需信息,甚至不用主动搜索的神奇产品。脸书人工智能方面的负责人伊安·勒昆表示,自然语言处理将是人工智能的“下一 个前沿”。

一家专注于人工智能领域的创业公司MetaMind同样在为上述目标而努力着。 MetaMind最近公布了一项基于类神经网络系统研究的细节,可以利用人造的短期记忆,回答与自然语言处理相关的多类问题。据MetaMind介绍,此系统几乎可以对一切问题进行回答,无论是基于文本的详细询问,还是诸如“文章所表达的感情是什么”、“这段文字用法语怎样表述”这样需要提炼、转化的问 题。这项研究的成果已经与本周在Arxiv.org(一个收集物理学、数学、计算机科学与生物学论文预印本的网站)正式发布,与此前脸书和谷歌的研究交相 呼应,而MetaMind又向前迈了一步。

“这是一个讨论得很热的话题,而这篇论文的作者不仅追上了该领域的最先进科技,甚至 超越了十万八千里。”加拿大蒙特利尔大学的计算机科学教授约书亚·本吉奥如是评价。本吉奥教授是人工治疗领域的专家,也参与了MetaMind这篇最新论 文的审阅。“他们所做研究的整个建构非常有趣,雄心勃勃地瞄准了一个潜力巨大的领域。他们的研究试图依序对大量的文本进行语法分析——没准那天会把维基百 科上所有的词条都玩遍吧——然后,通过详实的语义学展示,对上述问题逐一进行应答。

MetaMind的界面

一件人人皆可用的工具

现代类神经网络算法通常被称作“深度学习”,无比强大,可以解决许多不同类型的任 务。其他领域的研究者也可以利用同样的算法,来提高汽车性能,或是制造会开瓶盖的机器人。谷歌工程师杰夫·迪恩介绍,该公司的类神经元网络系统为十多项在 线服务功能提供驱动,譬如谷歌+(Google+)、谷歌即时(Google Now)、谷歌街景(Street View)等。在最新发表的这篇论文中,MetaMind证明了这一算法被应用到一系列宽领域的自然语言处理任务时,效率能有多高。“这一突破毫无疑问展 现了机器智能的美感、趣味性和重要性。”本吉奥评价说,“也展示了一种多领域共通的解决方案。”

MetaMind也为其他企业构建深度学习系统,他们此次还展示了一款名为“动态记忆网络”的 产品。这与脸书之前的一款产品很相似,让机器能够回答诸如“一个词在特定的语境下是什么意思”这样的问题。理查德·佐赫尔(MetaMind的创始人、 CTO)还展示了最新的问答系统,该系统与脸书是基于同一套数据组的。“和网络搜索很像。”佐赫尔说,“不同之处在于,你得到的是真实成型的回答,而不是 一堆链接。”

根据论文内容,你若是在系统中输入如下文字:

简走进了走廊。

玛丽走进了浴室。

桑德拉走进了花园。

丹尼尔走回了花园。

桑德拉把牛奶拿到了那里。

然后再输入问题:“牛奶在哪里?”回答显示是:“花园。”

回答所有的问题

与此同时,该系统还能判定情感——说得明白些,就是字里行间透露出的情感。它可以识 别一段演讲中的一部分,也可以判定一个特定代词的所指。它甚至可以实现两种文字之间的互译。基本上说,系统是把这些任务作为需要回答的问题来处理的。这段 文字表达的是积极还是消极的意味?这段文字是以第几人称叙述的?文中的“他们的”、“那个”、“他”分别指代着谁?这整段文字用法语表述是怎样的?”

MetaMind的界面

“对于该领域的深刻见解——听起来仿佛有点琐碎——就是,自然语言处理涉及的每项任务说到底都是问与答的模式。”佐赫尔说。他当年在斯坦福大学的博士论文就是关注机器智能、电脑成像、自然语言处理等问题的。

该系统能做到这些,靠的都是佐赫尔所说的“间歇性记忆”。如果把类神经网络比作大脑 皮层——即信息处理的关键部位的话,那“间歇性记忆”就相当于海马体,这是为人类提供短期记忆的部位。还是举上文所述的花园与牛奶的例子,系统必须“记 住”丹尼尔在花园中这一事实,然后再判定牛奶到底在哪儿。“若是没有间歇性记忆,就无法完成传递性推导。”佐赫尔解释说。

他进一步解释说,通过运用同样的设置,就可以分析文字所蕴含的情感,或是将文字翻译 成另一种语言。“一种模型——一套动态记忆网络,就可以解决许多不同的问题。”他说。本吉奥指出,MetaMind为每一类任务培植出一套有些许差别的解 决模式。但最终的目的,还是将所有这些任务整合化。这就需要朝着新的前沿,再迈出一步。

本文为转载内容,授权事宜请联系原著作权人。