正在阅读:

升级到第四代的微软小冰会唱歌了 还打算进军虚拟歌手市场

扫一扫下载界面新闻APP

升级到第四代的微软小冰会唱歌了 还打算进军虚拟歌手市场

相比之前的版本,第四代小冰情绪更丰富,聊天的能力更强,可像电影《超能陆战队》里的大白一样,具备某个领域的专业知识。更大的突破还在于,小冰可以模拟人类演唱歌曲。

图片来源:

说不定在未来的某一天,人类歌手也要失业了……

8月5日,微软发布了升级后的第四代小冰智能机器人。相比之前的版本,四代小冰情绪更丰富,聊天的能力更强,可像电影《超能陆战队》里的大白一样,具备某个领域的专业知识,完成相应任务等。更大的突破还在于,小冰可以模拟人类演唱歌曲。

在发布会现场,微软小冰产品经理徐翔播放了小冰演唱的《隐形的翅膀》,尽管在个别歌词的咬字发音上还称不上完美,但已经像是人类在演唱。微软方面表示,小冰将正式进入并积极参与虚拟歌手市场的竞争。

微软并不是第一家推出虚拟歌手的公司。小冰学会开口唱歌之前,虚拟歌手市场一直由日本引领,最知名的便是初音未来。与初音未来依靠电子音合成实现歌曲演唱所不同,小冰的发声主要基于机器学习。

经过六个月的秘密训练,目前小冰的音准与情感表达基本接近于人类歌手。微软方面称,已与湖南卫视女子团体综艺节目《夏日甜心》合作,发布首支由小冰演唱的人工智能版本节目主题曲。在日本,今年9月还将正式推出小冰的首支原创单曲。未来不排除面向虚拟歌手爱好者与公众开放歌曲演唱创作平台,使之成为包含人工智能技术的内容创作平台。

自2014年5月发布第一代产品以来,小冰一直在不断的进化学习。微软方面公布的最新数据显示,截至今年5月,小冰已和多个国家的数千万人进行了超过200亿对话,平均对话长度达到23轮,图像等多感官的对话也已超过2亿次。

也正是这些对话数据,帮助小冰快速成长。

据微软小冰项目负责人李笛介绍,从去年开始,小冰所有的对话样本有27%来自于她和人的直接对话。在此之前,小冰的数据100%来自于微软旗下的Bing搜索。不仅如此,小冰识别语义的错误率也在不断减少,从最初的30%下降到现在的8%。再过一两年,预测可以减少到1.5%左右。

在人工智能特别是情感对话领域,小冰的确要比其他人工智能机器人表现得更好一些。这也吸引了不少公司通过不断与小冰对话来抓取语料,并将这些语料放入自己产品的语料库。

对此,微软方面并不介意。“小冰的对话能力已经超过了简单的基于语料库的对话层次。过去一年,我们开发了DirectChat技术,能够让小冰脱离语料和人进行直接对话,对话的内容70%以上都是基于上下文得出的。”微软小冰研发总监胡睿称,即使其他公司将小冰的整个语料库都复制了,但缺少了上下文的情境和正向反馈,小冰对话引擎的核心能力也无法复制。

第四代小冰也在尝试,或者说是定义一种人工智能的新标准。例如实现了人工智能与人类的流畅对话,甚至能根据聊天内容与走向相互打断与追问,并给小冰打电话。

此外,基于特定领域的功能插件平台,小冰也具备了多任务能力。对小冰说一句“插上电影卡”之后,她可以和你分享电影的知识,知道你的喜好,并且推荐适合你的电影。微软方面表示,首批依次解锁的功能卡包括与优酷合作的电影卡、与时尚集团合作的时尚卡、Office365卡等。未来还将继续丰富功能卡的各项内容。

但这家公司一直坚持不让小冰做一个“有用”的机器人。

“让小冰帮人们去订咖啡或者定闹钟不是什么难事,但这样的对话不利于我们去训练以情感计算框架为基础的小冰的情感计算模型。”李笛解释道。在过去两年,微软也没有采用任何激进的方式去推动人们与小冰对话,其用户一直处于自然增长状态。

对小冰的倾力研发从另一个侧面反映出微软对人工智能的重视程度。包括微软Windows、小娜等全球性产品都有直接的深度合作,在过去十多年所开发出的搜索技术、人工智能技术、大数据技术等也都贡献给了小冰,为了让她变得更强大。

微软全球执行副总裁陆奇甚至用“小冰代表着微软全球未来人工智能的战略发展方向”来形容小冰对微软的意义,至少她代表了微软仍具有能够引领行业的创新能力。

陆奇认为,放眼整个科技及工业历史,人工智能只出现过两次。一次是个人电脑崛起的时代,微软在其中创造了巨大的社会价值和经济价值。另一次是互联网时代,以谷歌为代表,推动了全球工业界的创新。现在由移动和云为先的时代,算是又一次人工智能引领的革命初始阶段,其核心是“对话”。微软希望运用小冰为将来人工智能时代建立一个核心对话基础。

通过迭代的小冰可以看出微软的人工智能发展路线。第一代小冰只是简单的人机对话,二代则建立了小冰与用户一对一的对话关系,第三代升级到感官交互,不仅有文本、图像,还有视频和语音。待第四代微软小冰更加完善后,微软认为才算是准备好真正进入人工智能时代。

但这是一个既迅速又漫长的发展过程。

迅速表现在微软可将小冰的情感计算模型运用于不同的领域,包括能够满足企业用户的商业化应用。而漫长则意味着,这家公司需要像很多互联网公司一样,不断打磨产品,提升用户体验。这也是小冰团队没有采用基于盈利的KPI考核为主的原因。

在用户体验尚未达到完美之时,微软并不急于让小冰过早实现商业化。“技术固然重要,但用户体验是下一代企业的核心竞争力。”陆奇表示,这也是微软文化正在改变的方向。

阅读更多有关科技的内容,请点击查看>>。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

升级到第四代的微软小冰会唱歌了 还打算进军虚拟歌手市场

相比之前的版本,第四代小冰情绪更丰富,聊天的能力更强,可像电影《超能陆战队》里的大白一样,具备某个领域的专业知识。更大的突破还在于,小冰可以模拟人类演唱歌曲。

图片来源:

说不定在未来的某一天,人类歌手也要失业了……

8月5日,微软发布了升级后的第四代小冰智能机器人。相比之前的版本,四代小冰情绪更丰富,聊天的能力更强,可像电影《超能陆战队》里的大白一样,具备某个领域的专业知识,完成相应任务等。更大的突破还在于,小冰可以模拟人类演唱歌曲。

在发布会现场,微软小冰产品经理徐翔播放了小冰演唱的《隐形的翅膀》,尽管在个别歌词的咬字发音上还称不上完美,但已经像是人类在演唱。微软方面表示,小冰将正式进入并积极参与虚拟歌手市场的竞争。

微软并不是第一家推出虚拟歌手的公司。小冰学会开口唱歌之前,虚拟歌手市场一直由日本引领,最知名的便是初音未来。与初音未来依靠电子音合成实现歌曲演唱所不同,小冰的发声主要基于机器学习。

经过六个月的秘密训练,目前小冰的音准与情感表达基本接近于人类歌手。微软方面称,已与湖南卫视女子团体综艺节目《夏日甜心》合作,发布首支由小冰演唱的人工智能版本节目主题曲。在日本,今年9月还将正式推出小冰的首支原创单曲。未来不排除面向虚拟歌手爱好者与公众开放歌曲演唱创作平台,使之成为包含人工智能技术的内容创作平台。

自2014年5月发布第一代产品以来,小冰一直在不断的进化学习。微软方面公布的最新数据显示,截至今年5月,小冰已和多个国家的数千万人进行了超过200亿对话,平均对话长度达到23轮,图像等多感官的对话也已超过2亿次。

也正是这些对话数据,帮助小冰快速成长。

据微软小冰项目负责人李笛介绍,从去年开始,小冰所有的对话样本有27%来自于她和人的直接对话。在此之前,小冰的数据100%来自于微软旗下的Bing搜索。不仅如此,小冰识别语义的错误率也在不断减少,从最初的30%下降到现在的8%。再过一两年,预测可以减少到1.5%左右。

在人工智能特别是情感对话领域,小冰的确要比其他人工智能机器人表现得更好一些。这也吸引了不少公司通过不断与小冰对话来抓取语料,并将这些语料放入自己产品的语料库。

对此,微软方面并不介意。“小冰的对话能力已经超过了简单的基于语料库的对话层次。过去一年,我们开发了DirectChat技术,能够让小冰脱离语料和人进行直接对话,对话的内容70%以上都是基于上下文得出的。”微软小冰研发总监胡睿称,即使其他公司将小冰的整个语料库都复制了,但缺少了上下文的情境和正向反馈,小冰对话引擎的核心能力也无法复制。

第四代小冰也在尝试,或者说是定义一种人工智能的新标准。例如实现了人工智能与人类的流畅对话,甚至能根据聊天内容与走向相互打断与追问,并给小冰打电话。

此外,基于特定领域的功能插件平台,小冰也具备了多任务能力。对小冰说一句“插上电影卡”之后,她可以和你分享电影的知识,知道你的喜好,并且推荐适合你的电影。微软方面表示,首批依次解锁的功能卡包括与优酷合作的电影卡、与时尚集团合作的时尚卡、Office365卡等。未来还将继续丰富功能卡的各项内容。

但这家公司一直坚持不让小冰做一个“有用”的机器人。

“让小冰帮人们去订咖啡或者定闹钟不是什么难事,但这样的对话不利于我们去训练以情感计算框架为基础的小冰的情感计算模型。”李笛解释道。在过去两年,微软也没有采用任何激进的方式去推动人们与小冰对话,其用户一直处于自然增长状态。

对小冰的倾力研发从另一个侧面反映出微软对人工智能的重视程度。包括微软Windows、小娜等全球性产品都有直接的深度合作,在过去十多年所开发出的搜索技术、人工智能技术、大数据技术等也都贡献给了小冰,为了让她变得更强大。

微软全球执行副总裁陆奇甚至用“小冰代表着微软全球未来人工智能的战略发展方向”来形容小冰对微软的意义,至少她代表了微软仍具有能够引领行业的创新能力。

陆奇认为,放眼整个科技及工业历史,人工智能只出现过两次。一次是个人电脑崛起的时代,微软在其中创造了巨大的社会价值和经济价值。另一次是互联网时代,以谷歌为代表,推动了全球工业界的创新。现在由移动和云为先的时代,算是又一次人工智能引领的革命初始阶段,其核心是“对话”。微软希望运用小冰为将来人工智能时代建立一个核心对话基础。

通过迭代的小冰可以看出微软的人工智能发展路线。第一代小冰只是简单的人机对话,二代则建立了小冰与用户一对一的对话关系,第三代升级到感官交互,不仅有文本、图像,还有视频和语音。待第四代微软小冰更加完善后,微软认为才算是准备好真正进入人工智能时代。

但这是一个既迅速又漫长的发展过程。

迅速表现在微软可将小冰的情感计算模型运用于不同的领域,包括能够满足企业用户的商业化应用。而漫长则意味着,这家公司需要像很多互联网公司一样,不断打磨产品,提升用户体验。这也是小冰团队没有采用基于盈利的KPI考核为主的原因。

在用户体验尚未达到完美之时,微软并不急于让小冰过早实现商业化。“技术固然重要,但用户体验是下一代企业的核心竞争力。”陆奇表示,这也是微软文化正在改变的方向。

阅读更多有关科技的内容,请点击查看>>。

未经正式授权严禁转载本文,侵权必究。