“声音里的知识和AI”大会:知识生产如何拥抱人工智能

8月21日至8月25日,北京国际图书博览会(BIBF)期间,“中读”举办了以“声音里的知识和AI”为主题的知识大会。在媒体纷纷谋求转型的大环境下,传统媒体如何拥抱人工智能,为新的内容生产方式赋能?知识生产未来的发展方向是什么?如何更好地运用声音来传播知识?

针对这些问题,《三联生活周刊》旗下新媒体平台——“中读”在本次知识大会上同海内外的传统出版从业者分享了自己的新尝试和新经验。

随着AI(人工智能)的快速发展,新的内容生产方式出现,旧的方式在革新,增加个性化是媒体能够走向未来的关键因素。此次,中读携手全球最先进的科技公司——微软,将个性化语音定制技术运用到有声内容生产和知识传播中来。

以往,传统的有声内容制作主要依靠名人、主讲人或者声优的录音,需要发音人录制成千上万句话。所以音频的录制往往需要耗时几个月,成本巨大。声音录制也会受限于人员、时间、环境等因素,无法实现产能最大化,求知者接收优质内容的时间也会随之延迟。

个性化语音定制系统只需更少的训练数据量就可以训练出一个逼真和自然的人工智能声音,大幅度提高了大量存量内容的转化效率,节约成本,有利于优质内容的高效生产、再生产以及声音知识的优化和传播。将在中读开设音频节目的《三联生活周刊》资深主笔袁越,谈到了自己录制时的使用感受:

“我花15年写了80多万字的《生命八卦》专栏文章。如果在录音棚里把它们一遍又一遍朗读出来,那是要死人的。如果用普通音频软件来读就很容易读成催眠曲。找主播来读又怕处理不当脱离文章原意。这个系统只需很少的训练量就可以模仿我的声音,代替我朗读那些文章,不但准确地表达了原文的意思,而且满足了听众想听到原作者声音的需求。”

AI技术使“生产出形式多样的衍生内容产品”成为可能。“让课程主讲人开口说他不会说的语言,从英语、法语甚至是当地方言,实现多语种及多种说话风格的输出”是中读进行的另一项大胆尝试。以知识为载体的声音、语言、使用场景,将在AI技术的支持下,实现更紧密的交互和融合。

在这种大趋势下,以技术带动用户体验的提升同样应该包含在内容生产环节之中。为了让读者获得更好的收听体验,中读将在未来版本中引进具有一键朗读功能的微软最新深度神经网络智能语音——微软晓晓。不同于以往机器朗读的生硬和刻板,微软晓晓的语气、语音、语调可以实现无限接近真人的效果,满足用户多场景、高质量的语音内容需求。

除此之外,中读作为致力于提供优质知识内容的平台,正逐渐将视野转向全球、聚焦未来。

 

 

未经正式授权严禁转载本文,侵权必究。

微软

5.1k
  • 博弈降息美股高位震荡,纳斯达克100ETF(159659)盘中再创上市新高,年内强势“吸金”3.24亿元
  • 微软再次聚合Windows和Surface团队,必应负责人Parakhin岗位调整

评论

暂无评论哦,快来评价一下吧!