文|AI报道
从中小学课堂到公司会议室,PPT的身影可谓无处不在。而蔚然兴起的AI技术,也正在渗透到PPT以及和日常生活息息相关的领域。
据外媒报道,微软6月19日宣布推出用于PowerPoint的Presenter Coach,这是一种新的AI工具,可以在用户练习PPT演讲时提供反馈,包括演讲节奏、用词以及注意事项等。
Presenter Coach让演讲者受益良多
这项新功能被称为“演讲者教练”(Presenter Coach),会在演示文稿幻灯片的排练模式中出现,用于提升用户们使用演示文稿的体验和技巧。借助于人工智能技术,这位“教练”将从电脑麦克风中收听音频,对用户演讲技巧提供及时反馈,弹出关于演讲节奏和填充词的提示,这样一来,用户就会尽量避免演讲过程中磕磕巴巴或者中间卡壳的情况。该功能还能帮助演讲者更好地使用他们的语言。
Presenter Coach还会针对用户的发言习惯,提示避免言语粗俗,对于无精打采的照本宣科,它还会突出提示一些加重语气的短语,或者口语化的语句。PPT演示完毕后,AI将生成一份报告反馈完成的情况。
微软方面表示,增加这一全新功能是缘于“收到了来自教育工作者、学生和客户的反馈,他们认为人们想要一种简单的方法来练习他们的演讲,以提高他们的公共演讲能力。”尤其是很多人在做PPT时,只是单纯的做,做完就没事了。也许人们忘记了,它只是演讲的辅助工具,做PPT的最终目的还是演讲。
这一新功能有望在今年夏天开始在Web端PowerPoint中添加,并于晚些时候在移动版和PC版上更新。除了AI演讲教练,微软还在改进PPT的设计工具,比如品牌模板和推荐样式,让演示文稿看起来更加时髦、新颖。
微软人工智能布局和产品落地
人工智能风口正盛 ,巨头们纷纷布局各有倚重。去年在北京召开的微软2018人工智能大会,将微软人工智能技术、布局和产品落地全方位展示。微软全球执行副总裁、人工智能及微软研究事业部负责人沈向洋博士介绍道,在人工智能的新时代,微软有了全新的世界观:智能云和智能边缘。
“智能云”指微软Azure,是微软专为人工智能打造的云平台。前几年,当微软CEO萨提亚 纳德拉第一次提出“构建微软智能云”的远见时,很多人在问,微软智能云Azure究竟智能在什么地方?如今,人工智能成了人们街谈巷议的“全民热词”,而微软在构建微软智能云上的战略规划也显得越发清晰起来。
目前,微软智能云汇聚了微软在人工智能领域的全部投入与技术积累,是开发、部署、运行人工智能的云平台,同时也是将智能云与智能边缘融会贯通的关键环节。Azure包含四个方面内容:公有云Azure、混合云Azure Stack、物联网Azure IoT Edge和Azure Sphere,联合打造出完整的计算环境,支持全新应用场景。
微软还将Azure与AI结合,打造人工智能云平台的四个方向:认知服务、对话式人工智能、开放平台与工具、实时人工智能基础设施。
认知服务
在Build 2016微软全球开发者大会上,微软首次公布了运行于Azure的认知服务,以API的形式为开发者提供易用的人工智能技术能力。而后微软在全球推出包括语音、视觉、语言、机器翻译等功能的24项服务,超过100万开发者使用。
CaptionBot能像人一样理解和描述一张图片,例如,你上传一张照片,CaptionBot能够给出一段文字描述:比尔盖茨正拿着一副网球拍,他看起来很高兴。OCR((Optical Character Recognition光学字符识别),将为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,可以识别图像内的文字,例如识别车牌号、海报甚至是手写的笔记。
CaptionBot和OCR都是Azure预制的人工智能服务,微软也针对不断变化的场景推出了定制视觉服务,可以让不具备深度学习、机器视觉背景的开发者定制图像标签模型、物件认知模型。
在计算机视觉方面,2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率就已经达到96%,胜过人类;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。
对话式人工智能
亚马逊Echo智能音箱带动了对话式人工智能的产品落地,这项技术正逐渐进入音箱、电视、车载等多个设备中,成为新一代智能应用的核心。对话式人工智能也在不断升级其对话能力,追求越来越自然、流畅的人机交流。微软有小娜和小冰两个对话式人工智能助手,小娜更倾向于发展智商,而小冰则是面向情商维度发展的人工智能系统。
微软小冰诞生已有多年,一直以逗贫、插科打诨的聊天风格著称。去年,微软将最新的全双工语音交互技术(Full Duplex)应用在了微软小冰上,同时提升了小冰的智商和情商。据了解,2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流。
在内容创作方面,微软展示了小冰写的诗、原创歌曲、有声读物。在有声读物领域,微软已拥有接近4万集有声童话内容。这些有声读物全部由人工智能技术生成,在与人类主播质量相当的前提下,数量足以陪伴一个孩子从2岁到9岁的全部时光。6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。
开放平台+基础设施
要促进人工智能的普及,技术开放是必由之路。因此,微软推出了开放人工智能平台(Open AI)战略及开发工具。可以支持TensorFlow、CNTK等业界主流的深度学习平台,同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。目前,已经有十几家家公司支持ONNX,并且还有更多公司正在加入进来。现在已经有PyTorch等六种顶级框架支持ONNX,其它框架则可以通过转换器获得支持。
在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。这一框架最初由微软研究院开发,并且在Windows、Bing、Azure等微软产品上都得到了成功的应用。通过将这一技术框架开源,微软希望能够为每一位开发者赋予驾驭机器学习的能力。
AI赋能Office 365
随着AI的不断更迭,微软并没有忘记其桌面时代的核心业务Windows和Office。AI功能已经成功和Office 365、Dynamics 365、Linkedin等产品功能融为一体。比如,在发邮件时,微软提供了多种语言的一键翻译。在用Excel时,Excel能更好地猜测用户的行为,提前生成用户可能需要的内容。
免费AI课程上线
为了推动全民AI,让每个人都有机会学习人工智能,微软推出在线人工智能学院,目标是一年内培养出10 万余名人工智能人才,将免费提供包括AI基础、核心技术和高阶应用在内的总共250课时的12门人工智能学分课程,覆盖10项应用技能。完成课程学习的用户,还可申请微软专业学位课程(MPP,Microsoft Professional Program)作为职业技能认证。
在未来二十年中,人工智能会是一种必然,并将接替互联网开启下一轮科技革命。全球最著名的高科技公司包括微软、苹果、谷歌、IBM等,已经将 AI视为自己获得长足发展的重要方向,针对这一领域的资本投入、技术投入、人才争夺正在加剧,其布局和落子也在不断加速。
评论