正在阅读:

从亚马逊到腾讯 互联网巨头为何都要做智能音箱?

扫一扫下载界面新闻APP

从亚马逊到腾讯 互联网巨头为何都要做智能音箱?

大战前夜,未见火光,但硝烟渐起。

文/周小丹,房宫一柳

2017 年硬件领域最大的风暴,由电商巨头亚马逊引起。

2014 年 11 月,刚经历过 Fire Phone 销售惨败的亚马逊选择低调发布智能音箱 Echo,贝索斯甚至没有单独为它开一场发布会。那时的他应该也不会想到,两年多后这个「试验品」不仅让亚马逊的股价创下历史新高,也将几乎所有科技巨头卷入到一场由亚马逊引领的商业竞速。

Amazon Echo 是一款智能音箱,也是私人声控语音助手。

 

根据 CIRP、RBC Capital Market 数据,包括 Echo、EchoDot 和 Tap 在内的亚马逊智能音箱,目前已累计销售接近千万台,销售额达到 8 至 10 亿美元。亚马逊的 Echo 占据了这个市场超过 70% 的市场份额。

这当然只是一场更大战争的序章,微软、三星、谷歌、苹果等科技巨头正在加速进入战场。

在 5 月 9 日亚马逊发布带触屏的 Echo Show 仅仅一天之后,微软在 Build 大会上发布了与哈曼卡顿联合打造的 Invoke 智能音箱,内置了微软研发多年的人工智能助手 Cortana。

5 月 17 日的 Google I/O 上,最引人注目的就是 Google Home 和 Google Assistant 的重大更新,新版本的 Google Home 通过深度学习等技术升级后,现在只需要两只麦克风(亚马逊 Echo 需要七个麦克风阵列),就能实现准确定位周围说话的人;而 Google Assistant 宣布覆盖设备超过一亿台。

在 6 月即将到来的苹果 WWDC 上,苹果将发布首款搭载 Siri 的智能音箱这一消息也早已被外媒提前泄露. 据其台湾供应链的消息,产品已经进入到测试阶段。

硅谷科技巨头围绕智能音箱的诸神之战已经打响,战火必然也将影响到大洋彼岸。

野心的繁荣

90 年代进入音响行业时,曾德钧大概不会想到,三十年后,这个行业的主流玩家就要被一群互联网公司取代。

这位有「中国胆机教父」之称的 50 后创业者在音响行业浸淫多年,甘苦尝尽。最近几年来他越来越意识到,智能化将会带来新一轮行业洗牌。但现在,这个趋势正在加速到来:仅在 2016 年,就有包括 BAT、360 等多家互联网公司的相关负责人陆续来到曾德钧位于深圳的办公室,与他讨论相关产品问题,甚至有一家巨头向曾德钧创办的云动创想直接提出了投资意愿——这样的「盛况」此前从未出现。

「大家已经对这件事情有了很高的预期。」这是曾德钧过去一年来最明显的感受。

「如果说哪家公司不眼红,那绝对是假话。」一位国内语音识别技术公司 CEO 直言。据顶楼 TopView 获悉,国内包括 BAT、小米、猎豹、联想在内的多家公司都在这个领域积极布局。一位智能家居行业从业者对顶楼 TopView 透露:「现在已经没有哪家巨头不在做智能音箱了,估计就在 2017 年,国内起码会有 7、8 个中国版 Echo 面世。」

自 2014 年底到今天,国内科技公司受 Echo 启发而加入到智能音箱战局的过程,大致分为三个阶段。

2014 年 11 月,Echo 正式面市。作为一款概念上并不新鲜的智能音箱,Echo 带来的最亮眼的变革在于,用户无需按键,只要喊出 Alexa 就可以把它激活并发号指令,而实现这一远场语音交互体验的基础是 7 个装置在产品顶端的环形麦克风阵列。

Echo 独创的 6+1 环形麦克风阵列,大大提升远场语音识别效率。

 

最先看到 Echo 潜力的是国内语音技术方案提供商:「其实拿到 Echo 内测版的时候,我们意识到这可能是一个很好的方向。」语音交互技术和解决方案公司思必驰市场总监龙梦竹说。

到了 2015 年 10 月,仅在 Ehco 正式放开销售几个月后,思必驰就迅速推出了跟 Echo 同源的麦克风阵列。在此之前,国内软硬一体化的麦克风阵列市场几乎属于空白。

在同一时间感受到变革「气息」的,还有此前专注于机器人方向的人工智能创业公司 Rokid。2014 年公司成立之初,Rokid 的战略重点是当时最受追捧的机器人。2015 年,Rokid 第一款家用机器人发布。也就在那时,Echo 在美国市场受到的追捧直接影响了 Rokid 的战略方向,「那时候我们开始意识到,相比于机器人,智能音箱或许会成为更容易打开市场的方式。「Rokid 产品总监向文杰说。2015 年底,Rokid 立刻决定转变战略方向,在第二代产品中将语音和远场识别技术作为了核心。

Rokid 公司智能音箱新产品 Pebble (月石)斩获 2017CES 两项大奖。

 

如果说,2015 年 Echo 的影响力还只是被少数创业公司所注意,2016 年 Echo 在市场上的高歌猛进则让更多国内互联网公司加速在智能音箱市场的布局。

根据 CIRP 的报告,截至 2016 年年底,Echo 系列产品在美国的销售量已经达到 700 万。更重要的是,亚马逊在这一年已经逐步将 Echo 背后的语音助手 Alexa 做成了开放平台,目前平台拥有上万种技能。同样是 2016 年,Google 正式推出了智能音箱 Google Home,这无疑成为重要的产业风向标。

「两年前公司刚成立的时候,我们就一直尝试与 BAT 合作打造智能硬件,那时候他们对智能硬件没有明显的兴趣。」作为智能硬件供应链上的服务提供者,硬蛋科技负责人发现,就在 2016 年 10 月,Google 的智能音箱 Google Home 正式推向市场的同时,此前拒绝了硬蛋的大公司竟然纷纷主动找上门来,询问合作可能。另一位语音技术供应商则表示,同样是在 2016 年 10 月份,小米开始和他们接触谈智能音箱合作。根据这位负责人的透露,雷军对此事表现出了强烈的兴趣。

2016 年 10 月 5 日,Google 正式推出能通过语音助理「声控」的 Google Home。

 

Echo 及其背后的语音助手 Alexa 让亚马逊一飞冲天,智能音箱 AI 时代交互入口的观点被更多人所意识到,没有人愿意在智能手机之后的下一个平台级机会面前被抛下。

进入到 2017 年,无论是大公司还是创业公司,几乎都向着成为「中国版 Echo」摆好了进击的架势:2017 年 2 月,百度宣布全资收购创业公司渡鸦科技;3 月,在离职前几天,吴恩达还曾亲自率领一支技术团队来到深圳考察硬件厂商;4 月,腾讯宣布推出智能语音助手「腾讯叮当」,直接对标亚马逊的 Alexa;随后出门问问在 4 月宣布推出虚拟个人助理,以及即将在下半年亮相的问问智能音箱 Tichome;而在 5 月,来自联想和创业公司 Rokid 公司的智能音箱产品正式面市,从外观或功能上,二者都以本土版 Echo 自居……

据某家技术供应商透露,网易、搜狗、360 等手里都有智能音箱相关的立项。就连一直被认为不具备硬件产品基因的腾讯,内部产品也早已完成了开发。还有早已浮出水面的微信硬件「微信相框」,也「正对标亚马逊的 Echo 调整产品定位和功能」,微信相框负责人对顶楼 Top View 说。

大战前夜,未见火光,但硝烟渐起。

2015:京东教训

智能音箱的中国故事,其实早在两年之前就有过第一季的上演。

对于一直将亚马逊视作对标对象的京东来说,亚马逊通过 Echo 和背后的 Alexa 实现的成绩带来显然是一个不可忽略的信号。

早在 Echo 面市后不久的 2015 年,京东就火速与科大讯飞成立了一家合资公司灵隆科技,并在 2015 年 6 月发布了一款名为叮咚智能音箱的产品。这款音箱搭载了科大讯飞的智能语音系统,内置 8 个收音麦克风,唤醒词则为「叮咚叮咚」。在内容方面则集成了百度音乐、喜马拉雅 FM 等等服务。根据京东官方给出的售价,这款产品最低配青春版售价人民币 199 元,最高配新东方教育版售价 998 元,平均价格为 618 元。

中档叮咚智能音箱,定价 798 元。据技术商透露,199 元低配版每卖出一台,「就要亏五十元」。

 

据一位接近灵隆科技的语音解决方案服务商公司负责人透露,在京东内部,「刘强东对此事非常重视」。当年京东为灵隆科技注资 4500 万人民币,占股 45%,另外 55% 股份则由科大讯飞持有。而新公司由京东智能产品中心总监魏强直接负责。

很明显,叮咚音箱并没有带来如 Echo 一样的市场效应。

在产品刚刚上线的一段时间内,京东也曾主动让出网站主页 Banner 页面为产品做 24 小时的展示和宣传——这和亚马逊的策略如出一辙。根据公开数据显示,今年叮咚音箱及其合作产品累计销量已经突破 100 万台。但不只一位智能音箱从业者对顶楼 Top view 坦言,这个数字存在水份。「有可能几十万台都不到。」

「京东当时投入的决心很大,但现在双方都有点心灰意冷。」上述负责人把叮咚的失利总结为二者合作方式的不当:从叮咚音箱的技术、研发到产品设计,再到灵隆科技的架构上,科大讯飞一度都占据着主导地位。「叮咚音箱想学亚马逊,又没学到精髓。这件事情上,绝对不能让技术为主的公司负责产品;另一方面京东又很快的通过很激进的宣传、推广把市场的预期拉的太高。这是非常危险的」。

那么,京东希望学习又没学到的亚马逊的精髓又是什么?

首先,亚马逊 Echo 在发布的初期足够的谨慎,并不是高举高打,概念先行。

从亚马逊神秘的 Lab126 实验室诞生时,Echo 脱胎于此前失败的项目 C(Lab126 实验室按照产品重要级别从 A 到 Z 为项目编号,Kindle 为项目 A,曾被寄予厚望的 Fire Phone 为项目 B)。或许是因为 Fire Phone 的折戟,包括贝索斯在内的亚马逊高管对这款带有远场语音识别功能的音箱只带有相当谨慎的预期:他们仅仅希望 Echo 提供的新体验会让用户更愿意在亚马逊电商网站上进行购物。在 2014 年 11 月 Echo 面世后,亚马逊甚至没有过分强调所谓的「智能音箱」概念,而是把 Echo 当做一个音箱升级的产物,最初只把 Echo 提供给少数用户,并收集他们的使用反馈。

亚马逊还将 Alexa 接入电商平台,可以直接在 APP 上实现语音购物。

 

其次,在得到市场印证之后,亚马逊果断将其上升为公司战略业务,并充分利用亚马逊的平台资源不遗余力推广。

Echo 在市场上出人意料的受到了用户欢迎。这让亚马逊重新审视了 Echo 的意义,并渐渐开始放开手脚,将所有资源都倾向给 Echo:2015 年开始,亚马逊除了在销售推广上不遗余力,也选择了在合适的时机将 Alexa 逐步开放,在这个过程中,甚至就连许多第三方的接入都由亚马逊亲自操作完成。到 2016 年,Echo 一战成名,Alexa 上升为公司战略级业务——此时,亚马逊获得的先发优势甚至让谷歌也望尘莫及。

2016 年 5 月 Echo 副总裁 Mike George 在一次大会上介绍 Echo。

 

从最开始谨慎的产品和市场定位,到后来上升到战略层面的高举高打,亚马逊这套「组合拳」式的打法让人称奇,但想要在中国这个市场上搅动风云的公司只能羡慕,却无法模仿。一个最直接的原因是,在国内,即便是被行业视作巨头甚至是阴影的 BAT,也没有一家能像亚马逊一样本身就拥有强大的软件、硬件以及销售渠道相结合的综合能力。在这种情况下,最有效率的方式可能就是「抱团取暖」。

对于 BAT 和京东来说,理论上他们具备接近于亚马逊所能调动的资源能力,但是目前的公开信息来看,并没有一家将智能音箱上升到足够的战略高度来对待,而在智能音箱背后的 AI 助手技术层面,也整体落后于微软、谷歌、亚马逊等国际巨头。

而那些想要抱团取暖入局的互联网公司,对他们之中的大多数,智能音箱更像是一个 BD 的合作,在中国的硬件供应链基础上,打造一个能够对声音进行反馈的音箱并不难,但这个音箱能够做到多智能则是另一回事情了。

即便是今天回头来看,当初亚马逊 Echo 的成功也是集天时地利人和的小概率事件,很多时候,野心的繁荣并不等同于市场的繁荣,习惯了追逐风口而缺乏足够技术积累的那些中国公司,在智能音箱所引发的产业机会面前,更多时候可能是有心无力的焦虑。

智能音箱热的背后到底是个什么机会?

智能音箱不是硬件创业热潮的延续,而是 AI 时代的第一个实体载体。

这注定是一场关乎技术、设计和商业等综合实力的竞争。产品的打磨只是第一步,所谓的智能音箱还需要回答的一个重要问题是,够不够聪明?消费者有多大的动力愿意为它花钱?

「用户买回家,大部分只会用它听歌或者询问一下天气,但这样形成的黏性不会太高。」出门问问创始人李志飞觉得,在目前阶段,家庭环境中暂时还不存在一个强烈的语音交互需求场景。所以尽管出门问问也发布了虚拟语音助手和智能音箱的产品计划,李志飞也表示公司将把这个方向「认真的当做一个战略」去做,但是根据他的判断,」智能音箱的市场需要时间「,现阶段更成熟的语音交互场景还是会发生在车内空间。

而豌豆荚创始人王俊煜在一篇关于 Echo 和 Google home 的使用体验的文章中则提到,要养成新的交互习惯,「必须具备三个条件:新路径比旧路径要短得多,新路径的成功率足够高,新路径失败后的损失足够小。」换言之,如果用户发出的指令得到的是智能音箱缓慢甚至错误的反馈,那么用不了几次,人们就会认定这款产品不够「聪明」,产品体验大打折扣。

Echo 最初让人眼前一亮的功能之一,就是可以通过 Alexa 平台控制家庭环境内的其他智能产品,比如消费者可以发出指令命令 Alexa 为自己开灯或关灯;不仅于此,亚马逊作为电商平台本身就能够提供用户通过智能音箱语音下达购物指令的频繁场景;这些都在为帮助用户养成新的交互习惯和提升黏性添砖加瓦。某种程度上说,Echo 的成功是恰到好处的先发优势+场景的胜利。

Echo 功能之一可以通过 Alexa 平台控制家庭环境内的其他智能产品。

 

另一方面,Echo 模式也有其瓶颈。如果认同智能音箱之争背后的实质是 AI 之争,你就会意识到数据和调用频率对于一个 AI 产品长期发育的重要性。Echo 系列产品目前固然销售了千万台,并且亚马逊 Alexa 本身正在成为开放平台,但毕竟只是基于亚马逊自己的生态,而在刚刚结束的 Google I/O 大会上,Google Assistant 宣布其覆盖设备已经超过一亿台,这一数字还会随着接入更多硬件平台而大幅度提升。

更值得关注的是,Google 已经开始把其最新的 AI 技术深层应用到 Google Home 之中,比如 Google Home 增加了视觉反馈技术,即便没有如亚马逊最新发布的 Echo Show 那样自带屏幕,但当你需要屏幕交互时,你可以和 Google Home 音箱对话,就能让结果显示在你的手机或电视上。这意味着,你不但能让 Google Home 播放你喜欢的音乐,让它打电话,而且可以对着它说出你想看的视频。

同时,Google Assistant 正在成为一个进化速度可怕的 AI 幽灵。Google Assistant 在集成领先语音能力的同时,也深度集成了 Google Lens 的图像处理能力。并且它还会不断被 Google 的强大数据来源所「喂养「,这些数据不仅来自 Google 自己的用户平台,也来自接入 Google Assistant 的越来越多手机、空调、冰箱等终端。

Google Lens 能通过拍摄的图片辨认出是什么种类的花。

 

未来,当我们再谈论起智能音箱,谈论的将不只是智能音箱的躯壳,也不只是语音交互与声场识别,而是一个不断进化迭代的 AI。这就意味着,对于没有深厚 AI 技术基础和数据基础的参与者,智能音箱的热潮纵使诱人,也只是一个水中捞月的幻象。

三种路径

亚马逊和 Google 将会引领智能音箱市场两种典型的模式,前者依靠其多年构建平台的生态协同,用尽量多的场景增加使用黏性;后者则借助其智能助手借助硬件的病毒般扩散,在海量的设备和数据喂养下让 AI 不断迭代进化。

在中国,能够做到亚马逊模式的平台本就不多,在硬件产业链和销售、品牌等环节已积累起优势的小米,或许将成为一个值得关注的重量级选手。

根据顶楼 TopView 从产业链多方获得的消息来看,「小米版 Echo」早已完成了产品研发。在微信公众平台上,已经出现了一个名为「小米 AI 音箱」的账号。这个账号由已经由 2017 年 4 月 26 日完成认证,主体是北京小米移动软件有限公司,公司法人代表则是黎万强。

另据一位深度参与了小米 AI 音箱的技术厂商负责人透露的细节,这一项目是由小米电视掌舵人王川和小米大脑负责人 KK 直接带队。同时这位负责人还表示,来自小米的这款音箱和 Echo 的产品策略相同,最开始不会过分强调「智能」概念,尽管具有了远场语音识别的功能,但是在服务集成上做了不少「减法」,零售价格也不会超过 500 元。

事实上,这并非小米第一个试水语音功能的音箱。2016 年 11 月 22 日,小米曾经发布过一款小米网络音箱,当时售价 399 元。但这款网络音箱采用的是近场双麦技术,长按控制面板的「CH」键才能下达语音指令。

小米网络音箱于 2016 年 11 月发布,定价 399 元,与腾讯、阿里两大音乐版权库合作,后接喜马拉雅 FM 等多个头部语音频道。

 

此次发布的新产品很有可能以「小米网络音响」的升级版概念出现在市场上,它对小米的意义不言而喻:随着手机销量增长停滞,雷军也必须为消费者和市场讲一个更新、更酷的故事。而越来越完整的智能家居生态链、强势的渠道和品牌,这一切可能都会在未来成为「小米版 Echo」手上的王牌。

根据顶楼 TopView 获得的消息,小米对还未发布的智能音箱抱有的是百万台级别的期望。但在记者接触的大多数业内相关人士判断,这个市场」真正做起来」,至少还需要 2-3 年,甚至是 5 年的时间。

尽管市场需要耐心培育,对于大多数创业公司来说,他们远没有小米的天时地利,想要在智能音箱的机会面前分一杯羹,换一种思路更加合适。

一个可以关注的机会是借助 Google Assistant 的全球扩张抓海外市场机会。中国有成熟的硬件制造链条,借助与 Google 等巨头的全球体系合作将生产的音箱产品卖到海外去,用 Google 的灵魂,造自己的躯壳,不失为一种商业路径。

出门问问创始人李志飞告诉顶楼 TopView,出门问问也会将智能音箱,以及背后的家庭语音交互场景当做战略重点严肃对待,因为「这和公司的使命相关」。不过,尽管 4 月出门问问发布了基于虚拟个人助理的免费级 AI 开放平台,但李志飞在接受顶楼 Top View 采访时表示并不排除以后和巨头合作的可能。而就在 2017 年的 Google I/O 大会上,出门问问成为了 Google Assistant 的官方合作伙伴。同时,出门问问即将面向海外推出的智能音箱产品 Tichome Mini 即将搭载的就是 Google Assistant 操作平台。

智能音箱产品 Tichome Mini 产品概念图。

 

第三种路径则是抓住 Google、亚马逊智能助手服务暂时不能入华的时间窗口。例如一些优秀的中国创业公司通过与亚马逊、Google 合作的方式,成为这些巨头服务曲线入华的本土合作伙伴。与此同时,理论上来说,Google、亚马逊的智能音箱服务暂时没能进入中国市场的这段时间对于 BAT 来说也是个机会窗口,但关键取决于他们是不是有足够大的决心,以及在 AI 层面的技术积累是否足够深厚。

2017 年 1 月,百度在 CES 现场推出了人工智能操作系统 DuerOS,并且宣布和智能机器人公司小鱼在家达成合作。DuerOS 这个平台可以实现语音控制、日常聊天、直接提供多种 O2O 服务等的智能化转变。而到了 4 月,腾讯推出的智能语音助手腾讯叮当,更是直接接入了腾讯内容生态和技术生态,按照腾讯的官方说法,叮当更希望打造一个完整的服务体系。

但同时,两家公司也在通过不同的方式向自己曾经并不擅长的终端产品领域进军:在 2016 年 9 月的百度世界大会上,当时还未离职的吴恩达曾宣布将与音响厂商哈曼合作生产推出智能音箱,后来在 2017 年初收购渡鸦科技后,关于智能音箱的研发、设计等任务似乎落到了渡鸦科技团队身上;而根据顶楼 TopView 从多方获得的消息证明,腾讯内部也一直没有放弃硬件产品的尝试,关于智能音箱的研发似乎已经进入了尾声。

吴恩达曾在百度世界大会上宣布制作智能音箱。现在只剩下一张模糊的现场拍摄照片。

 

对大公司来说,一旦决定亲自「下水」,就意味着必须亲力亲为,把软件平台、硬件、线上线下的销售、营销、供应链整个抓起来,需要的决心和难度可想而知。

而对于没有技术纵深,也缺乏强用户需求牵引的创业公司,可以借助资本看不明白的阶段快速拿尽量多的钱,但很快就会发现,随着更多巨头认真投入其中,自己可以做的事情是有限的。

不同于五六年前的智能手机浪潮开始时,中国市场和产业链条的蓄势待发。智能音箱的中国战事前所未有的迷茫和混乱,在亚马逊、微软、谷歌等公司近期密集的动作影响下,内心不论多焦虑,都要认清现实:智能音箱热潮的实质是 AI 之争,归根结底是未来人工智能的入口和焦点,这个机会不仅是靠硬件上做好几个局部功能就抓的住的。

一个残酷的现实是,早已从「Mobile First」向「AI First」转型的 Google 又一次把不确定的格局抓到了自己手中,这一次,大多数的中国公司从战略到技术储备上再一次落后了。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

从亚马逊到腾讯 互联网巨头为何都要做智能音箱?

大战前夜,未见火光,但硝烟渐起。

文/周小丹,房宫一柳

2017 年硬件领域最大的风暴,由电商巨头亚马逊引起。

2014 年 11 月,刚经历过 Fire Phone 销售惨败的亚马逊选择低调发布智能音箱 Echo,贝索斯甚至没有单独为它开一场发布会。那时的他应该也不会想到,两年多后这个「试验品」不仅让亚马逊的股价创下历史新高,也将几乎所有科技巨头卷入到一场由亚马逊引领的商业竞速。

Amazon Echo 是一款智能音箱,也是私人声控语音助手。

 

根据 CIRP、RBC Capital Market 数据,包括 Echo、EchoDot 和 Tap 在内的亚马逊智能音箱,目前已累计销售接近千万台,销售额达到 8 至 10 亿美元。亚马逊的 Echo 占据了这个市场超过 70% 的市场份额。

这当然只是一场更大战争的序章,微软、三星、谷歌、苹果等科技巨头正在加速进入战场。

在 5 月 9 日亚马逊发布带触屏的 Echo Show 仅仅一天之后,微软在 Build 大会上发布了与哈曼卡顿联合打造的 Invoke 智能音箱,内置了微软研发多年的人工智能助手 Cortana。

5 月 17 日的 Google I/O 上,最引人注目的就是 Google Home 和 Google Assistant 的重大更新,新版本的 Google Home 通过深度学习等技术升级后,现在只需要两只麦克风(亚马逊 Echo 需要七个麦克风阵列),就能实现准确定位周围说话的人;而 Google Assistant 宣布覆盖设备超过一亿台。

在 6 月即将到来的苹果 WWDC 上,苹果将发布首款搭载 Siri 的智能音箱这一消息也早已被外媒提前泄露. 据其台湾供应链的消息,产品已经进入到测试阶段。

硅谷科技巨头围绕智能音箱的诸神之战已经打响,战火必然也将影响到大洋彼岸。

野心的繁荣

90 年代进入音响行业时,曾德钧大概不会想到,三十年后,这个行业的主流玩家就要被一群互联网公司取代。

这位有「中国胆机教父」之称的 50 后创业者在音响行业浸淫多年,甘苦尝尽。最近几年来他越来越意识到,智能化将会带来新一轮行业洗牌。但现在,这个趋势正在加速到来:仅在 2016 年,就有包括 BAT、360 等多家互联网公司的相关负责人陆续来到曾德钧位于深圳的办公室,与他讨论相关产品问题,甚至有一家巨头向曾德钧创办的云动创想直接提出了投资意愿——这样的「盛况」此前从未出现。

「大家已经对这件事情有了很高的预期。」这是曾德钧过去一年来最明显的感受。

「如果说哪家公司不眼红,那绝对是假话。」一位国内语音识别技术公司 CEO 直言。据顶楼 TopView 获悉,国内包括 BAT、小米、猎豹、联想在内的多家公司都在这个领域积极布局。一位智能家居行业从业者对顶楼 TopView 透露:「现在已经没有哪家巨头不在做智能音箱了,估计就在 2017 年,国内起码会有 7、8 个中国版 Echo 面世。」

自 2014 年底到今天,国内科技公司受 Echo 启发而加入到智能音箱战局的过程,大致分为三个阶段。

2014 年 11 月,Echo 正式面市。作为一款概念上并不新鲜的智能音箱,Echo 带来的最亮眼的变革在于,用户无需按键,只要喊出 Alexa 就可以把它激活并发号指令,而实现这一远场语音交互体验的基础是 7 个装置在产品顶端的环形麦克风阵列。

Echo 独创的 6+1 环形麦克风阵列,大大提升远场语音识别效率。

 

最先看到 Echo 潜力的是国内语音技术方案提供商:「其实拿到 Echo 内测版的时候,我们意识到这可能是一个很好的方向。」语音交互技术和解决方案公司思必驰市场总监龙梦竹说。

到了 2015 年 10 月,仅在 Ehco 正式放开销售几个月后,思必驰就迅速推出了跟 Echo 同源的麦克风阵列。在此之前,国内软硬一体化的麦克风阵列市场几乎属于空白。

在同一时间感受到变革「气息」的,还有此前专注于机器人方向的人工智能创业公司 Rokid。2014 年公司成立之初,Rokid 的战略重点是当时最受追捧的机器人。2015 年,Rokid 第一款家用机器人发布。也就在那时,Echo 在美国市场受到的追捧直接影响了 Rokid 的战略方向,「那时候我们开始意识到,相比于机器人,智能音箱或许会成为更容易打开市场的方式。「Rokid 产品总监向文杰说。2015 年底,Rokid 立刻决定转变战略方向,在第二代产品中将语音和远场识别技术作为了核心。

Rokid 公司智能音箱新产品 Pebble (月石)斩获 2017CES 两项大奖。

 

如果说,2015 年 Echo 的影响力还只是被少数创业公司所注意,2016 年 Echo 在市场上的高歌猛进则让更多国内互联网公司加速在智能音箱市场的布局。

根据 CIRP 的报告,截至 2016 年年底,Echo 系列产品在美国的销售量已经达到 700 万。更重要的是,亚马逊在这一年已经逐步将 Echo 背后的语音助手 Alexa 做成了开放平台,目前平台拥有上万种技能。同样是 2016 年,Google 正式推出了智能音箱 Google Home,这无疑成为重要的产业风向标。

「两年前公司刚成立的时候,我们就一直尝试与 BAT 合作打造智能硬件,那时候他们对智能硬件没有明显的兴趣。」作为智能硬件供应链上的服务提供者,硬蛋科技负责人发现,就在 2016 年 10 月,Google 的智能音箱 Google Home 正式推向市场的同时,此前拒绝了硬蛋的大公司竟然纷纷主动找上门来,询问合作可能。另一位语音技术供应商则表示,同样是在 2016 年 10 月份,小米开始和他们接触谈智能音箱合作。根据这位负责人的透露,雷军对此事表现出了强烈的兴趣。

2016 年 10 月 5 日,Google 正式推出能通过语音助理「声控」的 Google Home。

 

Echo 及其背后的语音助手 Alexa 让亚马逊一飞冲天,智能音箱 AI 时代交互入口的观点被更多人所意识到,没有人愿意在智能手机之后的下一个平台级机会面前被抛下。

进入到 2017 年,无论是大公司还是创业公司,几乎都向着成为「中国版 Echo」摆好了进击的架势:2017 年 2 月,百度宣布全资收购创业公司渡鸦科技;3 月,在离职前几天,吴恩达还曾亲自率领一支技术团队来到深圳考察硬件厂商;4 月,腾讯宣布推出智能语音助手「腾讯叮当」,直接对标亚马逊的 Alexa;随后出门问问在 4 月宣布推出虚拟个人助理,以及即将在下半年亮相的问问智能音箱 Tichome;而在 5 月,来自联想和创业公司 Rokid 公司的智能音箱产品正式面市,从外观或功能上,二者都以本土版 Echo 自居……

据某家技术供应商透露,网易、搜狗、360 等手里都有智能音箱相关的立项。就连一直被认为不具备硬件产品基因的腾讯,内部产品也早已完成了开发。还有早已浮出水面的微信硬件「微信相框」,也「正对标亚马逊的 Echo 调整产品定位和功能」,微信相框负责人对顶楼 Top View 说。

大战前夜,未见火光,但硝烟渐起。

2015:京东教训

智能音箱的中国故事,其实早在两年之前就有过第一季的上演。

对于一直将亚马逊视作对标对象的京东来说,亚马逊通过 Echo 和背后的 Alexa 实现的成绩带来显然是一个不可忽略的信号。

早在 Echo 面市后不久的 2015 年,京东就火速与科大讯飞成立了一家合资公司灵隆科技,并在 2015 年 6 月发布了一款名为叮咚智能音箱的产品。这款音箱搭载了科大讯飞的智能语音系统,内置 8 个收音麦克风,唤醒词则为「叮咚叮咚」。在内容方面则集成了百度音乐、喜马拉雅 FM 等等服务。根据京东官方给出的售价,这款产品最低配青春版售价人民币 199 元,最高配新东方教育版售价 998 元,平均价格为 618 元。

中档叮咚智能音箱,定价 798 元。据技术商透露,199 元低配版每卖出一台,「就要亏五十元」。

 

据一位接近灵隆科技的语音解决方案服务商公司负责人透露,在京东内部,「刘强东对此事非常重视」。当年京东为灵隆科技注资 4500 万人民币,占股 45%,另外 55% 股份则由科大讯飞持有。而新公司由京东智能产品中心总监魏强直接负责。

很明显,叮咚音箱并没有带来如 Echo 一样的市场效应。

在产品刚刚上线的一段时间内,京东也曾主动让出网站主页 Banner 页面为产品做 24 小时的展示和宣传——这和亚马逊的策略如出一辙。根据公开数据显示,今年叮咚音箱及其合作产品累计销量已经突破 100 万台。但不只一位智能音箱从业者对顶楼 Top view 坦言,这个数字存在水份。「有可能几十万台都不到。」

「京东当时投入的决心很大,但现在双方都有点心灰意冷。」上述负责人把叮咚的失利总结为二者合作方式的不当:从叮咚音箱的技术、研发到产品设计,再到灵隆科技的架构上,科大讯飞一度都占据着主导地位。「叮咚音箱想学亚马逊,又没学到精髓。这件事情上,绝对不能让技术为主的公司负责产品;另一方面京东又很快的通过很激进的宣传、推广把市场的预期拉的太高。这是非常危险的」。

那么,京东希望学习又没学到的亚马逊的精髓又是什么?

首先,亚马逊 Echo 在发布的初期足够的谨慎,并不是高举高打,概念先行。

从亚马逊神秘的 Lab126 实验室诞生时,Echo 脱胎于此前失败的项目 C(Lab126 实验室按照产品重要级别从 A 到 Z 为项目编号,Kindle 为项目 A,曾被寄予厚望的 Fire Phone 为项目 B)。或许是因为 Fire Phone 的折戟,包括贝索斯在内的亚马逊高管对这款带有远场语音识别功能的音箱只带有相当谨慎的预期:他们仅仅希望 Echo 提供的新体验会让用户更愿意在亚马逊电商网站上进行购物。在 2014 年 11 月 Echo 面世后,亚马逊甚至没有过分强调所谓的「智能音箱」概念,而是把 Echo 当做一个音箱升级的产物,最初只把 Echo 提供给少数用户,并收集他们的使用反馈。

亚马逊还将 Alexa 接入电商平台,可以直接在 APP 上实现语音购物。

 

其次,在得到市场印证之后,亚马逊果断将其上升为公司战略业务,并充分利用亚马逊的平台资源不遗余力推广。

Echo 在市场上出人意料的受到了用户欢迎。这让亚马逊重新审视了 Echo 的意义,并渐渐开始放开手脚,将所有资源都倾向给 Echo:2015 年开始,亚马逊除了在销售推广上不遗余力,也选择了在合适的时机将 Alexa 逐步开放,在这个过程中,甚至就连许多第三方的接入都由亚马逊亲自操作完成。到 2016 年,Echo 一战成名,Alexa 上升为公司战略级业务——此时,亚马逊获得的先发优势甚至让谷歌也望尘莫及。

2016 年 5 月 Echo 副总裁 Mike George 在一次大会上介绍 Echo。

 

从最开始谨慎的产品和市场定位,到后来上升到战略层面的高举高打,亚马逊这套「组合拳」式的打法让人称奇,但想要在中国这个市场上搅动风云的公司只能羡慕,却无法模仿。一个最直接的原因是,在国内,即便是被行业视作巨头甚至是阴影的 BAT,也没有一家能像亚马逊一样本身就拥有强大的软件、硬件以及销售渠道相结合的综合能力。在这种情况下,最有效率的方式可能就是「抱团取暖」。

对于 BAT 和京东来说,理论上他们具备接近于亚马逊所能调动的资源能力,但是目前的公开信息来看,并没有一家将智能音箱上升到足够的战略高度来对待,而在智能音箱背后的 AI 助手技术层面,也整体落后于微软、谷歌、亚马逊等国际巨头。

而那些想要抱团取暖入局的互联网公司,对他们之中的大多数,智能音箱更像是一个 BD 的合作,在中国的硬件供应链基础上,打造一个能够对声音进行反馈的音箱并不难,但这个音箱能够做到多智能则是另一回事情了。

即便是今天回头来看,当初亚马逊 Echo 的成功也是集天时地利人和的小概率事件,很多时候,野心的繁荣并不等同于市场的繁荣,习惯了追逐风口而缺乏足够技术积累的那些中国公司,在智能音箱所引发的产业机会面前,更多时候可能是有心无力的焦虑。

智能音箱热的背后到底是个什么机会?

智能音箱不是硬件创业热潮的延续,而是 AI 时代的第一个实体载体。

这注定是一场关乎技术、设计和商业等综合实力的竞争。产品的打磨只是第一步,所谓的智能音箱还需要回答的一个重要问题是,够不够聪明?消费者有多大的动力愿意为它花钱?

「用户买回家,大部分只会用它听歌或者询问一下天气,但这样形成的黏性不会太高。」出门问问创始人李志飞觉得,在目前阶段,家庭环境中暂时还不存在一个强烈的语音交互需求场景。所以尽管出门问问也发布了虚拟语音助手和智能音箱的产品计划,李志飞也表示公司将把这个方向「认真的当做一个战略」去做,但是根据他的判断,」智能音箱的市场需要时间「,现阶段更成熟的语音交互场景还是会发生在车内空间。

而豌豆荚创始人王俊煜在一篇关于 Echo 和 Google home 的使用体验的文章中则提到,要养成新的交互习惯,「必须具备三个条件:新路径比旧路径要短得多,新路径的成功率足够高,新路径失败后的损失足够小。」换言之,如果用户发出的指令得到的是智能音箱缓慢甚至错误的反馈,那么用不了几次,人们就会认定这款产品不够「聪明」,产品体验大打折扣。

Echo 最初让人眼前一亮的功能之一,就是可以通过 Alexa 平台控制家庭环境内的其他智能产品,比如消费者可以发出指令命令 Alexa 为自己开灯或关灯;不仅于此,亚马逊作为电商平台本身就能够提供用户通过智能音箱语音下达购物指令的频繁场景;这些都在为帮助用户养成新的交互习惯和提升黏性添砖加瓦。某种程度上说,Echo 的成功是恰到好处的先发优势+场景的胜利。

Echo 功能之一可以通过 Alexa 平台控制家庭环境内的其他智能产品。

 

另一方面,Echo 模式也有其瓶颈。如果认同智能音箱之争背后的实质是 AI 之争,你就会意识到数据和调用频率对于一个 AI 产品长期发育的重要性。Echo 系列产品目前固然销售了千万台,并且亚马逊 Alexa 本身正在成为开放平台,但毕竟只是基于亚马逊自己的生态,而在刚刚结束的 Google I/O 大会上,Google Assistant 宣布其覆盖设备已经超过一亿台,这一数字还会随着接入更多硬件平台而大幅度提升。

更值得关注的是,Google 已经开始把其最新的 AI 技术深层应用到 Google Home 之中,比如 Google Home 增加了视觉反馈技术,即便没有如亚马逊最新发布的 Echo Show 那样自带屏幕,但当你需要屏幕交互时,你可以和 Google Home 音箱对话,就能让结果显示在你的手机或电视上。这意味着,你不但能让 Google Home 播放你喜欢的音乐,让它打电话,而且可以对着它说出你想看的视频。

同时,Google Assistant 正在成为一个进化速度可怕的 AI 幽灵。Google Assistant 在集成领先语音能力的同时,也深度集成了 Google Lens 的图像处理能力。并且它还会不断被 Google 的强大数据来源所「喂养「,这些数据不仅来自 Google 自己的用户平台,也来自接入 Google Assistant 的越来越多手机、空调、冰箱等终端。

Google Lens 能通过拍摄的图片辨认出是什么种类的花。

 

未来,当我们再谈论起智能音箱,谈论的将不只是智能音箱的躯壳,也不只是语音交互与声场识别,而是一个不断进化迭代的 AI。这就意味着,对于没有深厚 AI 技术基础和数据基础的参与者,智能音箱的热潮纵使诱人,也只是一个水中捞月的幻象。

三种路径

亚马逊和 Google 将会引领智能音箱市场两种典型的模式,前者依靠其多年构建平台的生态协同,用尽量多的场景增加使用黏性;后者则借助其智能助手借助硬件的病毒般扩散,在海量的设备和数据喂养下让 AI 不断迭代进化。

在中国,能够做到亚马逊模式的平台本就不多,在硬件产业链和销售、品牌等环节已积累起优势的小米,或许将成为一个值得关注的重量级选手。

根据顶楼 TopView 从产业链多方获得的消息来看,「小米版 Echo」早已完成了产品研发。在微信公众平台上,已经出现了一个名为「小米 AI 音箱」的账号。这个账号由已经由 2017 年 4 月 26 日完成认证,主体是北京小米移动软件有限公司,公司法人代表则是黎万强。

另据一位深度参与了小米 AI 音箱的技术厂商负责人透露的细节,这一项目是由小米电视掌舵人王川和小米大脑负责人 KK 直接带队。同时这位负责人还表示,来自小米的这款音箱和 Echo 的产品策略相同,最开始不会过分强调「智能」概念,尽管具有了远场语音识别的功能,但是在服务集成上做了不少「减法」,零售价格也不会超过 500 元。

事实上,这并非小米第一个试水语音功能的音箱。2016 年 11 月 22 日,小米曾经发布过一款小米网络音箱,当时售价 399 元。但这款网络音箱采用的是近场双麦技术,长按控制面板的「CH」键才能下达语音指令。

小米网络音箱于 2016 年 11 月发布,定价 399 元,与腾讯、阿里两大音乐版权库合作,后接喜马拉雅 FM 等多个头部语音频道。

 

此次发布的新产品很有可能以「小米网络音响」的升级版概念出现在市场上,它对小米的意义不言而喻:随着手机销量增长停滞,雷军也必须为消费者和市场讲一个更新、更酷的故事。而越来越完整的智能家居生态链、强势的渠道和品牌,这一切可能都会在未来成为「小米版 Echo」手上的王牌。

根据顶楼 TopView 获得的消息,小米对还未发布的智能音箱抱有的是百万台级别的期望。但在记者接触的大多数业内相关人士判断,这个市场」真正做起来」,至少还需要 2-3 年,甚至是 5 年的时间。

尽管市场需要耐心培育,对于大多数创业公司来说,他们远没有小米的天时地利,想要在智能音箱的机会面前分一杯羹,换一种思路更加合适。

一个可以关注的机会是借助 Google Assistant 的全球扩张抓海外市场机会。中国有成熟的硬件制造链条,借助与 Google 等巨头的全球体系合作将生产的音箱产品卖到海外去,用 Google 的灵魂,造自己的躯壳,不失为一种商业路径。

出门问问创始人李志飞告诉顶楼 TopView,出门问问也会将智能音箱,以及背后的家庭语音交互场景当做战略重点严肃对待,因为「这和公司的使命相关」。不过,尽管 4 月出门问问发布了基于虚拟个人助理的免费级 AI 开放平台,但李志飞在接受顶楼 Top View 采访时表示并不排除以后和巨头合作的可能。而就在 2017 年的 Google I/O 大会上,出门问问成为了 Google Assistant 的官方合作伙伴。同时,出门问问即将面向海外推出的智能音箱产品 Tichome Mini 即将搭载的就是 Google Assistant 操作平台。

智能音箱产品 Tichome Mini 产品概念图。

 

第三种路径则是抓住 Google、亚马逊智能助手服务暂时不能入华的时间窗口。例如一些优秀的中国创业公司通过与亚马逊、Google 合作的方式,成为这些巨头服务曲线入华的本土合作伙伴。与此同时,理论上来说,Google、亚马逊的智能音箱服务暂时没能进入中国市场的这段时间对于 BAT 来说也是个机会窗口,但关键取决于他们是不是有足够大的决心,以及在 AI 层面的技术积累是否足够深厚。

2017 年 1 月,百度在 CES 现场推出了人工智能操作系统 DuerOS,并且宣布和智能机器人公司小鱼在家达成合作。DuerOS 这个平台可以实现语音控制、日常聊天、直接提供多种 O2O 服务等的智能化转变。而到了 4 月,腾讯推出的智能语音助手腾讯叮当,更是直接接入了腾讯内容生态和技术生态,按照腾讯的官方说法,叮当更希望打造一个完整的服务体系。

但同时,两家公司也在通过不同的方式向自己曾经并不擅长的终端产品领域进军:在 2016 年 9 月的百度世界大会上,当时还未离职的吴恩达曾宣布将与音响厂商哈曼合作生产推出智能音箱,后来在 2017 年初收购渡鸦科技后,关于智能音箱的研发、设计等任务似乎落到了渡鸦科技团队身上;而根据顶楼 TopView 从多方获得的消息证明,腾讯内部也一直没有放弃硬件产品的尝试,关于智能音箱的研发似乎已经进入了尾声。

吴恩达曾在百度世界大会上宣布制作智能音箱。现在只剩下一张模糊的现场拍摄照片。

 

对大公司来说,一旦决定亲自「下水」,就意味着必须亲力亲为,把软件平台、硬件、线上线下的销售、营销、供应链整个抓起来,需要的决心和难度可想而知。

而对于没有技术纵深,也缺乏强用户需求牵引的创业公司,可以借助资本看不明白的阶段快速拿尽量多的钱,但很快就会发现,随着更多巨头认真投入其中,自己可以做的事情是有限的。

不同于五六年前的智能手机浪潮开始时,中国市场和产业链条的蓄势待发。智能音箱的中国战事前所未有的迷茫和混乱,在亚马逊、微软、谷歌等公司近期密集的动作影响下,内心不论多焦虑,都要认清现实:智能音箱热潮的实质是 AI 之争,归根结底是未来人工智能的入口和焦点,这个机会不仅是靠硬件上做好几个局部功能就抓的住的。

一个残酷的现实是,早已从「Mobile First」向「AI First」转型的 Google 又一次把不确定的格局抓到了自己手中,这一次,大多数的中国公司从战略到技术储备上再一次落后了。

本文为转载内容,授权事宜请联系原著作权人。