正在阅读:

米唐科技宋少鹏:亚马逊帮我找到了基因

扫一扫下载界面新闻APP

米唐科技宋少鹏:亚马逊帮我找到了基因

米唐科技宋少鹏是我见过的又一位伸出口袋就是板卡的创始人。

随着小米AI音箱299元的价格涌入市场,以及阿里京东围绕智能音箱掀起的价格战,国内智能音箱的生存土壤似乎已不容乐观。

而在深圳这个出口导向的城市上演着另一种玩法,众多智能音箱品牌商接入亚马逊Alexa或者Google Home,出口海外,力求在国际这个更加成熟的市场中分一杯羹。

米唐科技就是一家专注于智能语音的方案提供商,亚马逊Alexa的官方合作伙伴,目前正在帮助数十家客户落地智能语音交互产品,推动数十万台智能音箱销往海外。米唐科技的发展,代表了不同于国内方案商的另一条差异化之路。

▲米唐科技创始人&CEO宋少鹏

10月底,一次偶然的机会,智东西在深圳参加一个会议,偶遇了米唐科技的CEO宋少鹏,其中他关于语音交互与智能音箱的演讲内容让人眼前一亮。会后智东西便与宋少鹏展开一场对话,看看这家公司的海外创收之路。

看好音频联网 离开谷歌创业

宋少鹏在音频领域已经呆了17年,可谓“沙场老兵”。他本科与硕士都在华南理工大学度过,研究生阶段就从事音频信号处理的研究。而毕业后,他就一头扎进音频信号处理这个领域,在Zoran芯片公司做了8年的数字信号处理(DSP)。全球第一个全套杜比单芯片解决方案就来自这家公司。

后来,2010年他去了微软亚洲硬件中心,从事硬件产品的研发制造,做过智能摄像头以及Kinnet体感设备等。

而在这期间他发现,智能手机因为连接了网络,给用户带来了无尽的内容、社交、娱乐,进而广泛流行。手机之后,汽车、电视也在连接互联网,继而收到欢迎。

一直做音频产品的宋少鹏发现,在2012年音频设备还没有联网,但他坚信音频产品的“互联网化”一定是趋势,问题是如何联网,如何承载娱乐、社交。

带着这些思考,宋少鹏在微软内部便开始尝试,但当时行业环境不太成熟,大公司的体制也存在一定的限制。在2013年认可这个方向后,他便带着团队出来闯荡一番,并在2014年成立米唐科技。紧接着智能硬件的热潮就来临了。

目前米唐科技是一个由30人组成的精干团队,团队成员来自微软、华为、哈曼、富士康、凡客等,提供全栈式智能语音解决方案,包含嵌入式软件、硬件、App/Skill、电声、产品交互设计等环节,“经常一个人干个人的活”,宋少鹏形容到。

亚马逊帮他们找到了基因

2014年刚成立公司时,米唐科技以品牌和产品切入市场,尝试将音频产品连接互联网,接入了国外的流媒体音乐内容,并通过触控、体感的操作方式优化用户体验,进而销往海外。“它的外形就像一个APP”,宋少鹏形容到。

▲方糖WiFi音箱

这款产品就是方糖WiFi音箱,经历了2014年的研发, 2015年就销往海外。为了增加销售,2015年同期米唐团队也推出了同样设计的蓝牙音箱,以谋得更多的利润。而一年数万台的销量显然不能带给米唐更多的发展。

这时亚马逊Alexa平台则成为了米唐的转折点。最初亚马逊Echo以MVP(最小可用原型)的形态交付用户,语音识别和语义理解都仅能满足流媒体播放的简单需求,但是经过一两年的打磨,到了2016年Echo的体验就好了很多。这时候亚马逊也将Alexa语音交互平台开放出来,宋少鹏第一时间就找到亚马逊,把他们的音箱接入Alexa。

“当时有好多家在接Alexa,我们用了三四个月就搞定了,是全球最早通过亚马逊认证的第三方音箱产品”,宋少鹏谈到。最初,米唐通过的是亚马逊Alexa的按键认证,原因在于原来的方糖音箱不是为远场设计的,采用近场的方式硬件不用做改动,用户通过固件升级就能够享受Alexa的服务。紧接着,2017年他们的单麦克系统方案支持的深圳Wi-Fi音箱企业DOSS再次通过了Alexa远场认证。

“通过亚马逊的认证后,Alexa团队的人就主动找到了我,问我一年能够卖多少,我说几万台,亚马逊就说做他们的技术方案商,可以帮米唐一年卖几百万个解决方案”,宋少鹏笑称这是亚马逊帮团队找到了方向。

因为米唐是一个技术导向的团队,更加擅长做技术,因此通过与亚马逊的合作,米唐也进行了自身的一次转型,从做C端产品转做B端的方案。米唐也针对亚马逊Alexa的认证标准做了团队的调整,比如增加了用户体验设计,这也是亚马逊所看重的。

单麦方案也能比拼亚马逊谷歌

由C端转向B端,米唐科技也由最初的品牌产品转向为客户提供整套语音交互的解决方案。

当讲到其产品时,宋少鹏瞬间便从口袋里掏出了一个PCBA板说:“这就是我们的产品,软硬件一体化的解决方案。”这让我瞬间想到了度秘景鲲曾说的,口袋里没有开发板的工程师不是好工程师呀。

▲米唐科技提供的PCBA板

他介绍到,开发板上的主要芯片模块是定制的,集成了主控+WiFi+蓝牙+降噪模块,交付给业界的包括硬件、软件(整个嵌入式系统、信号处理、声学设计、交互设计等),提供一站式服务,就这个开发板接上麦克风、功放模块、喇叭、电池就是一个Alexa的兼容机,三四个月就可以交货。

而在拾音环节的麦克风阵列上,米唐主要做1麦、2麦、4麦的解决方案。这时宋少鹏又打开手机现场展示了一段在一个嘈杂展馆内的应用情况,现场有三台智能音箱,分别是亚马逊Echo、Google Home和使用米唐1麦方案的智能音箱。可以发现在嘈杂的现场环境下,大约1.5米的距离处,使用米唐方案的音箱可以做到80%的唤醒,而Echo和Google Home只有60%左右。

通过这样一个案例,可以看到米唐科技的单麦方案效果还是不错的,这也是目前亚马逊Alexa平台唯一通过的单麦克解决方案。“我们在信号处理算法方面有较深的积累”,宋少鹏也谈到,除了技术外,做单麦主要是成本的考虑,包括实际成本、以及生产制造的隐形成本。

当谈及米唐科技相对于同行的优势时,宋少鹏谈到了三个方面:其一米唐做整合垂直的算法,集成商没有他们有算法,有算法的没有他们集成的深;其二米唐能够提供技术、软件与交互的全套方案;其三米唐在算法上“挖”的更深,包括采集、音效等全软件的算法。

针对算法,他也强调了全栈算法的优势。比如,目前很多智能音箱都开始支持通话功能,但是通话语音处理的策略是低延迟高保真,而语音识别可以延迟长一点,尽可能处理掉噪音,尽管处理的算法差不多,但策略完全不一样,这时就要从整体去考虑。

面向B端客户提供解决方案

通过亚马逊Alexa的合作,米唐科技的商业模式也由原来的面向C端转向面向B端,为客户提供整套语音交互方案,但同时既有的方糖音箱也独立销售,只是米唐已将全部投入都放在方案上。

具体而言,针对没有技术的客户,米唐能够提供一整套解决方案;针对研发能力较强的公司,米唐也可以出售部分软件,一起完成硬件落地的工作。

而在服务品类上,从今年起,也由智能音箱服务于整个制造业,音箱、耳机、车载都是米唐的发力方向。公司目前正在服务数十家各种类型的企业研发制造语音交互产品,一年出货量累计可达数十万台。

在营收方面,宋少鹏谈到,品牌产品的营收已经占到个位数,基本都在方案上。由于去年整个Alexa的产品没有出货,也主要以投入为主,今年的营收则比去年多了好几倍,目前已经实现了收支平衡。

苹果谷歌“包袱”太重

我们总谈到,一家公司的基因有时候就决定了能不能做成这件事。而宋少鹏则用基因论分析了为何亚马逊可以在智能语音上一举成名,相反在语音领域走在前面的苹果和谷歌却慢了很多。

在宋少鹏看来,苹果谷歌的“包袱”太重。比如苹果的Siri尽管很早就推出了,但是它是围绕触摸屏来做的,你问它什么都给你用“文字”来显示,Siri的所有创新都是围绕苹果的既得利益来做的,而正是使苹果取得成功的触摸屏也成为了它进入语音交互时代的“包袱”。谷歌也是如此。

但亚马逊是没有既得利益的,因为它做手机、做平板都失败了。亚马逊的出发点就是语音,它需要找语音最能落地的场景,而美国人对音乐、音箱有天然的需要,以及流媒体的体验,因此音箱就成为一个可落地的点。正因为亚马逊没有既得利益,它从零开始, 充分考虑场景和用户体验,才能做到这么成功。

其实这样的例子比比皆是,比如如果微信是在QQ的基础上去做,能否取得今天的成功恐怕就要打个问号了。再比如微软做手机也一直不是很成功,原因难道不是因为其出发点总是Windows的既得利益吗?可见有时候创新必须要摆脱现有包袱,从零开始,才能取得更大的突破。

智能音箱是蓝牙音箱的升级

有人认为智能音箱是一个全新的品类,主要在于智能化,也有人认为智能音箱是既有音箱的升级,那么宋少鹏又是如何看待的呢?

宋少鹏认为智能音箱是蓝牙音箱的升级,而不是凭空制造的,所有的消费电子产品都是原有产品的升级才有更大的市场。比如iPhone是在之前功能机基础上的升级,特斯拉是在之前燃油车基础上的升级。

按此思路,智能音箱则是传统蓝牙音箱的升级,只有在这个品类的基础上才能开拓更多的市场。那是否意味着智能音箱首先要是一台音箱呢?

关于国内的智能音箱市场,宋少鹏认为阿里、京东、小米等大公司掀起的价格战,对于市场而言是一见好事,能够降低用户的尝试门槛,进而教育市场。但目前国内语音交互系统做的还不够成熟,他的一些客户也在等巨头公司系统打磨成熟后接入,进入国内市场。

关于智能音箱在国内的发展,他认为某种程度上可以参考手机的发展曲线,比如iPhone 4代在中国刚刚半普及,而全年普及是iPhone 5、iPhone6,可见深入三四线城市需要一个较长的过程。即使今年国内市场可以做到百万台,渗透到三四线城市仍需要时间。

国内尚处初期 但前景广阔

深圳做为一个出口导向的城市,已经有近百家的音箱企业在周边生产,通过接入亚马逊Alexa或者Google Assistant进而出口海外,仅仅米唐科技的客户已经有数十家。

而目前国内市场则还处于早期,一方面国内智能音箱市场还很小,另一方面阿里、京东、小米等大企业展开的价格战,提升了国内智能音箱的入局门槛。国内智能音箱的品牌玩家也仅有一二十家。

但是宋少鹏看好国内语音应用的前景,也看好国内市场。“从历史来看,以美国为主的约3.5亿人口,加上欧洲7亿多人口,这个市场支撑起来的股市、期货、原油、大宗商品的价值是巨大的;而中国有14亿人口,基本完成城镇化,基本普及大学教育,正在进行消费升级,所形成的市场一定数倍于欧美市场,在这个大环境下去做创新,去深耕的机会是非常大的”,他总结到。

本文为转载内容,授权事宜请联系原著作权人。

亚马逊

5k
  • 微软和亚马逊对AI创企的投资面临英国深入审查,多家公司回应
  • 亚马逊计划对意大利竞争监管机构1000万欧元罚款提起上诉

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

米唐科技宋少鹏:亚马逊帮我找到了基因

米唐科技宋少鹏是我见过的又一位伸出口袋就是板卡的创始人。

随着小米AI音箱299元的价格涌入市场,以及阿里京东围绕智能音箱掀起的价格战,国内智能音箱的生存土壤似乎已不容乐观。

而在深圳这个出口导向的城市上演着另一种玩法,众多智能音箱品牌商接入亚马逊Alexa或者Google Home,出口海外,力求在国际这个更加成熟的市场中分一杯羹。

米唐科技就是一家专注于智能语音的方案提供商,亚马逊Alexa的官方合作伙伴,目前正在帮助数十家客户落地智能语音交互产品,推动数十万台智能音箱销往海外。米唐科技的发展,代表了不同于国内方案商的另一条差异化之路。

▲米唐科技创始人&CEO宋少鹏

10月底,一次偶然的机会,智东西在深圳参加一个会议,偶遇了米唐科技的CEO宋少鹏,其中他关于语音交互与智能音箱的演讲内容让人眼前一亮。会后智东西便与宋少鹏展开一场对话,看看这家公司的海外创收之路。

看好音频联网 离开谷歌创业

宋少鹏在音频领域已经呆了17年,可谓“沙场老兵”。他本科与硕士都在华南理工大学度过,研究生阶段就从事音频信号处理的研究。而毕业后,他就一头扎进音频信号处理这个领域,在Zoran芯片公司做了8年的数字信号处理(DSP)。全球第一个全套杜比单芯片解决方案就来自这家公司。

后来,2010年他去了微软亚洲硬件中心,从事硬件产品的研发制造,做过智能摄像头以及Kinnet体感设备等。

而在这期间他发现,智能手机因为连接了网络,给用户带来了无尽的内容、社交、娱乐,进而广泛流行。手机之后,汽车、电视也在连接互联网,继而收到欢迎。

一直做音频产品的宋少鹏发现,在2012年音频设备还没有联网,但他坚信音频产品的“互联网化”一定是趋势,问题是如何联网,如何承载娱乐、社交。

带着这些思考,宋少鹏在微软内部便开始尝试,但当时行业环境不太成熟,大公司的体制也存在一定的限制。在2013年认可这个方向后,他便带着团队出来闯荡一番,并在2014年成立米唐科技。紧接着智能硬件的热潮就来临了。

目前米唐科技是一个由30人组成的精干团队,团队成员来自微软、华为、哈曼、富士康、凡客等,提供全栈式智能语音解决方案,包含嵌入式软件、硬件、App/Skill、电声、产品交互设计等环节,“经常一个人干个人的活”,宋少鹏形容到。

亚马逊帮他们找到了基因

2014年刚成立公司时,米唐科技以品牌和产品切入市场,尝试将音频产品连接互联网,接入了国外的流媒体音乐内容,并通过触控、体感的操作方式优化用户体验,进而销往海外。“它的外形就像一个APP”,宋少鹏形容到。

▲方糖WiFi音箱

这款产品就是方糖WiFi音箱,经历了2014年的研发, 2015年就销往海外。为了增加销售,2015年同期米唐团队也推出了同样设计的蓝牙音箱,以谋得更多的利润。而一年数万台的销量显然不能带给米唐更多的发展。

这时亚马逊Alexa平台则成为了米唐的转折点。最初亚马逊Echo以MVP(最小可用原型)的形态交付用户,语音识别和语义理解都仅能满足流媒体播放的简单需求,但是经过一两年的打磨,到了2016年Echo的体验就好了很多。这时候亚马逊也将Alexa语音交互平台开放出来,宋少鹏第一时间就找到亚马逊,把他们的音箱接入Alexa。

“当时有好多家在接Alexa,我们用了三四个月就搞定了,是全球最早通过亚马逊认证的第三方音箱产品”,宋少鹏谈到。最初,米唐通过的是亚马逊Alexa的按键认证,原因在于原来的方糖音箱不是为远场设计的,采用近场的方式硬件不用做改动,用户通过固件升级就能够享受Alexa的服务。紧接着,2017年他们的单麦克系统方案支持的深圳Wi-Fi音箱企业DOSS再次通过了Alexa远场认证。

“通过亚马逊的认证后,Alexa团队的人就主动找到了我,问我一年能够卖多少,我说几万台,亚马逊就说做他们的技术方案商,可以帮米唐一年卖几百万个解决方案”,宋少鹏笑称这是亚马逊帮团队找到了方向。

因为米唐是一个技术导向的团队,更加擅长做技术,因此通过与亚马逊的合作,米唐也进行了自身的一次转型,从做C端产品转做B端的方案。米唐也针对亚马逊Alexa的认证标准做了团队的调整,比如增加了用户体验设计,这也是亚马逊所看重的。

单麦方案也能比拼亚马逊谷歌

由C端转向B端,米唐科技也由最初的品牌产品转向为客户提供整套语音交互的解决方案。

当讲到其产品时,宋少鹏瞬间便从口袋里掏出了一个PCBA板说:“这就是我们的产品,软硬件一体化的解决方案。”这让我瞬间想到了度秘景鲲曾说的,口袋里没有开发板的工程师不是好工程师呀。

▲米唐科技提供的PCBA板

他介绍到,开发板上的主要芯片模块是定制的,集成了主控+WiFi+蓝牙+降噪模块,交付给业界的包括硬件、软件(整个嵌入式系统、信号处理、声学设计、交互设计等),提供一站式服务,就这个开发板接上麦克风、功放模块、喇叭、电池就是一个Alexa的兼容机,三四个月就可以交货。

而在拾音环节的麦克风阵列上,米唐主要做1麦、2麦、4麦的解决方案。这时宋少鹏又打开手机现场展示了一段在一个嘈杂展馆内的应用情况,现场有三台智能音箱,分别是亚马逊Echo、Google Home和使用米唐1麦方案的智能音箱。可以发现在嘈杂的现场环境下,大约1.5米的距离处,使用米唐方案的音箱可以做到80%的唤醒,而Echo和Google Home只有60%左右。

通过这样一个案例,可以看到米唐科技的单麦方案效果还是不错的,这也是目前亚马逊Alexa平台唯一通过的单麦克解决方案。“我们在信号处理算法方面有较深的积累”,宋少鹏也谈到,除了技术外,做单麦主要是成本的考虑,包括实际成本、以及生产制造的隐形成本。

当谈及米唐科技相对于同行的优势时,宋少鹏谈到了三个方面:其一米唐做整合垂直的算法,集成商没有他们有算法,有算法的没有他们集成的深;其二米唐能够提供技术、软件与交互的全套方案;其三米唐在算法上“挖”的更深,包括采集、音效等全软件的算法。

针对算法,他也强调了全栈算法的优势。比如,目前很多智能音箱都开始支持通话功能,但是通话语音处理的策略是低延迟高保真,而语音识别可以延迟长一点,尽可能处理掉噪音,尽管处理的算法差不多,但策略完全不一样,这时就要从整体去考虑。

面向B端客户提供解决方案

通过亚马逊Alexa的合作,米唐科技的商业模式也由原来的面向C端转向面向B端,为客户提供整套语音交互方案,但同时既有的方糖音箱也独立销售,只是米唐已将全部投入都放在方案上。

具体而言,针对没有技术的客户,米唐能够提供一整套解决方案;针对研发能力较强的公司,米唐也可以出售部分软件,一起完成硬件落地的工作。

而在服务品类上,从今年起,也由智能音箱服务于整个制造业,音箱、耳机、车载都是米唐的发力方向。公司目前正在服务数十家各种类型的企业研发制造语音交互产品,一年出货量累计可达数十万台。

在营收方面,宋少鹏谈到,品牌产品的营收已经占到个位数,基本都在方案上。由于去年整个Alexa的产品没有出货,也主要以投入为主,今年的营收则比去年多了好几倍,目前已经实现了收支平衡。

苹果谷歌“包袱”太重

我们总谈到,一家公司的基因有时候就决定了能不能做成这件事。而宋少鹏则用基因论分析了为何亚马逊可以在智能语音上一举成名,相反在语音领域走在前面的苹果和谷歌却慢了很多。

在宋少鹏看来,苹果谷歌的“包袱”太重。比如苹果的Siri尽管很早就推出了,但是它是围绕触摸屏来做的,你问它什么都给你用“文字”来显示,Siri的所有创新都是围绕苹果的既得利益来做的,而正是使苹果取得成功的触摸屏也成为了它进入语音交互时代的“包袱”。谷歌也是如此。

但亚马逊是没有既得利益的,因为它做手机、做平板都失败了。亚马逊的出发点就是语音,它需要找语音最能落地的场景,而美国人对音乐、音箱有天然的需要,以及流媒体的体验,因此音箱就成为一个可落地的点。正因为亚马逊没有既得利益,它从零开始, 充分考虑场景和用户体验,才能做到这么成功。

其实这样的例子比比皆是,比如如果微信是在QQ的基础上去做,能否取得今天的成功恐怕就要打个问号了。再比如微软做手机也一直不是很成功,原因难道不是因为其出发点总是Windows的既得利益吗?可见有时候创新必须要摆脱现有包袱,从零开始,才能取得更大的突破。

智能音箱是蓝牙音箱的升级

有人认为智能音箱是一个全新的品类,主要在于智能化,也有人认为智能音箱是既有音箱的升级,那么宋少鹏又是如何看待的呢?

宋少鹏认为智能音箱是蓝牙音箱的升级,而不是凭空制造的,所有的消费电子产品都是原有产品的升级才有更大的市场。比如iPhone是在之前功能机基础上的升级,特斯拉是在之前燃油车基础上的升级。

按此思路,智能音箱则是传统蓝牙音箱的升级,只有在这个品类的基础上才能开拓更多的市场。那是否意味着智能音箱首先要是一台音箱呢?

关于国内的智能音箱市场,宋少鹏认为阿里、京东、小米等大公司掀起的价格战,对于市场而言是一见好事,能够降低用户的尝试门槛,进而教育市场。但目前国内语音交互系统做的还不够成熟,他的一些客户也在等巨头公司系统打磨成熟后接入,进入国内市场。

关于智能音箱在国内的发展,他认为某种程度上可以参考手机的发展曲线,比如iPhone 4代在中国刚刚半普及,而全年普及是iPhone 5、iPhone6,可见深入三四线城市需要一个较长的过程。即使今年国内市场可以做到百万台,渗透到三四线城市仍需要时间。

国内尚处初期 但前景广阔

深圳做为一个出口导向的城市,已经有近百家的音箱企业在周边生产,通过接入亚马逊Alexa或者Google Assistant进而出口海外,仅仅米唐科技的客户已经有数十家。

而目前国内市场则还处于早期,一方面国内智能音箱市场还很小,另一方面阿里、京东、小米等大企业展开的价格战,提升了国内智能音箱的入局门槛。国内智能音箱的品牌玩家也仅有一二十家。

但是宋少鹏看好国内语音应用的前景,也看好国内市场。“从历史来看,以美国为主的约3.5亿人口,加上欧洲7亿多人口,这个市场支撑起来的股市、期货、原油、大宗商品的价值是巨大的;而中国有14亿人口,基本完成城镇化,基本普及大学教育,正在进行消费升级,所形成的市场一定数倍于欧美市场,在这个大环境下去做创新,去深耕的机会是非常大的”,他总结到。

本文为转载内容,授权事宜请联系原著作权人。