正在阅读:

猎豹转型:主攻“智能机器人”

扫一扫下载界面新闻APP

猎豹转型:主攻“智能机器人”

履新后的傅盛,决定实现他的人工智能机器人梦。

本文首发于金融之家

文|牟云飞

猎豹移动联合旗下人工智能公司猎户星空,昨晚在北京水立方举行“3.21机器人之夜”发布会,发布自主研发的猎户机器人平台Orion OS,并推出五款全系列机器人产品:接待机器人豹小秘、零售机器人豹小贩、儿童陪伴机器人豹豹龙、小豹AI音箱和无人值守的咖啡店豹咖啡。

这也是傅盛接替任雷军任猎豹董事长后的首次亮相。

猎豹移动3月15日曾公告,公司CEO傅盛将接替雷军出任董事长。猎豹原董事长、董事雷军向董事会递交辞呈,不再担任董事长和董事职务,但是将继续担任猎豹移动的顾问。

雷军此前同时担任金山董事局主席,调整后,金山系和腾讯系管理团队或将淡出猎豹管理。金山软件和腾讯集团将其部分投票权转移至傅盛。目前,傅盛及团队在猎豹中的表决权为45%。

履新后的傅盛,决定实现他的人工智能机器人梦。

他借用了马斯克做火箭公司SpaceX的故事,并在水立方跳水来表决心:永不放弃。他以当下最火的机器人娇娇和索菲亚为例,一度被外界认为全世界没有一家公司能做到真正的对话水平。

"在各大电视台频繁表演的所谓的人工智能机器人,它可以很机智的回复。但事实上,它是由后台的一个真人来配音的,大家听到的声音类似于手机上的变音软件,配音的人通过摄像头坐在远程监控室里,装扮成机器人。

要想模仿人类,有手有脚,能走会说,这样的机器人是很难完成的任务。傅盛说,人类太复杂,是进化了几亿年的完美“产品”,虽然能单点被超越,但从整体系统上,想模仿都很难。现在的机器人行业,技术还处于极早期,造价又昂贵,很难被用户所接纳。

为了机器人之夜,傅盛特意拉来朋友圈好友站台,有小米联合创始人王川、经纬中国创始管理合伙人张颖、58同城网CEO姚劲波、紫牛基金创始合伙人张泉灵、锤子科技CEO罗永浩等“大咖”前来助阵。

在发布会现场,傅盛表示,我们为今天的发布会准备了好久。我从股东腾讯视频上找到的一段视频,一个在各大电视台频繁表演的所谓的人工智能机器人。

做一个机器人比我们想象的都难,很多从业者说:“傅盛,你做机器人是不是异想天开?你只做过互联网软件,你没有做过硬件,你又不是人工智能博士出生,你凭什么做机器人?”

我的导师雷军说过:人因梦想而伟大。他非常支持我这次在机器人上的豪赌,虽然他今天因为在香港开董事会没有办法来到现场,但也委派了小米的合伙人王川一起跟我见证这个时刻。

我们是何其幸运的一代,互联网就是全人类的头脑风暴。如果没有互联网,我很难想象我在江西景德镇这么一个小城市生活了17年,我有机会站在全球的舞台上和大家一起讨论高科技、机器人。

我一直问自己:即使今天全球已经有6亿用户每个月在使用着猎豹移动的APP,我们在全世界已是最大的安卓工具软件开发商。我们的游戏在全球有11亿下载量,其中大多数为青少年。

但是做一个机器人非常难,它是跨越行业,有的行业甚至不够了解,比如机械制造、人工智能。但是这也正是我的机会,因为还有体验和互联网应用是我和猎豹花了很长时间去积累的,我自己从一个很小的产品经理开始,一点一滴地打磨用户体验,我成为了今天中国最大的安全软件最早期的贡献者,让它成为了从国内冲到海外,乃至全球的工具软件。

机器人本质上是通过用户思维和产品思维结合今天的人工智能,和中国最有优势的机械制造的一个跨界行业,虽然不一定我能做成,但是我真的觉得还是有机会。

为了让我们的机器人往前冲,我们单独成立了一家公司,叫猎户星空。在冬天抬头看着满天的星斗,最大、最明亮的一个星座就是猎户座。人类发往火星的第一艘载人飞船的名称也叫猎户号,我是如此钟爱这个名字,于是就把我们最钟爱的产品放在这家公司,亲力打造。

这个是波士顿动力的机器人,可以做漂亮的后空翻,还有日本的ASIMO(日本本田机器人),我到现场看过它的表演。其实,波士顿动力被Google公司都卖掉了,我和相关的人去讨论这个问题,得出结论:今天的机械控制还是一个非常复杂的系统工程,技术进步也非常缓慢。

我通过各种渠道知道,这些动力基本上半个小时就得去充电。比如说日本ASIMO机器人,已经研制了30年,至今不能走向家用,据说成本高达80万美金。

今天我们看到的所有机器人,表情很有特点,造价很高,就像一个录音机一样,录一句、说一句、回答一句,这并不是人工智能。为什么会这样?为了弄清楚这个问题,我专门去过两次日本,并把这款机器人的团队中很多人都见了一遍。

孙正义当年花了很多心血,想做成的一款机器人,叫pepper,这款机器人被日本首相带去了G7峰会,作为日本国力的一种展示。

当我们要做一件事情的时候,你的整个人体的协调系统,会用你没有想到的方式,在高速运转。你的耳和眼要去探听外界的环境,你的嘴要去进行询问、挖掘更多的信息,你的脑要进行快速的决策和学习,最后再通过肌肉系统去完成那个动作。

我举一个小例子。比如说让AI机器人执行这句话:“服务员,帮我倒一杯红酒。”现在全世界没有一家公司能让一个AI机器人做到说完句话红酒就来了,除非那种固定轨道类型的机械,我们强调的是AI机器人。

听觉:人的耳朵是一个非常了不起的感受器官,可以在嘈杂的环境中,听到一个人说话,便立刻只识别他的声音,不听别人的无效声音;在你低头玩手机的时候,别人跟你说什么,你完全听不见,在你想要听到一些话语的时候,可以排除很多噪音去找到那个核心点。

今天没有一个麦克风能超越这个感受器官,在噪声环境中听到“帮我倒一杯红酒”既能知道是对我说的,又能把语义给理解了。

使得机器人看你一眼就知道你在哪里、是什么样子,也非常难。为什么呢?因为可能在昏黄的灯光下,你可能只给它一个侧脸,或各种其他复杂情况。

视觉:一个AI产品的摄像头有多好,都是在特定的光照下;人脸识别,AI超越了人,也是在特定的环境下,比如说特定的光照、特定的照片形式,或者限定在白天。

而人眼,即便是在晚上,只点一根蜡烛也能够清晰地认出你,没有噪点(将光线作为接收信号并输出的过程中所产生的图像中的粗糙部分,也指图像中不该出现的外来像素,通常由电子干扰产生),人的眼睛有5亿像素,今天你买到最好的手机也就2000万像素。

很多人在谈论人工智能取代人,如果人真的是上帝创造的,那上帝就是一个不可超越的产品经理。

今天大家都称手机为智能手机,但是和机器人相比,它并不智能。手机执行每一个指令必须要人去点击它,而机器人应该是站在那里,当环境发生变化的时候,它主动来做一些事情,你就会发现AI的传感器、语言、脑、计算能力、深度学习都与人类有相当大的距离。

人工智能还很年幼,如果我们要使用人工智能技术去做一件很小的事情,比如学一句话、认一个人脸,我们设计出品了小豹、小雅(都是AI音响),我们动用了大量人力去标注数据,让机器去学习。今天整个AI产业处在非常早期阶段,整个行业里,找不到一款真正有用的机器人的现状。

我跟机器人领域的很多从业者沟通的时候,大家都特别有热情。人是一个近乎完美的产品,但是我们并不需要一个近乎完美的产品,我们可以找到我们真正需要的产品。

人是这么难以超越。第一,我们的产品并不一定像人,今天在市面上不管是日本的pepper机器人,还是所有在机场看到的永远不开机的机器人,或者在某些专卖店里看的,它一定要找一双手,我觉得手很有用,手的关节是非常多的,成本也非常高。

第二,通用机器人非常难,我们能不能做出一款在特定场景真的有用的机器人呢?如果让用户真的觉得它对我有点价值,能不能从一个小众的、边缘的市场切入,去找到这样的用户需求呢?

第三,由于产业尚在早期,为了做到真有用,就得下笨功夫,去打造每一个细节。比如说语音唤醒技术,今天市面上有各种各样的开放平台,它并不像一些开放平台已有10年时间了,他们也刚刚开始,所以它能满足你的需求是非常少的。

今天整个机器人行业就是得把每一个细节做好。我去日本以后,讨论了pepper机器人到底是怎么做出来的,我发现它的语音系统是采购了别人的;买了一家法国公司,把形体技术集成过来;视觉技术也不是自己做的。这导致了那个机器人在场景中、形式上很讨巧,但5分钟以后,就发现没有什么用了。

今天全世界也没有一家公司能够做到人类真正的语义对话能力。所以,我们的目标就是为真有用的机器人而生,不要去讲什么像人和不像人,技术要怎么比,我们在像做手机一样给用户做一款他真正需要的产品。我们从2年前开始,把每一个系统的细节的能力,都变成一项产品,对市场推出,和用户见面。

猎豹移动五大机器人介绍:

产品一:豹小秘接待机器人

1.显示器

我记得和罗永浩讨论的时候,他说人的脑是没有一个显示器的,要是有一个显示器的话,交流肯定更方便。所以我们实现你的愿望,在它脑门上加了一个显示器。使得它既可以做表情,也可以表达信息,不需要像pepper一样,在胸口加上一块屏幕。

2.头部可180°转动

我不想向雷总致敬,说没有设计是最好的设计。我们在每一个细节上是非常精心打磨的,我们做了一个能够180度转的云台,脑袋可以前后转,可以随时看着你,非常灵活地跟着你。

它从上到下全部都是感应器,从脑袋上最开始有一个广角摄像头。前面、胸口加了一个立体摄像机,脖子上加了6个麦克,在头顶上加了2个麦克,底下是我们的导航平台、激光雷达,所有这些感知,都是能够让它在一个环境当中,找到你、跟随你、引领你,并且避开所有避障。

我们拆了很多机器人,传感器最丰富、而且要协调运行得好。为了这一整套传播,我们也想过购买一套技术,最后发现很难。我们自己做了人脸识别算法(其实是人脸+人体识别算法),它不仅能够看到你的人脸,还会根据你人体的形状进行识别,当你转身的时候,他就知道。

人不是完全靠人脸去认识人的,当一个人走进的时候,你看他的形体、样子、步伐就能够认出他,你光靠人脸去找一个人,这件事情在现实场景当中,失败率会非常高。因此,我们融合了整个人体识别的技术。

3.自主语音合成技术

我们自主研发了TTS语音合成,就是你在电脑里打出一段文字,电脑就把这段文字念出来,不是通过录音完成的。我们和其他公司最大思路不同,就是花了大量的人力打磨声音。

我们找到发音人以后,让他一句句录下来,让电脑学习,然后让几十人参与标注,比如重音节、语气昂扬、疑问等等,花了一年的时间,打磨了自主语音合成技术。

4.导航系统

我们还做了导航系统。这个导航系统首先叫多传感器融合。我们说人眼是非常牛的,一双眼睛既解决看脸的问题,又能解决开车的问题,还能解决晚上找东西的问题,但今天传感器做不到。

这就需要优化算法,我们用激光传感器、视觉传感器、超声波传感器的融合,虽然离人眼还有很大差距。在没有那么强的光照、没有那么高速度的情况下,我们已是业内最好的导航平台之一了,成本比市面上很多产品成本要低。

一个激光传感器装在无人车上要几十万的成本,但我们成本大概是对方的十几分之一,甚至几十分之一,以这样的价格实现了这些功能。

我们受邀参加了GTC日本机器人比赛,英伟达的黄仁勋看了我们产品后非常感兴趣,要求我们在他们的展台上去运动。日本的公司,没有哪一家能够做出在场地上来回自主巡航的导航产品。

5.语义能力

什么是语义能力呢?比如“服务员请帮我倒一杯水”,当机器人明白“倒一杯水”这个词时,这就叫语义能力,这是世界级的难点。

我们的做法就是针对用户问的最多的问题,去精细打磨。我们在合作伙伴的音箱类产品上,包括小雅,我们针对用户的语言,比如“我想听哪首歌”、“听哪一个评书”,做了大量的优化,让机器去理解这里的语义。

今天谈智能交流,我去了pepper后,跟首席产品经理交谈,他说日本pepper要做成一个情感陪护机器人时,我觉得这款机器人基本上没有机会,只能把它做成一个真正接受你的指令,帮助你完成一些任务,像一个摇控器、一个搜索引擎一样,通过语音能够做的非常好。

6.算力

我们在机器人里面放了三块芯片(高通的821、英伟达的TX1、英伟达的TK1),我们的运算能力达到了2T的Flops,相当于3.5个iPhoneX的运算能力,为什么?因为它要感知周围的环境。

人脑是很了不起的,我们开车用一个非常小的能耗就完成对复杂环境的判断,而在机器人身上要用很多芯片,还要优化算法,才能让它变得很流畅,要让芯片间能够衔接的非常好,我们还做了很多协调工作。

我们还往它肚子了加了很多电池,通过实测,它比手机还耐电,不需要充电桩,也不喊累,也不需要充电,头部非常灵活,有很多很多的传感器,这些是为了能够很好的完成接待任务。

7.开箱即用

机器人该怎么开始一个任务呢?我们曾在市面上买了一台新鲜出炉的15万的机器人,打开后一群人围着它,十几分钟不知道怎么用,后来我们就委派了一个工程师,花了一天时间,接上PC、下载软件、学习教程。最后终于知道怎么用了。

有一个重要工作是建图,建图就是让机器人知道这个环境是怎么回事的一个过程,我们把它做的像一个手机APP一样,打开手机进行前后左右操作,跟着它,带它走一圈回来,它就可以为你工作了。

只要机器人视觉里面形成的一幅地图,它就知道哪里有墙、有东西,再通过这样的环境,它才会知道带你去哪个会议室。

我们要定制任务的时候,把它做得非常简单,只需在手机或是Pad上点击,就可以给它制定一个又一个的任务。这些任务你不需要编写代码了,只要点一个加好,新建一个任务,和建立一个PPT没有什么区别。

我们要做一款有用又智能的机器人,跨界非常难,要融合很多技术。正是因为跨界,今天市面上机器人的价格非常贵,我们内部讨论了很久。想做到什么价格呢?我们用自动充电、五星级接待、麦克风阵列是自己做的,内部还用了汽车上用的Canbus总线,使得整个上下系统间的接触非常好。我们决定用一个月2999的租金让大家体验这款豹小秘,日本pepper需要3年的锁定期,我们一个月就可以开始起租体验。

我们也和58同城首家合作机器人租赁频道,可以到58同城上直接租赁豹小秘。除接待场景下的豹小秘外,豹小贩、豹豹龙两款更贴近日常生活。豹小贩零售机器人是一款全自主移动零售机器人,堪称“会行走的售卖机”。

豹小贩可以通过识别系统,在大型商场、图书馆和游乐场等复杂环境中主动寻找目标顾客,投其所好进行产品推销。此前电子科技大学图书馆30天的实测,豹小贩以3倍的销售成绩远高于传统自动贩卖机。

产品三:陪伴童年的豹豹龙(见上图)

豹豹龙与我儿时“阿童木”的梦想有关。我希望每个人的身边都有一个“阿童木”的陪伴,沿用猎户机器人平台的技术,让这一梦想走向现实。

豹豹龙是儿童陪伴场景下的机器人。产品具备可爱的外形和逼真的“真童声”,可以做到24小时安全陪护,危险实时提醒。

豹豹龙还与编程猫、VIPKID和家有学霸等全国领先的儿童教育平台建立合作,拥有覆盖0-12岁全年龄段的权威优质少儿课程,真正做到寓教于乐。豹豹龙售价为9999元,相当于一部iPhone X的价格,就可以给孩子一个有陪伴的童年。

产品四:小豹AI音箱盲测NO.1。

猎豹移动的音箱更看重的是音质。内置5个扬声器,高于行业2个的配置标准,且单个扬声器成本是友商的5倍,这奠定了小豹AI音箱的硬件基础。在此前的百人音质听感盲测中,小豹AI音箱以绝对优势夺魁。小豹AI音箱现已开启抢先预定,售价499元。

小豹AI音箱现已经接入QQ音乐1700万的行业内最全音乐曲库,此外包括喜马拉雅、樊登读书会、腾讯新闻、蜻蜓FM等1亿+有声内容源,同时设有包含张怡筠情商教育、凯叔讲故事等在内的行业最全的400W+儿童内容。

小豹AI音箱是国内首款融合区块链技术的智能音箱,推出“智能链”。用户可以通过购买和使用小豹AI音箱,加入到“智能链”中,一方面享受小豹AI音箱的个性化人工智能服务;也让每个人帮助AI进化获取AI积分,深度的参与到人工智能建设中。

猎豹还将猎户语音OS开放给众多合作伙伴,包括小米、喜马拉雅、美的、富士康在内的多家公司都基于猎户语音OS,推出了智能音箱。

本文为转载内容,授权事宜请联系原著作权人。

猎豹移动

  • 周鸿祎傅盛决裂16年后首度同台,还预测了大模型的这些趋势
  • 北京金山安全软件公司增资至1亿元,增幅1150%

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

猎豹转型:主攻“智能机器人”

履新后的傅盛,决定实现他的人工智能机器人梦。

本文首发于金融之家

文|牟云飞

猎豹移动联合旗下人工智能公司猎户星空,昨晚在北京水立方举行“3.21机器人之夜”发布会,发布自主研发的猎户机器人平台Orion OS,并推出五款全系列机器人产品:接待机器人豹小秘、零售机器人豹小贩、儿童陪伴机器人豹豹龙、小豹AI音箱和无人值守的咖啡店豹咖啡。

这也是傅盛接替任雷军任猎豹董事长后的首次亮相。

猎豹移动3月15日曾公告,公司CEO傅盛将接替雷军出任董事长。猎豹原董事长、董事雷军向董事会递交辞呈,不再担任董事长和董事职务,但是将继续担任猎豹移动的顾问。

雷军此前同时担任金山董事局主席,调整后,金山系和腾讯系管理团队或将淡出猎豹管理。金山软件和腾讯集团将其部分投票权转移至傅盛。目前,傅盛及团队在猎豹中的表决权为45%。

履新后的傅盛,决定实现他的人工智能机器人梦。

他借用了马斯克做火箭公司SpaceX的故事,并在水立方跳水来表决心:永不放弃。他以当下最火的机器人娇娇和索菲亚为例,一度被外界认为全世界没有一家公司能做到真正的对话水平。

"在各大电视台频繁表演的所谓的人工智能机器人,它可以很机智的回复。但事实上,它是由后台的一个真人来配音的,大家听到的声音类似于手机上的变音软件,配音的人通过摄像头坐在远程监控室里,装扮成机器人。

要想模仿人类,有手有脚,能走会说,这样的机器人是很难完成的任务。傅盛说,人类太复杂,是进化了几亿年的完美“产品”,虽然能单点被超越,但从整体系统上,想模仿都很难。现在的机器人行业,技术还处于极早期,造价又昂贵,很难被用户所接纳。

为了机器人之夜,傅盛特意拉来朋友圈好友站台,有小米联合创始人王川、经纬中国创始管理合伙人张颖、58同城网CEO姚劲波、紫牛基金创始合伙人张泉灵、锤子科技CEO罗永浩等“大咖”前来助阵。

在发布会现场,傅盛表示,我们为今天的发布会准备了好久。我从股东腾讯视频上找到的一段视频,一个在各大电视台频繁表演的所谓的人工智能机器人。

做一个机器人比我们想象的都难,很多从业者说:“傅盛,你做机器人是不是异想天开?你只做过互联网软件,你没有做过硬件,你又不是人工智能博士出生,你凭什么做机器人?”

我的导师雷军说过:人因梦想而伟大。他非常支持我这次在机器人上的豪赌,虽然他今天因为在香港开董事会没有办法来到现场,但也委派了小米的合伙人王川一起跟我见证这个时刻。

我们是何其幸运的一代,互联网就是全人类的头脑风暴。如果没有互联网,我很难想象我在江西景德镇这么一个小城市生活了17年,我有机会站在全球的舞台上和大家一起讨论高科技、机器人。

我一直问自己:即使今天全球已经有6亿用户每个月在使用着猎豹移动的APP,我们在全世界已是最大的安卓工具软件开发商。我们的游戏在全球有11亿下载量,其中大多数为青少年。

但是做一个机器人非常难,它是跨越行业,有的行业甚至不够了解,比如机械制造、人工智能。但是这也正是我的机会,因为还有体验和互联网应用是我和猎豹花了很长时间去积累的,我自己从一个很小的产品经理开始,一点一滴地打磨用户体验,我成为了今天中国最大的安全软件最早期的贡献者,让它成为了从国内冲到海外,乃至全球的工具软件。

机器人本质上是通过用户思维和产品思维结合今天的人工智能,和中国最有优势的机械制造的一个跨界行业,虽然不一定我能做成,但是我真的觉得还是有机会。

为了让我们的机器人往前冲,我们单独成立了一家公司,叫猎户星空。在冬天抬头看着满天的星斗,最大、最明亮的一个星座就是猎户座。人类发往火星的第一艘载人飞船的名称也叫猎户号,我是如此钟爱这个名字,于是就把我们最钟爱的产品放在这家公司,亲力打造。

这个是波士顿动力的机器人,可以做漂亮的后空翻,还有日本的ASIMO(日本本田机器人),我到现场看过它的表演。其实,波士顿动力被Google公司都卖掉了,我和相关的人去讨论这个问题,得出结论:今天的机械控制还是一个非常复杂的系统工程,技术进步也非常缓慢。

我通过各种渠道知道,这些动力基本上半个小时就得去充电。比如说日本ASIMO机器人,已经研制了30年,至今不能走向家用,据说成本高达80万美金。

今天我们看到的所有机器人,表情很有特点,造价很高,就像一个录音机一样,录一句、说一句、回答一句,这并不是人工智能。为什么会这样?为了弄清楚这个问题,我专门去过两次日本,并把这款机器人的团队中很多人都见了一遍。

孙正义当年花了很多心血,想做成的一款机器人,叫pepper,这款机器人被日本首相带去了G7峰会,作为日本国力的一种展示。

当我们要做一件事情的时候,你的整个人体的协调系统,会用你没有想到的方式,在高速运转。你的耳和眼要去探听外界的环境,你的嘴要去进行询问、挖掘更多的信息,你的脑要进行快速的决策和学习,最后再通过肌肉系统去完成那个动作。

我举一个小例子。比如说让AI机器人执行这句话:“服务员,帮我倒一杯红酒。”现在全世界没有一家公司能让一个AI机器人做到说完句话红酒就来了,除非那种固定轨道类型的机械,我们强调的是AI机器人。

听觉:人的耳朵是一个非常了不起的感受器官,可以在嘈杂的环境中,听到一个人说话,便立刻只识别他的声音,不听别人的无效声音;在你低头玩手机的时候,别人跟你说什么,你完全听不见,在你想要听到一些话语的时候,可以排除很多噪音去找到那个核心点。

今天没有一个麦克风能超越这个感受器官,在噪声环境中听到“帮我倒一杯红酒”既能知道是对我说的,又能把语义给理解了。

使得机器人看你一眼就知道你在哪里、是什么样子,也非常难。为什么呢?因为可能在昏黄的灯光下,你可能只给它一个侧脸,或各种其他复杂情况。

视觉:一个AI产品的摄像头有多好,都是在特定的光照下;人脸识别,AI超越了人,也是在特定的环境下,比如说特定的光照、特定的照片形式,或者限定在白天。

而人眼,即便是在晚上,只点一根蜡烛也能够清晰地认出你,没有噪点(将光线作为接收信号并输出的过程中所产生的图像中的粗糙部分,也指图像中不该出现的外来像素,通常由电子干扰产生),人的眼睛有5亿像素,今天你买到最好的手机也就2000万像素。

很多人在谈论人工智能取代人,如果人真的是上帝创造的,那上帝就是一个不可超越的产品经理。

今天大家都称手机为智能手机,但是和机器人相比,它并不智能。手机执行每一个指令必须要人去点击它,而机器人应该是站在那里,当环境发生变化的时候,它主动来做一些事情,你就会发现AI的传感器、语言、脑、计算能力、深度学习都与人类有相当大的距离。

人工智能还很年幼,如果我们要使用人工智能技术去做一件很小的事情,比如学一句话、认一个人脸,我们设计出品了小豹、小雅(都是AI音响),我们动用了大量人力去标注数据,让机器去学习。今天整个AI产业处在非常早期阶段,整个行业里,找不到一款真正有用的机器人的现状。

我跟机器人领域的很多从业者沟通的时候,大家都特别有热情。人是一个近乎完美的产品,但是我们并不需要一个近乎完美的产品,我们可以找到我们真正需要的产品。

人是这么难以超越。第一,我们的产品并不一定像人,今天在市面上不管是日本的pepper机器人,还是所有在机场看到的永远不开机的机器人,或者在某些专卖店里看的,它一定要找一双手,我觉得手很有用,手的关节是非常多的,成本也非常高。

第二,通用机器人非常难,我们能不能做出一款在特定场景真的有用的机器人呢?如果让用户真的觉得它对我有点价值,能不能从一个小众的、边缘的市场切入,去找到这样的用户需求呢?

第三,由于产业尚在早期,为了做到真有用,就得下笨功夫,去打造每一个细节。比如说语音唤醒技术,今天市面上有各种各样的开放平台,它并不像一些开放平台已有10年时间了,他们也刚刚开始,所以它能满足你的需求是非常少的。

今天整个机器人行业就是得把每一个细节做好。我去日本以后,讨论了pepper机器人到底是怎么做出来的,我发现它的语音系统是采购了别人的;买了一家法国公司,把形体技术集成过来;视觉技术也不是自己做的。这导致了那个机器人在场景中、形式上很讨巧,但5分钟以后,就发现没有什么用了。

今天全世界也没有一家公司能够做到人类真正的语义对话能力。所以,我们的目标就是为真有用的机器人而生,不要去讲什么像人和不像人,技术要怎么比,我们在像做手机一样给用户做一款他真正需要的产品。我们从2年前开始,把每一个系统的细节的能力,都变成一项产品,对市场推出,和用户见面。

猎豹移动五大机器人介绍:

产品一:豹小秘接待机器人

1.显示器

我记得和罗永浩讨论的时候,他说人的脑是没有一个显示器的,要是有一个显示器的话,交流肯定更方便。所以我们实现你的愿望,在它脑门上加了一个显示器。使得它既可以做表情,也可以表达信息,不需要像pepper一样,在胸口加上一块屏幕。

2.头部可180°转动

我不想向雷总致敬,说没有设计是最好的设计。我们在每一个细节上是非常精心打磨的,我们做了一个能够180度转的云台,脑袋可以前后转,可以随时看着你,非常灵活地跟着你。

它从上到下全部都是感应器,从脑袋上最开始有一个广角摄像头。前面、胸口加了一个立体摄像机,脖子上加了6个麦克,在头顶上加了2个麦克,底下是我们的导航平台、激光雷达,所有这些感知,都是能够让它在一个环境当中,找到你、跟随你、引领你,并且避开所有避障。

我们拆了很多机器人,传感器最丰富、而且要协调运行得好。为了这一整套传播,我们也想过购买一套技术,最后发现很难。我们自己做了人脸识别算法(其实是人脸+人体识别算法),它不仅能够看到你的人脸,还会根据你人体的形状进行识别,当你转身的时候,他就知道。

人不是完全靠人脸去认识人的,当一个人走进的时候,你看他的形体、样子、步伐就能够认出他,你光靠人脸去找一个人,这件事情在现实场景当中,失败率会非常高。因此,我们融合了整个人体识别的技术。

3.自主语音合成技术

我们自主研发了TTS语音合成,就是你在电脑里打出一段文字,电脑就把这段文字念出来,不是通过录音完成的。我们和其他公司最大思路不同,就是花了大量的人力打磨声音。

我们找到发音人以后,让他一句句录下来,让电脑学习,然后让几十人参与标注,比如重音节、语气昂扬、疑问等等,花了一年的时间,打磨了自主语音合成技术。

4.导航系统

我们还做了导航系统。这个导航系统首先叫多传感器融合。我们说人眼是非常牛的,一双眼睛既解决看脸的问题,又能解决开车的问题,还能解决晚上找东西的问题,但今天传感器做不到。

这就需要优化算法,我们用激光传感器、视觉传感器、超声波传感器的融合,虽然离人眼还有很大差距。在没有那么强的光照、没有那么高速度的情况下,我们已是业内最好的导航平台之一了,成本比市面上很多产品成本要低。

一个激光传感器装在无人车上要几十万的成本,但我们成本大概是对方的十几分之一,甚至几十分之一,以这样的价格实现了这些功能。

我们受邀参加了GTC日本机器人比赛,英伟达的黄仁勋看了我们产品后非常感兴趣,要求我们在他们的展台上去运动。日本的公司,没有哪一家能够做出在场地上来回自主巡航的导航产品。

5.语义能力

什么是语义能力呢?比如“服务员请帮我倒一杯水”,当机器人明白“倒一杯水”这个词时,这就叫语义能力,这是世界级的难点。

我们的做法就是针对用户问的最多的问题,去精细打磨。我们在合作伙伴的音箱类产品上,包括小雅,我们针对用户的语言,比如“我想听哪首歌”、“听哪一个评书”,做了大量的优化,让机器去理解这里的语义。

今天谈智能交流,我去了pepper后,跟首席产品经理交谈,他说日本pepper要做成一个情感陪护机器人时,我觉得这款机器人基本上没有机会,只能把它做成一个真正接受你的指令,帮助你完成一些任务,像一个摇控器、一个搜索引擎一样,通过语音能够做的非常好。

6.算力

我们在机器人里面放了三块芯片(高通的821、英伟达的TX1、英伟达的TK1),我们的运算能力达到了2T的Flops,相当于3.5个iPhoneX的运算能力,为什么?因为它要感知周围的环境。

人脑是很了不起的,我们开车用一个非常小的能耗就完成对复杂环境的判断,而在机器人身上要用很多芯片,还要优化算法,才能让它变得很流畅,要让芯片间能够衔接的非常好,我们还做了很多协调工作。

我们还往它肚子了加了很多电池,通过实测,它比手机还耐电,不需要充电桩,也不喊累,也不需要充电,头部非常灵活,有很多很多的传感器,这些是为了能够很好的完成接待任务。

7.开箱即用

机器人该怎么开始一个任务呢?我们曾在市面上买了一台新鲜出炉的15万的机器人,打开后一群人围着它,十几分钟不知道怎么用,后来我们就委派了一个工程师,花了一天时间,接上PC、下载软件、学习教程。最后终于知道怎么用了。

有一个重要工作是建图,建图就是让机器人知道这个环境是怎么回事的一个过程,我们把它做的像一个手机APP一样,打开手机进行前后左右操作,跟着它,带它走一圈回来,它就可以为你工作了。

只要机器人视觉里面形成的一幅地图,它就知道哪里有墙、有东西,再通过这样的环境,它才会知道带你去哪个会议室。

我们要定制任务的时候,把它做得非常简单,只需在手机或是Pad上点击,就可以给它制定一个又一个的任务。这些任务你不需要编写代码了,只要点一个加好,新建一个任务,和建立一个PPT没有什么区别。

我们要做一款有用又智能的机器人,跨界非常难,要融合很多技术。正是因为跨界,今天市面上机器人的价格非常贵,我们内部讨论了很久。想做到什么价格呢?我们用自动充电、五星级接待、麦克风阵列是自己做的,内部还用了汽车上用的Canbus总线,使得整个上下系统间的接触非常好。我们决定用一个月2999的租金让大家体验这款豹小秘,日本pepper需要3年的锁定期,我们一个月就可以开始起租体验。

我们也和58同城首家合作机器人租赁频道,可以到58同城上直接租赁豹小秘。除接待场景下的豹小秘外,豹小贩、豹豹龙两款更贴近日常生活。豹小贩零售机器人是一款全自主移动零售机器人,堪称“会行走的售卖机”。

豹小贩可以通过识别系统,在大型商场、图书馆和游乐场等复杂环境中主动寻找目标顾客,投其所好进行产品推销。此前电子科技大学图书馆30天的实测,豹小贩以3倍的销售成绩远高于传统自动贩卖机。

产品三:陪伴童年的豹豹龙(见上图)

豹豹龙与我儿时“阿童木”的梦想有关。我希望每个人的身边都有一个“阿童木”的陪伴,沿用猎户机器人平台的技术,让这一梦想走向现实。

豹豹龙是儿童陪伴场景下的机器人。产品具备可爱的外形和逼真的“真童声”,可以做到24小时安全陪护,危险实时提醒。

豹豹龙还与编程猫、VIPKID和家有学霸等全国领先的儿童教育平台建立合作,拥有覆盖0-12岁全年龄段的权威优质少儿课程,真正做到寓教于乐。豹豹龙售价为9999元,相当于一部iPhone X的价格,就可以给孩子一个有陪伴的童年。

产品四:小豹AI音箱盲测NO.1。

猎豹移动的音箱更看重的是音质。内置5个扬声器,高于行业2个的配置标准,且单个扬声器成本是友商的5倍,这奠定了小豹AI音箱的硬件基础。在此前的百人音质听感盲测中,小豹AI音箱以绝对优势夺魁。小豹AI音箱现已开启抢先预定,售价499元。

小豹AI音箱现已经接入QQ音乐1700万的行业内最全音乐曲库,此外包括喜马拉雅、樊登读书会、腾讯新闻、蜻蜓FM等1亿+有声内容源,同时设有包含张怡筠情商教育、凯叔讲故事等在内的行业最全的400W+儿童内容。

小豹AI音箱是国内首款融合区块链技术的智能音箱,推出“智能链”。用户可以通过购买和使用小豹AI音箱,加入到“智能链”中,一方面享受小豹AI音箱的个性化人工智能服务;也让每个人帮助AI进化获取AI积分,深度的参与到人工智能建设中。

猎豹还将猎户语音OS开放给众多合作伙伴,包括小米、喜马拉雅、美的、富士康在内的多家公司都基于猎户语音OS,推出了智能音箱。

本文为转载内容,授权事宜请联系原著作权人。