正在阅读:

李彦宏称百度无人驾驶四项指标已居第一

扫一扫下载界面新闻APP

李彦宏称百度无人驾驶四项指标已居第一

李彦宏表示,人工智能是百度核心的核心,过去百度花了很大的精力投入到人工智能。

9月1日,一年一度的百度世界大会在北京开幕。

百度CEO李彦宏在会上做了关于人工智能的主题演讲。李彦宏表示,人工智能是百度核心的核心,过去百度花了很大的精力投入到人工智能,也就是三年前曾提过的百度大脑。

而百度大脑有什么样的功能?对百度来说,重点有四个——语言、图像、自然语言、用户画像。

据李彦宏介绍,具体来说,语音的能力包括语音识别能力和语音合成能力。

图像能力,指的是看到一个图片,不仅能看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。

自然语言处理能力,比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。

用户画像在传统的AI中并不是主流,但是今天,每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

以下是李彦宏演讲实录:

百度世界大会今年的主题聚焦在人工智能,我的主题演讲也将围绕人工智能。今年六月在联盟峰会上我讲了一个“互联网的下一步”的概念:互联网在这之前是PC互联网,第二个阶段是移动互联网阶段,随着上网渗透率越来越高,每一个上网的人都有一个智能手机,这意味着未来互联网的增长不能砸靠人口红利。

我们国家现在的新常态希望用互联网+,我们互联网的从业者深深感觉到了危机,就是因为过去粗放的阶段已经接受了,下一步是什么?就是我们说的人工智能。

人工智能是百度核心的核心,过去百度花了很大的精力投入到人工智能,这对百度意味着四个字,百度大脑。

三年前,我们对外讲过百度大脑已经具有两三岁的智力,今年人工智能火起来了,又很多人问我百度大脑现在多少岁了?其实我也不知道,因为人脑和电脑还是有很大的区别,百度大脑和人的发育过程还是很不一样。

百度大脑是有三个大组成部分,第一个是人工智能的算法,模拟人的神经元网络,我们已经使用了万亿级的参数,人脑是千亿级的;第二个组成部分是计算能力,现在我们使用了数十万台服务器,不是基于CPU的服务,而是GPU;第三部分是数据,我们搜集了上万亿的网页内容,包括视频、音频、图像数据,百亿计的,每天数百亿次的网民定位请求。有了这三个百度大脑就可以开始工作了。

百度大脑有什么样的功能?我们今天重点介绍四个功能——语言、图像、自然语言、用户画像。

语言现在进入了比较成熟的阶段,识别的准备率很高,图像也是,属于人工智能的认知部分。自然语言的理解和处理更加难,除了认知能力,还要有推理和规划能力,用户画像的能力,从传统意义上讲,并不是人工智能的领域,但现在很多互联网公司有这个能力,把人描绘得非常清楚,也变成了百度大脑的功能。

具体来讲,语言分成分成两个方向,一个是语言的合成,一个是语音识别。百度的语音识别引擎的技术已经把准备率达到97%。当你有了这些准确率可以在什么领域怎么运用?我们举一个例子,一个销售的电话例子,很多公司都有电话销售的部门,但是销售行业流动性大,很多销售都是新来的,需要一段时间的培训,有经验的销售和一般的销售也是在效率上有很大的差别,我们怎样让新手能具备优秀销售的能力?过去就是把他的经验总结下来,让新的销售去背,有了高精度的语音识别之后,就能改变这种状况,让新的销售具备这种能力,用语音识别总结客户的问题,再告诉新的销售,有经验的销售是怎么回答问题的。

这是语音识别应用在企业中,它还有很多功能可以想象。还有一个是语音合成,今天语音合成和过去有了很大不同,它可以用人的方式把文字读出来,我们现在每天响应2.5亿次的语音请求,比如过去是看小说,现在是听小说。这种读小说和广播有什么不同?广播每个人听到都是一样的,语音合成是可以定制的,具备自然发声能力,能模拟一个自然人的表达方式,例如在百度地图的语音导航就是,其实里面的话我都没有说话,只是根据我平时说话来合成的李彦宏的声音。我们还能合成已经过世的人的声音,比如张国荣的声音。

为什么展示张国荣,因为很多人是张国荣的粉丝,而且合成他的声音比较难,因为他的国语比较少。有了这些功能,也就是说我们人人都能拥有属于自己的声音模型。

下面讲图像,图像是一个人工智能非常重要的领域,说到图像识别就想到人脸识别,现在准确率已经达到99.7%。人脸识别是怎么实现的,我们对人脸的关键点连接来做一个处理,当一个人的表情发生变化时,我们依然能识别他。除了面部识别,还有地图里的实景图,到今天的识别力也是很高了。

还有一个很重要的领域也是非常需要图像识别,就是无人驾驶汽车,无人驾驶汽车涉及很多技术,需要计算机视觉,环境感受,传感器融合、语音对话、规划决策、行动控制等,图像识别是最后一项功能。

去年我们展示过百度无人车试驾,过去我们花了很多精力在城市道路的运营上。车辆的检测我们现在按照国际标准,百度已经排到第一了,就是车辆跟踪六项指标四项第一。今年8月份KITTI评测的最新成绩显示,百度无人车在车辆检测中排名第一,车辆跟踪6项指标中取得4项第一。

还有一个领域是增强现实,这个有什么运用呢?我们的广告主认为可以有一种新型的广告形式。

第三是自然语言处理,一个例子就是去年百度世界大会的度秘,个人手机助理。度秘现在的语音和图像占比是56%,过去百度已经用度秘解说了一场篮球赛。还有一个是百度翻译。

第四个是用户画像,现在我们已经有十亿的用户画像,其中对他们的识别我们已经用到了千万级的标签,我们用两个方向,第一个是在垂直画像,一个是通用画像。有什么作用?例如手机百度用了百度用户画像,资讯推荐阅读量过去两个月增长了十倍,这是靠百度对用户打了61.5万个用户标签,每个人看到的信息和文章都是不一样的。

用户画像还有一个外部的例子,六月上映的电影魔兽,出品人是传奇影业,用了用户画像做了精准投放,提升它的票房。他把人群分成三类,他只能关心他可以影响的人群,比如摇摆要不要去看电影的,而不是去影响一定要去看电影的。

到这里,我基本已经把百度大脑的几个大功能呈现出来了。

未经正式授权严禁转载本文,侵权必究。

李彦宏

  • 百度放弃激光雷达?李彦宏要求无人出租转向纯视觉,和特斯拉抢时间
  • 9个月,百度换了第二个CFO

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

李彦宏称百度无人驾驶四项指标已居第一

李彦宏表示,人工智能是百度核心的核心,过去百度花了很大的精力投入到人工智能。

9月1日,一年一度的百度世界大会在北京开幕。

百度CEO李彦宏在会上做了关于人工智能的主题演讲。李彦宏表示,人工智能是百度核心的核心,过去百度花了很大的精力投入到人工智能,也就是三年前曾提过的百度大脑。

而百度大脑有什么样的功能?对百度来说,重点有四个——语言、图像、自然语言、用户画像。

据李彦宏介绍,具体来说,语音的能力包括语音识别能力和语音合成能力。

图像能力,指的是看到一个图片,不仅能看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。

自然语言处理能力,比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。

用户画像在传统的AI中并不是主流,但是今天,每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

以下是李彦宏演讲实录:

百度世界大会今年的主题聚焦在人工智能,我的主题演讲也将围绕人工智能。今年六月在联盟峰会上我讲了一个“互联网的下一步”的概念:互联网在这之前是PC互联网,第二个阶段是移动互联网阶段,随着上网渗透率越来越高,每一个上网的人都有一个智能手机,这意味着未来互联网的增长不能砸靠人口红利。

我们国家现在的新常态希望用互联网+,我们互联网的从业者深深感觉到了危机,就是因为过去粗放的阶段已经接受了,下一步是什么?就是我们说的人工智能。

人工智能是百度核心的核心,过去百度花了很大的精力投入到人工智能,这对百度意味着四个字,百度大脑。

三年前,我们对外讲过百度大脑已经具有两三岁的智力,今年人工智能火起来了,又很多人问我百度大脑现在多少岁了?其实我也不知道,因为人脑和电脑还是有很大的区别,百度大脑和人的发育过程还是很不一样。

百度大脑是有三个大组成部分,第一个是人工智能的算法,模拟人的神经元网络,我们已经使用了万亿级的参数,人脑是千亿级的;第二个组成部分是计算能力,现在我们使用了数十万台服务器,不是基于CPU的服务,而是GPU;第三部分是数据,我们搜集了上万亿的网页内容,包括视频、音频、图像数据,百亿计的,每天数百亿次的网民定位请求。有了这三个百度大脑就可以开始工作了。

百度大脑有什么样的功能?我们今天重点介绍四个功能——语言、图像、自然语言、用户画像。

语言现在进入了比较成熟的阶段,识别的准备率很高,图像也是,属于人工智能的认知部分。自然语言的理解和处理更加难,除了认知能力,还要有推理和规划能力,用户画像的能力,从传统意义上讲,并不是人工智能的领域,但现在很多互联网公司有这个能力,把人描绘得非常清楚,也变成了百度大脑的功能。

具体来讲,语言分成分成两个方向,一个是语言的合成,一个是语音识别。百度的语音识别引擎的技术已经把准备率达到97%。当你有了这些准确率可以在什么领域怎么运用?我们举一个例子,一个销售的电话例子,很多公司都有电话销售的部门,但是销售行业流动性大,很多销售都是新来的,需要一段时间的培训,有经验的销售和一般的销售也是在效率上有很大的差别,我们怎样让新手能具备优秀销售的能力?过去就是把他的经验总结下来,让新的销售去背,有了高精度的语音识别之后,就能改变这种状况,让新的销售具备这种能力,用语音识别总结客户的问题,再告诉新的销售,有经验的销售是怎么回答问题的。

这是语音识别应用在企业中,它还有很多功能可以想象。还有一个是语音合成,今天语音合成和过去有了很大不同,它可以用人的方式把文字读出来,我们现在每天响应2.5亿次的语音请求,比如过去是看小说,现在是听小说。这种读小说和广播有什么不同?广播每个人听到都是一样的,语音合成是可以定制的,具备自然发声能力,能模拟一个自然人的表达方式,例如在百度地图的语音导航就是,其实里面的话我都没有说话,只是根据我平时说话来合成的李彦宏的声音。我们还能合成已经过世的人的声音,比如张国荣的声音。

为什么展示张国荣,因为很多人是张国荣的粉丝,而且合成他的声音比较难,因为他的国语比较少。有了这些功能,也就是说我们人人都能拥有属于自己的声音模型。

下面讲图像,图像是一个人工智能非常重要的领域,说到图像识别就想到人脸识别,现在准确率已经达到99.7%。人脸识别是怎么实现的,我们对人脸的关键点连接来做一个处理,当一个人的表情发生变化时,我们依然能识别他。除了面部识别,还有地图里的实景图,到今天的识别力也是很高了。

还有一个很重要的领域也是非常需要图像识别,就是无人驾驶汽车,无人驾驶汽车涉及很多技术,需要计算机视觉,环境感受,传感器融合、语音对话、规划决策、行动控制等,图像识别是最后一项功能。

去年我们展示过百度无人车试驾,过去我们花了很多精力在城市道路的运营上。车辆的检测我们现在按照国际标准,百度已经排到第一了,就是车辆跟踪六项指标四项第一。今年8月份KITTI评测的最新成绩显示,百度无人车在车辆检测中排名第一,车辆跟踪6项指标中取得4项第一。

还有一个领域是增强现实,这个有什么运用呢?我们的广告主认为可以有一种新型的广告形式。

第三是自然语言处理,一个例子就是去年百度世界大会的度秘,个人手机助理。度秘现在的语音和图像占比是56%,过去百度已经用度秘解说了一场篮球赛。还有一个是百度翻译。

第四个是用户画像,现在我们已经有十亿的用户画像,其中对他们的识别我们已经用到了千万级的标签,我们用两个方向,第一个是在垂直画像,一个是通用画像。有什么作用?例如手机百度用了百度用户画像,资讯推荐阅读量过去两个月增长了十倍,这是靠百度对用户打了61.5万个用户标签,每个人看到的信息和文章都是不一样的。

用户画像还有一个外部的例子,六月上映的电影魔兽,出品人是传奇影业,用了用户画像做了精准投放,提升它的票房。他把人群分成三类,他只能关心他可以影响的人群,比如摇摆要不要去看电影的,而不是去影响一定要去看电影的。

到这里,我基本已经把百度大脑的几个大功能呈现出来了。

未经正式授权严禁转载本文,侵权必究。