李彦宏称百度无人驾驶四项指标已居第一|界面新闻

9月1日，一年一度的百度世界大会在北京开幕。

百度CEO李彦宏在会上做了关于人工智能的主题演讲。李彦宏表示，人工智能是百度核心的核心，过去百度花了很大的精力投入到人工智能，也就是三年前曾提过的百度大脑。

而百度大脑有什么样的功能？对百度来说，重点有四个——语言、图像、自然语言、用户画像。

据李彦宏介绍，具体来说，语音的能力包括语音识别能力和语音合成能力。

图像能力，指的是看到一个图片，不仅能看得见，还能看得懂。按照技术界的说法，它应该是计算机视觉。

自然语言处理能力，比语音和图像更难。语音和图像技术更多还处在认知的阶段，而自然语言理解除了要有认知能力之外，还需要逻辑推理能力、规划能力等等，同时也需要依赖于更为强大的知识图谱。

用户画像在传统的AI中并不是主流，但是今天，每时每刻都可以收集很多很多和用户行为相关的数据，就可以对用户做很好的画像，而这里面使用的技术又基本上都是与人工智能相关的。

以下是李彦宏演讲实录：

百度世界大会今年的主题聚焦在人工智能，我的主题演讲也将围绕人工智能。今年六月在联盟峰会上我讲了一个“互联网的下一步”的概念：互联网在这之前是PC互联网，第二个阶段是移动互联网阶段，随着上网渗透率越来越高，每一个上网的人都有一个智能手机，这意味着未来互联网的增长不能砸靠人口红利。

我们国家现在的新常态希望用互联网+，我们互联网的从业者深深感觉到了危机，就是因为过去粗放的阶段已经接受了，下一步是什么？就是我们说的人工智能。

人工智能是百度核心的核心，过去百度花了很大的精力投入到人工智能，这对百度意味着四个字，百度大脑。

三年前，我们对外讲过百度大脑已经具有两三岁的智力，今年人工智能火起来了，又很多人问我百度大脑现在多少岁了？其实我也不知道，因为人脑和电脑还是有很大的区别，百度大脑和人的发育过程还是很不一样。

百度大脑是有三个大组成部分，第一个是人工智能的算法，模拟人的神经元网络，我们已经使用了万亿级的参数，人脑是千亿级的；第二个组成部分是计算能力，现在我们使用了数十万台服务器，不是基于CPU的服务，而是GPU；第三部分是数据，我们搜集了上万亿的网页内容，包括视频、音频、图像数据，百亿计的，每天数百亿次的网民定位请求。有了这三个百度大脑就可以开始工作了。

百度大脑有什么样的功能？我们今天重点介绍四个功能——语言、图像、自然语言、用户画像。

语言现在进入了比较成熟的阶段，识别的准备率很高，图像也是，属于人工智能的认知部分。自然语言的理解和处理更加难，除了认知能力，还要有推理和规划能力，用户画像的能力，从传统意义上讲，并不是人工智能的领域，但现在很多互联网公司有这个能力，把人描绘得非常清楚，也变成了百度大脑的功能。

具体来讲，语言分成分成两个方向，一个是语言的合成，一个是语音识别。百度的语音识别引擎的技术已经把准备率达到97%。当你有了这些准确率可以在什么领域怎么运用？我们举一个例子，一个销售的电话例子，很多公司都有电话销售的部门，但是销售行业流动性大，很多销售都是新来的，需要一段时间的培训，有经验的销售和一般的销售也是在效率上有很大的差别，我们怎样让新手能具备优秀销售的能力？过去就是把他的经验总结下来，让新的销售去背，有了高精度的语音识别之后，就能改变这种状况，让新的销售具备这种能力，用语音识别总结客户的问题，再告诉新的销售，有经验的销售是怎么回答问题的。

这是语音识别应用在企业中，它还有很多功能可以想象。还有一个是语音合成，今天语音合成和过去有了很大不同，它可以用人的方式把文字读出来，我们现在每天响应2.5亿次的语音请求，比如过去是看小说，现在是听小说。这种读小说和广播有什么不同？广播每个人听到都是一样的，语音合成是可以定制的，具备自然发声能力，能模拟一个自然人的表达方式，例如在百度地图的语音导航就是，其实里面的话我都没有说话，只是根据我平时说话来合成的李彦宏的声音。我们还能合成已经过世的人的声音，比如张国荣的声音。

为什么展示张国荣，因为很多人是张国荣的粉丝，而且合成他的声音比较难，因为他的国语比较少。有了这些功能，也就是说我们人人都能拥有属于自己的声音模型。

下面讲图像，图像是一个人工智能非常重要的领域，说到图像识别就想到人脸识别，现在准确率已经达到99.7%。人脸识别是怎么实现的，我们对人脸的关键点连接来做一个处理，当一个人的表情发生变化时，我们依然能识别他。除了面部识别，还有地图里的实景图，到今天的识别力也是很高了。

还有一个很重要的领域也是非常需要图像识别，就是无人驾驶汽车，无人驾驶汽车涉及很多技术，需要计算机视觉，环境感受，传感器融合、语音对话、规划决策、行动控制等，图像识别是最后一项功能。

去年我们展示过百度无人车试驾，过去我们花了很多精力在城市道路的运营上。车辆的检测我们现在按照国际标准，百度已经排到第一了，就是车辆跟踪六项指标四项第一。今年8月份KITTI评测的最新成绩显示，百度无人车在车辆检测中排名第一，车辆跟踪6项指标中取得4项第一。

还有一个领域是增强现实，这个有什么运用呢？我们的广告主认为可以有一种新型的广告形式。

第三是自然语言处理，一个例子就是去年百度世界大会的度秘，个人手机助理。度秘现在的语音和图像占比是56%，过去百度已经用度秘解说了一场篮球赛。还有一个是百度翻译。

第四个是用户画像，现在我们已经有十亿的用户画像，其中对他们的识别我们已经用到了千万级的标签，我们用两个方向，第一个是在垂直画像，一个是通用画像。有什么作用？例如手机百度用了百度用户画像，资讯推荐阅读量过去两个月增长了十倍，这是靠百度对用户打了61.5万个用户标签，每个人看到的信息和文章都是不一样的。

用户画像还有一个外部的例子，六月上映的电影魔兽，出品人是传奇影业，用了用户画像做了精准投放，提升它的票房。他把人群分成三类，他只能关心他可以影响的人群，比如摇摆要不要去看电影的，而不是去影响一定要去看电影的。

到这里，我基本已经把百度大脑的几个大功能呈现出来了。