正在阅读:

第四范式戴文渊提AI发展三大挑战:数据科学家数量少、数据隐私保护难、AI算力成本高

扫一扫下载界面新闻APP

第四范式戴文渊提AI发展三大挑战:数据科学家数量少、数据隐私保护难、AI算力成本高

戴文渊认为,当开始收集线上数据构建AI模型时,数据科学家的缺失便是横亘在AI道路上一座难以逾越的大山。

图片来源:Waic2020官方

记者 | 林北辰

7月9日下午,2020世界人工智能大会科学前沿全体会议上,第四范式创始人兼首席执行官戴文渊参与圆桌论坛,在演讲中提出了当下人工智能发展面临的三个挑战:

第一是数据科学家门槛高、数量少。

这是企业在AI应用中面临的普遍问题。人工智能的应用越来越多,特别在复杂的商业环境下,应用也更加重要。然而,对于传统企业而言,想要实现线上化和人工智能难度太大。

戴文渊举例,他近期拜访了一家餐饮巨头企业,他们想把业务从线下搬到线上。传统来看,门店大部分在线下,但在疫情之后,有95%的业务是电子渠道获取的。此前企业通过门店员工给消费者发放线下消费券的方式,给用户做推荐,提供增值服务。但如果是通过电子渠道,这样大的任务量,不可能通过人工和人力来完成。

因此,这是典型适合人工智能的场景,AI充分利用线上的用户行为数据,可以实现个性化的营销以及精准匹配的推送。

但核心问题是,行业中数据科学家数量远远不够,就算是MIT的数据科学家也不能够解决所有企业的所有需求和问题。

戴文渊认为,当开始收集线上数据构建AI模型时,数据科学家的缺失便是横亘在AI道路上一座难以逾越的大山。所以要研发低门槛的人工智能工具,让普通人也能使用AI技术,应对企业数据科学家缺乏、AI生产力不足的挑战。

第二是数据隐私保护问题。

他提到,即便是有数据科学家,或者通过AutoML降低了AI的门槛,但缺少数据隐私保护技术,AI应用也会面临严重问题。在大数据当中如何保护用户的隐私,这是AI的第二个挑战。

目前,可用的高质量数据依然稀缺,这就需要通过迁移学习把数据中的知识从一个领域迁移另一个新领域,保证AI在新领域的应用及效果。

戴文渊提到,近几年第四范式在迁移学习隐私保护领域取得了比较大的突破,能够把知识从一个领域迁移到另外一个领域,同时不会导致隐私暴露。今年年初,第四范式先知曾通过了欧盟GDPR认证,成为国内第一款通过该认证的AI平台产品。

挑战三则是AI算力成本太高。

戴文渊透露,顶尖的互联网公司每年要花费上千亿在搜索引擎、推荐引擎上,这是由于AI发展所带来的算力成本激增,然而很少有传统企业能接受如此高的成本。

他认为,目前AI体系中硬件成本居高不下,但AI不仅是硬件体系,而是硬件+软件融合发展的体系,软件的设计必须要基于硬件的特点,硬件的设计也必须基于软件的算法。

基于此,第四范式发现如果采用软硬件深度融合优化的方式,不止性能会提高十倍,成本也会大幅降低。以第四范式服务的某零售企业推荐场景为例,过去需要采用88台传统服务器才能支撑AI业务,采用软硬一体的方式后降为8台,TCO(总拥有成本)降低了90%。

作为今年WAIC唯一一场聚焦前沿科技的大会,2020世界人工智能大会科学前沿全体会议上,香港科技大学的张潼教授、新南威尔士大学的Toby Walsh教授、札幌市立大学校长中岛秀之以及英国帝国理工学院数据科学研究所所长郭毅可等科学家出席,共同探讨AI未来。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

第四范式戴文渊提AI发展三大挑战:数据科学家数量少、数据隐私保护难、AI算力成本高

戴文渊认为,当开始收集线上数据构建AI模型时,数据科学家的缺失便是横亘在AI道路上一座难以逾越的大山。

图片来源:Waic2020官方

记者 | 林北辰

7月9日下午,2020世界人工智能大会科学前沿全体会议上,第四范式创始人兼首席执行官戴文渊参与圆桌论坛,在演讲中提出了当下人工智能发展面临的三个挑战:

第一是数据科学家门槛高、数量少。

这是企业在AI应用中面临的普遍问题。人工智能的应用越来越多,特别在复杂的商业环境下,应用也更加重要。然而,对于传统企业而言,想要实现线上化和人工智能难度太大。

戴文渊举例,他近期拜访了一家餐饮巨头企业,他们想把业务从线下搬到线上。传统来看,门店大部分在线下,但在疫情之后,有95%的业务是电子渠道获取的。此前企业通过门店员工给消费者发放线下消费券的方式,给用户做推荐,提供增值服务。但如果是通过电子渠道,这样大的任务量,不可能通过人工和人力来完成。

因此,这是典型适合人工智能的场景,AI充分利用线上的用户行为数据,可以实现个性化的营销以及精准匹配的推送。

但核心问题是,行业中数据科学家数量远远不够,就算是MIT的数据科学家也不能够解决所有企业的所有需求和问题。

戴文渊认为,当开始收集线上数据构建AI模型时,数据科学家的缺失便是横亘在AI道路上一座难以逾越的大山。所以要研发低门槛的人工智能工具,让普通人也能使用AI技术,应对企业数据科学家缺乏、AI生产力不足的挑战。

第二是数据隐私保护问题。

他提到,即便是有数据科学家,或者通过AutoML降低了AI的门槛,但缺少数据隐私保护技术,AI应用也会面临严重问题。在大数据当中如何保护用户的隐私,这是AI的第二个挑战。

目前,可用的高质量数据依然稀缺,这就需要通过迁移学习把数据中的知识从一个领域迁移另一个新领域,保证AI在新领域的应用及效果。

戴文渊提到,近几年第四范式在迁移学习隐私保护领域取得了比较大的突破,能够把知识从一个领域迁移到另外一个领域,同时不会导致隐私暴露。今年年初,第四范式先知曾通过了欧盟GDPR认证,成为国内第一款通过该认证的AI平台产品。

挑战三则是AI算力成本太高。

戴文渊透露,顶尖的互联网公司每年要花费上千亿在搜索引擎、推荐引擎上,这是由于AI发展所带来的算力成本激增,然而很少有传统企业能接受如此高的成本。

他认为,目前AI体系中硬件成本居高不下,但AI不仅是硬件体系,而是硬件+软件融合发展的体系,软件的设计必须要基于硬件的特点,硬件的设计也必须基于软件的算法。

基于此,第四范式发现如果采用软硬件深度融合优化的方式,不止性能会提高十倍,成本也会大幅降低。以第四范式服务的某零售企业推荐场景为例,过去需要采用88台传统服务器才能支撑AI业务,采用软硬一体的方式后降为8台,TCO(总拥有成本)降低了90%。

作为今年WAIC唯一一场聚焦前沿科技的大会,2020世界人工智能大会科学前沿全体会议上,香港科技大学的张潼教授、新南威尔士大学的Toby Walsh教授、札幌市立大学校长中岛秀之以及英国帝国理工学院数据科学研究所所长郭毅可等科学家出席,共同探讨AI未来。

未经正式授权严禁转载本文,侵权必究。