正在阅读:

百度CTO王海峰:大模型的产业模式将是“类台积电”模式

扫一扫下载界面新闻APP

百度CTO王海峰:大模型的产业模式将是“类台积电”模式

王海峰表示,“大模型加深度学习平台,贯通AI全产业链,是产业智能化的基座。”

图片来源:视觉中国

记者 | 伍洋宇

9月1日,在2022世界人工智能大会(WAIC 2022)“AI开源开放与产业智能化高峰论坛”上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰提出,大模型的产业模式将是“类台积电”模式。大模型加深度学习平台,贯通AI全产业链,是产业智能化的基座。

据悉,大模型是近几年人工智能发展的重要方向,具有效果好、泛化性强、研发流程标准化的特点,进一步增强了人工智能的通用性。不过,大模型研发同时也面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。

对于如何加速大模型的产业落地这一问题,王海峰认为,具有算法、算力和数据综合优势的企业可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为其他行业提供大模型服务。如此一来,大数据、大算力、大模型能力仅需少数企业投入精力,其他行业直接应用AI模型即可。 

王海峰以台积电、三星等企业为例,进一步阐释大模型的产业模式,可类比芯片行业的代工厂模式。他表示,“芯片制造工艺有很高的技术壁垒,有价格高昂的产线,能够根据客户需求,标准化、自动化地大批量生产芯片,形成规模经济。同理,大模型生产企业在大模型能力、海量数据、大规模算力等方面具有优势,能够根据AI应用方的需求,自动化、标准化地进行多场景多领域的模型生产,当达到一定规模时,即可形成健康、可持续发展的大模型产业模式。”

大模型的开发、训练、推理部署以及产业落地,需要深度学习平台的支撑。深度学习平台连接芯片与应用,可以理解为智能时代的“操作系统”。大模型加上深度学习平台,可以应用到硬件适配、模型训练、推理部署以及场景应用的AI全产业链。 

王海峰所说的大模型的“类台积电”产业模式,体现在百度的实践中即为文心产业级知识增强大模型系列,包括以鹏城-百度·文心为代表的基础通用大模型、生物计算领域大模型,以及能源、金融和航天行业大模型等。

在文心系列大模型之下,是百度飞浆作为技术底座。据介绍,飞桨是我国首个自主研发、开源开放的产业级深度学习平台,包含核心框架、产业级模型库、开发套件和工具组件,以及学习和实训社区等,可标准化、自动化地支撑大模型生产和应用。

在大模型训练方面,飞桨研发了端到端自适应分布式训练技术,根据模型特性和算力平台特性,自动选择并行策略,实现端到端的性能优化。在大模型推理方面,飞桨打造了针对大模型的压缩、推理、服务化全流程部署方案,能广泛支持不同种类的模型结构,实现高速推理。同时,飞桨还提供自动模型压缩工具,帮助节约算力资源。

此次会议还宣布,百度集团与上海张江集团共同建设的百度飞桨人工智能产业赋能中心,正式成为深度学习技术及应用国家工程研究中心科技成果转化基地,据介绍,飞桨是该国家工程研究中心的核心成果。

截至今年5月,飞桨平台共有477万开发者、创建56万模型、服务18万企事业单位,应用于工业、能源、农业、城市等行业领域。文心大模型基于飞桨平台累计已有超过1万开发者,基于文心大模型,创建了3万多个任务。

未经正式授权严禁转载本文,侵权必究。

百度

5.5k
  • 日产(中国)与百度签署合作谅解备忘录
  • 百度智驾卷进15万级车型争夺战

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

百度CTO王海峰:大模型的产业模式将是“类台积电”模式

王海峰表示,“大模型加深度学习平台,贯通AI全产业链,是产业智能化的基座。”

图片来源:视觉中国

记者 | 伍洋宇

9月1日,在2022世界人工智能大会(WAIC 2022)“AI开源开放与产业智能化高峰论坛”上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰提出,大模型的产业模式将是“类台积电”模式。大模型加深度学习平台,贯通AI全产业链,是产业智能化的基座。

据悉,大模型是近几年人工智能发展的重要方向,具有效果好、泛化性强、研发流程标准化的特点,进一步增强了人工智能的通用性。不过,大模型研发同时也面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。

对于如何加速大模型的产业落地这一问题,王海峰认为,具有算法、算力和数据综合优势的企业可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为其他行业提供大模型服务。如此一来,大数据、大算力、大模型能力仅需少数企业投入精力,其他行业直接应用AI模型即可。 

王海峰以台积电、三星等企业为例,进一步阐释大模型的产业模式,可类比芯片行业的代工厂模式。他表示,“芯片制造工艺有很高的技术壁垒,有价格高昂的产线,能够根据客户需求,标准化、自动化地大批量生产芯片,形成规模经济。同理,大模型生产企业在大模型能力、海量数据、大规模算力等方面具有优势,能够根据AI应用方的需求,自动化、标准化地进行多场景多领域的模型生产,当达到一定规模时,即可形成健康、可持续发展的大模型产业模式。”

大模型的开发、训练、推理部署以及产业落地,需要深度学习平台的支撑。深度学习平台连接芯片与应用,可以理解为智能时代的“操作系统”。大模型加上深度学习平台,可以应用到硬件适配、模型训练、推理部署以及场景应用的AI全产业链。 

王海峰所说的大模型的“类台积电”产业模式,体现在百度的实践中即为文心产业级知识增强大模型系列,包括以鹏城-百度·文心为代表的基础通用大模型、生物计算领域大模型,以及能源、金融和航天行业大模型等。

在文心系列大模型之下,是百度飞浆作为技术底座。据介绍,飞桨是我国首个自主研发、开源开放的产业级深度学习平台,包含核心框架、产业级模型库、开发套件和工具组件,以及学习和实训社区等,可标准化、自动化地支撑大模型生产和应用。

在大模型训练方面,飞桨研发了端到端自适应分布式训练技术,根据模型特性和算力平台特性,自动选择并行策略,实现端到端的性能优化。在大模型推理方面,飞桨打造了针对大模型的压缩、推理、服务化全流程部署方案,能广泛支持不同种类的模型结构,实现高速推理。同时,飞桨还提供自动模型压缩工具,帮助节约算力资源。

此次会议还宣布,百度集团与上海张江集团共同建设的百度飞桨人工智能产业赋能中心,正式成为深度学习技术及应用国家工程研究中心科技成果转化基地,据介绍,飞桨是该国家工程研究中心的核心成果。

截至今年5月,飞桨平台共有477万开发者、创建56万模型、服务18万企事业单位,应用于工业、能源、农业、城市等行业领域。文心大模型基于飞桨平台累计已有超过1万开发者,基于文心大模型,创建了3万多个任务。

未经正式授权严禁转载本文,侵权必究。