正在阅读:

联想集团CTO芮勇:联想早就在布局大模型,目前的GPT技术架构并未闭环

扫一扫下载界面新闻APP

联想集团CTO芮勇:联想早就在布局大模型,目前的GPT技术架构并未闭环

芮勇认为超算能力强和绿色计算能力强的企业,将从AI大模型上吃到更多红利。

图片来源:视觉中国

界面新闻记者 | 崔鹏

4月6日联想集团在北京召开新财年誓师大会,活动结束后联想集团高级副总裁、首席技术官芮勇博士接受了界面新闻等媒体的采访,他提到了对人工智能大模型产品的看法以及联想未来的技术研发核心方向等话题。

芮勇将网景浏览器的出现(推动互联网普及),iPhone的出现(推动智能手机时代),与生成式AI大模型(推动人工智能)的出现相并列,称它们为现象级的爆发。

芮勇认为,AIGC未来的产业机遇将集中在几个场景之下,比如在语言理解场景下,可以用问答方式做信息检索、客服机器人和聊天机器人,或者在内容生成场景下,提供辅助协作、代码撰写和文生图能力等。

芮勇表示,联想很早就有布局大模型相关业务,“不然等大模型火了,再回去弄算法,黄花菜都凉了。”

此外,他认为目前的大模型都需要分布式训练架构做支撑,仅仅把硬件连在一起没有用,还需要上层有一个大规模分布式软件优化系统,而这正是过去几年联想研究院投入很多的地方。

与此同时,AI大模型对训练与推理的运行环境需求越来越高,需要芯片,超算,节能,IT架构的综合能力,联想在这些方面也有比较深厚的积累。

此外,现在很多模型被训练好了之后,如果将它部署到某一个偏远工厂或者机房,可能会碰到之前训练时从没见过的问题,这时就已经无法再重新训练模型,需要用非常小的现场采集样本进行再次训练。

芮勇表示,这里有一个关键核心技术——小样本学习,英文说法是“Few-shot Learning”。2022年联想已经在发力推进边缘人工智能业务,目前联想边缘计算不仅在联想内部的武汉工厂落地,还发展了一些外部客户。

对于中国目前大模型产品发展参差不齐的现状,芮勇表示,算法、数据质量和算力的差别,是导致各家进度不一的主要原因。他认为超算能力强和绿色计算能力强的企业,将从AI大模型上吃到更多红利。

虽然目前舆论在热炒大模型和AIGC的能力,但他认为它距离广义的通用人工智能还有很大差距。

芮勇解释称,人其实是一个闭环系统,GPT整个技术架构没有闭环:“人类不会每次都告诉你一个最好的答案,但他的答案不会偏离正确答案太远,而目前大模型经常会出现幻觉(类的答案),跟正确答案差之千里”。

他用开车举例称,一个正常人类开车,不会突然之间没有道理地翻进沟里,如果是一个纯自动驾驶设备,突然之间差之千里的话是无法接受的。想要规模化应用大模型产品,必须要先解决这种偶然的大误差结果。

虽然目前舆论在热炒大模型和AIGC的能力,但芮勇认为它距离广义的通用人工智能还有很大差距。

芮勇认为,人其实是一个闭环系统,GPT整个技术架构没有闭环:“人类不会每次都告诉你一个最好的答案,但他的答案不会偏离正确答案太远,而目前大模型经常会出现幻觉(类的答案),跟正确答案差之千里”。

他用开车举例称,一个正常人类开车,不会突然之间没有道理地翻进沟里,如果是一个纯自动驾驶设备,突然之间差之千里的话是无法接受的。想要规模化应用大模型产品,必须要先解决这种偶然的大误差结果。

在采访中,芮勇还回顾了过去一个财年联想在技术创新层面取得的突破。去年联想连续第九次蝉联全球高性能计算Top500的第一名,在他看来,这是非常不容易的一件事情。

同时,联想在Gartner去年评出的全球供应链25强榜单中排名第九,这也是联想历史上排的最靠前的一次,位居亚洲企业头名。芮勇表示,这主要得益于联想采取了人工智能驱动的供应链规划。

芮勇还专门提及了联想技术委员会,它在2021年底成立,由杨元庆担任委员会主席,芮勇担任副主席。芮勇认为,它代表着联想第一次从整个集团的角度,自上而下进行技术方向的统筹和规划。

在日常工作中,芮勇要花大量时间为集团研发指定战略和规划,还要分配时间在联想研究院身上,过去一年有些实验室也取得了不错的成绩。

比如智能设备创新实验室(“PC创新和生态系统实验室”以及“移动技术创新实验室”)推出的卷轴屏笔记本就在MWC(世界通信大会)上引发大量外界关注。

在新财年中,联想将在数字化办公空间、混合云、边缘计算、可持续发展以及联想臻算TruScale这五个方向上,着重进行核心技术开发。

而选择这几个方向的原因主要有三个方面:在业务层它们是最高优先级,在产品层面它们成熟度都很高,在技术层面与竞品相比它们拥有很高竞争力。

芮勇还表示,联想未来的技术研发将始终围绕计算(computing)和智能这两个锚点来进行,在二者范畴内重点布局设备协同、边缘计算、混合云、超自动化、元宇宙、异构计算和行业大模型。

 

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

联想集团CTO芮勇:联想早就在布局大模型,目前的GPT技术架构并未闭环

芮勇认为超算能力强和绿色计算能力强的企业,将从AI大模型上吃到更多红利。

图片来源:视觉中国

界面新闻记者 | 崔鹏

4月6日联想集团在北京召开新财年誓师大会,活动结束后联想集团高级副总裁、首席技术官芮勇博士接受了界面新闻等媒体的采访,他提到了对人工智能大模型产品的看法以及联想未来的技术研发核心方向等话题。

芮勇将网景浏览器的出现(推动互联网普及),iPhone的出现(推动智能手机时代),与生成式AI大模型(推动人工智能)的出现相并列,称它们为现象级的爆发。

芮勇认为,AIGC未来的产业机遇将集中在几个场景之下,比如在语言理解场景下,可以用问答方式做信息检索、客服机器人和聊天机器人,或者在内容生成场景下,提供辅助协作、代码撰写和文生图能力等。

芮勇表示,联想很早就有布局大模型相关业务,“不然等大模型火了,再回去弄算法,黄花菜都凉了。”

此外,他认为目前的大模型都需要分布式训练架构做支撑,仅仅把硬件连在一起没有用,还需要上层有一个大规模分布式软件优化系统,而这正是过去几年联想研究院投入很多的地方。

与此同时,AI大模型对训练与推理的运行环境需求越来越高,需要芯片,超算,节能,IT架构的综合能力,联想在这些方面也有比较深厚的积累。

此外,现在很多模型被训练好了之后,如果将它部署到某一个偏远工厂或者机房,可能会碰到之前训练时从没见过的问题,这时就已经无法再重新训练模型,需要用非常小的现场采集样本进行再次训练。

芮勇表示,这里有一个关键核心技术——小样本学习,英文说法是“Few-shot Learning”。2022年联想已经在发力推进边缘人工智能业务,目前联想边缘计算不仅在联想内部的武汉工厂落地,还发展了一些外部客户。

对于中国目前大模型产品发展参差不齐的现状,芮勇表示,算法、数据质量和算力的差别,是导致各家进度不一的主要原因。他认为超算能力强和绿色计算能力强的企业,将从AI大模型上吃到更多红利。

虽然目前舆论在热炒大模型和AIGC的能力,但他认为它距离广义的通用人工智能还有很大差距。

芮勇解释称,人其实是一个闭环系统,GPT整个技术架构没有闭环:“人类不会每次都告诉你一个最好的答案,但他的答案不会偏离正确答案太远,而目前大模型经常会出现幻觉(类的答案),跟正确答案差之千里”。

他用开车举例称,一个正常人类开车,不会突然之间没有道理地翻进沟里,如果是一个纯自动驾驶设备,突然之间差之千里的话是无法接受的。想要规模化应用大模型产品,必须要先解决这种偶然的大误差结果。

虽然目前舆论在热炒大模型和AIGC的能力,但芮勇认为它距离广义的通用人工智能还有很大差距。

芮勇认为,人其实是一个闭环系统,GPT整个技术架构没有闭环:“人类不会每次都告诉你一个最好的答案,但他的答案不会偏离正确答案太远,而目前大模型经常会出现幻觉(类的答案),跟正确答案差之千里”。

他用开车举例称,一个正常人类开车,不会突然之间没有道理地翻进沟里,如果是一个纯自动驾驶设备,突然之间差之千里的话是无法接受的。想要规模化应用大模型产品,必须要先解决这种偶然的大误差结果。

在采访中,芮勇还回顾了过去一个财年联想在技术创新层面取得的突破。去年联想连续第九次蝉联全球高性能计算Top500的第一名,在他看来,这是非常不容易的一件事情。

同时,联想在Gartner去年评出的全球供应链25强榜单中排名第九,这也是联想历史上排的最靠前的一次,位居亚洲企业头名。芮勇表示,这主要得益于联想采取了人工智能驱动的供应链规划。

芮勇还专门提及了联想技术委员会,它在2021年底成立,由杨元庆担任委员会主席,芮勇担任副主席。芮勇认为,它代表着联想第一次从整个集团的角度,自上而下进行技术方向的统筹和规划。

在日常工作中,芮勇要花大量时间为集团研发指定战略和规划,还要分配时间在联想研究院身上,过去一年有些实验室也取得了不错的成绩。

比如智能设备创新实验室(“PC创新和生态系统实验室”以及“移动技术创新实验室”)推出的卷轴屏笔记本就在MWC(世界通信大会)上引发大量外界关注。

在新财年中,联想将在数字化办公空间、混合云、边缘计算、可持续发展以及联想臻算TruScale这五个方向上,着重进行核心技术开发。

而选择这几个方向的原因主要有三个方面:在业务层它们是最高优先级,在产品层面它们成熟度都很高,在技术层面与竞品相比它们拥有很高竞争力。

芮勇还表示,联想未来的技术研发将始终围绕计算(computing)和智能这两个锚点来进行,在二者范畴内重点布局设备协同、边缘计算、混合云、超自动化、元宇宙、异构计算和行业大模型。

 

未经正式授权严禁转载本文,侵权必究。