正在阅读:

做不出GPT,字节云“曲线救国 ”

扫一扫下载界面新闻APP

做不出GPT,字节云“曲线救国 ”

火山引擎的大模型训练云野望。

文|科技新知   樟稻

编辑|伊页

“大语言模型改变云计算游戏规则”,李彦宏的这则断言,愈发成为云计算行业的共识。

可以从两方面来解释这种新变化。一方面,大语言模型在训练和推理过程中需要大量的计算资源,即算力。而这些需求催生了云计算厂商为模型训练提供更强大、更高效的计算资源。

作为佐证,投资机构A16Z认为,生成式AI市场里的大量资金,其实最终流向了基础设施公司。

A16Z估计,应用公司平均将约20%-40%的年收入,用于推理和定制化的微调。这部分通常直接支付给云服务提供商,以获取实例或支付给第三方模型提供商,而后者将大约一半的收入投入于云基础设施。据此有理由推测,生成式AI总营收的10%-20%将流向云服务提供商。

不仅如此,A16Z估算,许多拥有自家模型的初创公司已筹集到数十亿美元的风险投资,其中大部分资金(在早期阶段高达80%-90%),通常会支付给云服务提供商。这可是流向云厂商的“一大笔钱”。

另一方面,大语言模型的兴起,让许多复杂任务可以通过预训练模型来解决。企业无需拥有庞大的技术团队和资源,就能利用云计算服务快速实现AI应用。

简单来说,模型即服务(Model as a Service,MaaS)将成为新的云计算服务形式。企业可以通过API调用预训练模型来满足自身业务需求,而这降低了云计算服务的使用门槛。

微软是最典型的案例。眼下,Azure OpenAI服务已经普遍可用,企业可以申请访问包括GPT-3.5、Codex和DALL・E 2在内的人工智能模型。目前,已经使用Azure OpenAI的客户有半导电视台、毕马威、RPA厂商Moveworks等等。

得益于上述新变化,国内云计算行业迎来新的发展契机和活力,特别是在如今的低增长速度背景下,更加鼓舞人心。

此前,市场研究机构IDC在2022年底的预测报告中,将中国云计算行业未来五年的平均增长速度下调了10%。这是考虑到互联网行业整体增速放缓的影响,同时政企集成业务也在调整过程中。多方因素共同导致了互联网云厂商普遍降低了业务预期。

从这个角度出发,便能理解为何众多云服务厂商,如此热衷于成为国内大模型热潮中的舵手。

“卖铲子”的火山引擎

 

前,大模型成为科技领域最热门的话题。在中国,至少有数十家企业和机构已经发布了大模型产品或公布了相关计划。作为互联网领域的翘楚,字节跳动自然不会缺席这场AI竞赛。

据《晚点LatePost》报道,面对ChatGPT和背后的大模型机会,张一鸣选择亲自跟进。一位字节人士称,张一鸣近期时常会和一些字节人士分享论文学习心得和对ChatGPT的思考。

据了解,字节今年初才开始组建专门的大模型团队,但一把手的跟进也意味着诸多资源倾斜。果不其然,近日,在BAT先后展示自己在大模型产品领域的进展后,字节终于亮出了自己手中“另类”的牌。

字节跳动旗下云服务平台火山引擎举办的“原动力大会”上,火山引擎总裁谭待表示,火山引擎不做大模型,而是服务客户做好大模型,为企业和消费者提供更丰富的AI应用。

进一步解读,眼下国内很多科技公司投入到大模型建设中,火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

曾经的北美淘金热时期,寻找黄金的人们需要购买铲子等必备工具,而出售这些商品的商人赚取了可观的利润。在现代商业环境中,“卖铲子”这一说法常常用于形容为他人提供工具、服务或基础设施的公司,而非直接参与某个行业的竞争。火山引擎此次想做的便是在大模型热潮中“卖铲子”。

后续的宣传环节中,有两个噱头十分玩味。一是,火山引擎宣称,中国的大模型领域,七成以上已是其客户。面对媒体群访,谭待解释道,上述“七成”是火山引擎相关客户与第三方机构统计的大模型企业数量之比,能获得这么多客户是因为机器学习平台解决了算力辅助的问题。

二是,为了让更多潜在客户安心,谭待在多个场合公开表示,火山引擎不做大模型。“我们不急于推出一个只有30分且只能适用于本地部署的大模型,这不是最关键的,核心是赋能其他人做这件事情。”

这几乎是公然叫嚣其他大模型参与者,特别是前不久刚刚放言“不用造轮子”的云厂商们。

拿阿里云来说,此前的云峰会上宣传口径是,阿里云希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。换句话说,在阿里巴巴提供的算力基础设施、机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去“造轮子”,或是陷入针对大模型通用能力的无谓竞争。

百度也是同道中人。李彦宏认为自家三月发布的文心一言距离GPT的差距大概在两个月,并且认为国内大模型创业已经基本没有机会,大家也没必要在大模型上重复造轮子。为此,还引发了王小川的揶揄。

在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿态,显然是在丢掉时机优势后,寄希望于弯道超车。毕竟,哪个创业者没有成为中国OpenAI的梦呢?

字节云需要更多王小川

 

卖铲子”商业模式的核心,是鼓吹更多淘金者加入。

历史上,加州淘金热期间,当地报纸发表了关于在若干地点发现金子的文章,迅速引发了广泛的关注。一些商人和企业便利用淘金热来推广他们的产品和服务。例如,邮轮公司和铁路公司为了吸引更多的乘客,大肆宣传推销前往淘金地区的船票和车票。

放到此次大模型热潮中,火山引擎想要靠“卖铲子”发家致富,自然需要站在“王小川们”这一边。

为此,火山引擎造了“多云多模态”这个概念。谭待表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。“未来将是‘多云多模型’的时代。”

对于该论断,王慧文(美团联合创始人)、贾扬清(原阿里技术副总裁)、周伯文(原京东高级副总裁)、李岩(快手前 MMU 负责人)、闫俊杰(原商汤科技副总裁)等创业者肯定赞同。

不过,这里也还有一些不确定因素。其一,王小川等创业者一定会用火山引擎卖的“铲子”吗?

简单来说,火山引擎主要是为大模型客户提供AI基础设施,可以理解为AI算力需求。而对于算力需求,王小川并没有直言通过云厂商来满足。

此前在参访中,王小川认为中国可以购买的英伟达A800和A100芯片性能差距只有5%,目前不会成为“卡脖子”的瓶颈,尤其对未来国产芯片有一定技术突破特别有信心。

简单来说,对于王小川等创业者而言,是否“借道”云厂商们犹未可知。

其二,火山引擎是否会坚守不涉及大模型的立场?

据《晚点 LatePost》披露,目前参与字节大模型的技术负责人有朱文佳、项亮、李航等,他们分属字节多个部门。其中项亮、李航向火山引擎BU负责人杨震原汇报。

对于要不要做大模型,杨震源曾回应称字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。从这里来看,火山引擎并没有宣传中那样坚定路线。毕竟不做大模型,直接意味着云厂商少了模型及服务这条营收支线。

从这次整个宣传动作来看,火山引擎延续了一直以来的策略。此前,作为云市场的后来者,火山引擎的目标是做阿里云、腾讯云、华为云之外的“第四朵云”。

对此,多云成为火山引擎反复强调的一个宣传点。RightScale在2019年对全球企业用云策略的调查显示,超过1000人的大型企业中,选择多云部署的占比达到84%,其中混合云占比达到58%。这种多云策略,或是字节跳动扩大市场份额的转机。

而这次,火山引擎在多云的基础上还加上了多模态。

不过,根据IDC最近发布的《中国公有云服务市场(2022上半年)跟踪报告》显示,2022年上半年,阿里云、华为云、天翼云、腾讯云和AWS这五大云厂商一直占据了70%以上的市场份额。火山引擎仍然处于名不见经传的其他厂商(Others)之列。

显然,在这个已经相对成熟的云市场中,火山引擎想要突围并不容易。后发者想要颠覆格局,天时地利人和缺一不可,大模型热潮可以看作机会窗口打开,但结局到底如何还要取决于字节团队的深耕细作。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

做不出GPT,字节云“曲线救国 ”

火山引擎的大模型训练云野望。

文|科技新知   樟稻

编辑|伊页

“大语言模型改变云计算游戏规则”,李彦宏的这则断言,愈发成为云计算行业的共识。

可以从两方面来解释这种新变化。一方面,大语言模型在训练和推理过程中需要大量的计算资源,即算力。而这些需求催生了云计算厂商为模型训练提供更强大、更高效的计算资源。

作为佐证,投资机构A16Z认为,生成式AI市场里的大量资金,其实最终流向了基础设施公司。

A16Z估计,应用公司平均将约20%-40%的年收入,用于推理和定制化的微调。这部分通常直接支付给云服务提供商,以获取实例或支付给第三方模型提供商,而后者将大约一半的收入投入于云基础设施。据此有理由推测,生成式AI总营收的10%-20%将流向云服务提供商。

不仅如此,A16Z估算,许多拥有自家模型的初创公司已筹集到数十亿美元的风险投资,其中大部分资金(在早期阶段高达80%-90%),通常会支付给云服务提供商。这可是流向云厂商的“一大笔钱”。

另一方面,大语言模型的兴起,让许多复杂任务可以通过预训练模型来解决。企业无需拥有庞大的技术团队和资源,就能利用云计算服务快速实现AI应用。

简单来说,模型即服务(Model as a Service,MaaS)将成为新的云计算服务形式。企业可以通过API调用预训练模型来满足自身业务需求,而这降低了云计算服务的使用门槛。

微软是最典型的案例。眼下,Azure OpenAI服务已经普遍可用,企业可以申请访问包括GPT-3.5、Codex和DALL・E 2在内的人工智能模型。目前,已经使用Azure OpenAI的客户有半导电视台、毕马威、RPA厂商Moveworks等等。

得益于上述新变化,国内云计算行业迎来新的发展契机和活力,特别是在如今的低增长速度背景下,更加鼓舞人心。

此前,市场研究机构IDC在2022年底的预测报告中,将中国云计算行业未来五年的平均增长速度下调了10%。这是考虑到互联网行业整体增速放缓的影响,同时政企集成业务也在调整过程中。多方因素共同导致了互联网云厂商普遍降低了业务预期。

从这个角度出发,便能理解为何众多云服务厂商,如此热衷于成为国内大模型热潮中的舵手。

“卖铲子”的火山引擎

 

前,大模型成为科技领域最热门的话题。在中国,至少有数十家企业和机构已经发布了大模型产品或公布了相关计划。作为互联网领域的翘楚,字节跳动自然不会缺席这场AI竞赛。

据《晚点LatePost》报道,面对ChatGPT和背后的大模型机会,张一鸣选择亲自跟进。一位字节人士称,张一鸣近期时常会和一些字节人士分享论文学习心得和对ChatGPT的思考。

据了解,字节今年初才开始组建专门的大模型团队,但一把手的跟进也意味着诸多资源倾斜。果不其然,近日,在BAT先后展示自己在大模型产品领域的进展后,字节终于亮出了自己手中“另类”的牌。

字节跳动旗下云服务平台火山引擎举办的“原动力大会”上,火山引擎总裁谭待表示,火山引擎不做大模型,而是服务客户做好大模型,为企业和消费者提供更丰富的AI应用。

进一步解读,眼下国内很多科技公司投入到大模型建设中,火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

曾经的北美淘金热时期,寻找黄金的人们需要购买铲子等必备工具,而出售这些商品的商人赚取了可观的利润。在现代商业环境中,“卖铲子”这一说法常常用于形容为他人提供工具、服务或基础设施的公司,而非直接参与某个行业的竞争。火山引擎此次想做的便是在大模型热潮中“卖铲子”。

后续的宣传环节中,有两个噱头十分玩味。一是,火山引擎宣称,中国的大模型领域,七成以上已是其客户。面对媒体群访,谭待解释道,上述“七成”是火山引擎相关客户与第三方机构统计的大模型企业数量之比,能获得这么多客户是因为机器学习平台解决了算力辅助的问题。

二是,为了让更多潜在客户安心,谭待在多个场合公开表示,火山引擎不做大模型。“我们不急于推出一个只有30分且只能适用于本地部署的大模型,这不是最关键的,核心是赋能其他人做这件事情。”

这几乎是公然叫嚣其他大模型参与者,特别是前不久刚刚放言“不用造轮子”的云厂商们。

拿阿里云来说,此前的云峰会上宣传口径是,阿里云希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。换句话说,在阿里巴巴提供的算力基础设施、机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去“造轮子”,或是陷入针对大模型通用能力的无谓竞争。

百度也是同道中人。李彦宏认为自家三月发布的文心一言距离GPT的差距大概在两个月,并且认为国内大模型创业已经基本没有机会,大家也没必要在大模型上重复造轮子。为此,还引发了王小川的揶揄。

在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿态,显然是在丢掉时机优势后,寄希望于弯道超车。毕竟,哪个创业者没有成为中国OpenAI的梦呢?

字节云需要更多王小川

 

卖铲子”商业模式的核心,是鼓吹更多淘金者加入。

历史上,加州淘金热期间,当地报纸发表了关于在若干地点发现金子的文章,迅速引发了广泛的关注。一些商人和企业便利用淘金热来推广他们的产品和服务。例如,邮轮公司和铁路公司为了吸引更多的乘客,大肆宣传推销前往淘金地区的船票和车票。

放到此次大模型热潮中,火山引擎想要靠“卖铲子”发家致富,自然需要站在“王小川们”这一边。

为此,火山引擎造了“多云多模态”这个概念。谭待表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。“未来将是‘多云多模型’的时代。”

对于该论断,王慧文(美团联合创始人)、贾扬清(原阿里技术副总裁)、周伯文(原京东高级副总裁)、李岩(快手前 MMU 负责人)、闫俊杰(原商汤科技副总裁)等创业者肯定赞同。

不过,这里也还有一些不确定因素。其一,王小川等创业者一定会用火山引擎卖的“铲子”吗?

简单来说,火山引擎主要是为大模型客户提供AI基础设施,可以理解为AI算力需求。而对于算力需求,王小川并没有直言通过云厂商来满足。

此前在参访中,王小川认为中国可以购买的英伟达A800和A100芯片性能差距只有5%,目前不会成为“卡脖子”的瓶颈,尤其对未来国产芯片有一定技术突破特别有信心。

简单来说,对于王小川等创业者而言,是否“借道”云厂商们犹未可知。

其二,火山引擎是否会坚守不涉及大模型的立场?

据《晚点 LatePost》披露,目前参与字节大模型的技术负责人有朱文佳、项亮、李航等,他们分属字节多个部门。其中项亮、李航向火山引擎BU负责人杨震原汇报。

对于要不要做大模型,杨震源曾回应称字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。从这里来看,火山引擎并没有宣传中那样坚定路线。毕竟不做大模型,直接意味着云厂商少了模型及服务这条营收支线。

从这次整个宣传动作来看,火山引擎延续了一直以来的策略。此前,作为云市场的后来者,火山引擎的目标是做阿里云、腾讯云、华为云之外的“第四朵云”。

对此,多云成为火山引擎反复强调的一个宣传点。RightScale在2019年对全球企业用云策略的调查显示,超过1000人的大型企业中,选择多云部署的占比达到84%,其中混合云占比达到58%。这种多云策略,或是字节跳动扩大市场份额的转机。

而这次,火山引擎在多云的基础上还加上了多模态。

不过,根据IDC最近发布的《中国公有云服务市场(2022上半年)跟踪报告》显示,2022年上半年,阿里云、华为云、天翼云、腾讯云和AWS这五大云厂商一直占据了70%以上的市场份额。火山引擎仍然处于名不见经传的其他厂商(Others)之列。

显然,在这个已经相对成熟的云市场中,火山引擎想要突围并不容易。后发者想要颠覆格局,天时地利人和缺一不可,大模型热潮可以看作机会窗口打开,但结局到底如何还要取决于字节团队的深耕细作。

本文为转载内容,授权事宜请联系原著作权人。