界面新闻记者 |
界面新闻编辑 | 文姝琪
百度旗下的视频生成模型蒸汽机完成了一次大幅度升级,这距离该模型上线仅仅有50天。
在模型能力上,蒸汽机模型最大的变化是实现了多人有声音视频一体化生成,模型生成的视频不需要再进行后期配音,人物的声音和表情、动作以及嘴型实现同步,即使在复杂场景下也能够保持稳定。同时,生成视频的画面清晰度和流畅度也有了明显提升,运镜方式更为丰富。
更重要的是,百度大幅降低了蒸汽机模型的使用价格。根据百度商业体系商业研发总经理刘林在发布会现场的介绍,蒸汽机模型Turbo版生成一段5秒720p的一体化有声视频,需要的价格是1.4元。而据界面新闻了解,行业中视频生成模型生成一段5秒720p的无声视频普遍的价格大概为2元。这意味着,百度把视频生成模型的价格降到了行业价格70%的水平。
相比于百度旗下的文心系列大模型,百度蒸汽机模型的更新迭代速度更快,在价格降幅上也要高于行业平均水平,呈现出更为激进的态势。在接受界面新闻等媒体采访时,百度副总裁、移动生态商业体系负责人陈一凡透露,蒸汽机模型1.0版本就是需求驱动的,到2.0版本是在需求驱动的基础上叠加了技术的优化,才达到了当前的情况。
和文心系列大模型不同,百度蒸汽机模型并不是由负责基础技术的TPG研发,而是由MEG(移动生态事业群)旗下的移动生态商业体系研发,主要服务于广告主和代理商制作视频营销素材的需求。
陈一凡向界面新闻透露,蒸汽机模型1.0版本在研发上更注重算法、策略,而2.0版本更加注重大模型工程方面的优化,所以能够在短短50天内把技术能力提升并且把成本降下来。“百度商业体系早在2016年就开始使用对GPU做搜、广、推,对GPU的架构是非常熟悉的,团队非常熟悉如何通过调整训练集、算子等方式降低训练成本。”
由于蒸汽机模型从立项开始就拥有明确的服务对象,其在上线一个月的时间内也收集到了诸多客户反馈。陈一凡表示,广告客户反馈的需求一方面集中在模型能力上,大多数广告客户对生成视频的运镜、画质、一致性、音画一体化都有更高的要求,此次模型升级着重改进了这些方面的能力;另一个方面是价格,虽然蒸汽机模型在上线后并未向广告客户收费,但很多客户对比市场价后认为价格偏高,研发团队对训练成本进行了优化。

在发布会现场,好莱坞视效指导姚骐演示了其团队使用蒸汽机模型制作的短片《归途》,该短片通过大模型生成了40多个镜头、120段素材片段,包括20个10秒一体化有声片段和100个5秒有声片段,仅用一周时间制作而成。按照蒸汽机模型的最新模型定价计算,其花费的成本为330.6元。
陈一凡对界面新闻表示,如果客户使用常规手段拍摄一个宣传片,成本大概需要20万左右,最后做出来的片子还不一定能最终使用,但现在他们可以先花费几百元把自己想要的内容用AIGC的方式制作出来,这对营销成本的降低是十分显著的。
目前,视频生成模型在营销素材生成等领域的商业价值正在被逐步验证。快手在8月21日发布的财报显示,其视频生成模型可灵AI在今年第二季度的营收达到了2.5亿元,营收能力较几个月前已提升了数倍。根据快手方面预测,可灵AI今年全年的营收比今年年初定下的目标翻一倍。
百度刚刚发布的财报显示,百度在线广告收入在今年第二季度同比下降15%。显然,百度商业化体系面临着非常大的营收压力,急需要找到全新的营收突破点,这也是百度商业化体系在视频生成模型上表现非常积极的重要原因之一。
和可灵AI一样,蒸汽机模型也采用会员订阅模式,但陈一凡看重的却并不是会员付费带来的收入。“以一个季度2.5亿元的会员付费收入来推算,视频生成模型一年能够带来的收入增量也仅有十几亿元,再减到算力方面的投入,模型本身的盈利空间是非常有限的。”
在他看来,如果视频生成模型能够提升用户在百度App的停留时长以及广告主在百度平台的广告投放意愿,这是一笔更为划算的生意。“哪怕它带来搜索广告1个百分点的提升,在营收提升上就是一个季度几十亿元的提升。”
从逻辑上看,视频生成模型在百度生态体系中承载了更大的想象空间,但蒸汽机模型最终是否能够带来广告客户在百度平台广告投放意愿的提升,还有待时间检验。
评论