界面新闻记者 |
界面新闻编辑 | 刘方远
继去年7月发布国内首部由大模型深度参与制作的微短剧《山海奇镜之劈波斩浪》之后,快手近日再次发布由大模型参与制作的AI单元故事集《新世界加载中》。
《新世界加载中》由异类Outliers团队制作,共包含7部单元剧集,涵盖科幻、奇幻、荒诞喜剧、历史等多元题材,总时长达180分钟,该剧也是目前业内叙事体量最大的AIGC剧集作品。
《新世界加载中》总导演、异类Outliers创始人陈翔宇向界面新闻透露,去年他第一次尝试使用大模型的文生视频功能之后,用一晚上时间生成了一辆小汽车飞向太空的短片。这次尝试让他意识到,商用标准影像多了一种来自AI大模型的、不依赖于实拍的传统动画流程的表达路径。
陈翔宇因此有了使用大模型制作单元剧集的想法。在他看来,在制作过程中,《新世界加载中》实现了多项技术突破,包括美学表达、镜头结构、复杂动作场景与细节的全面呈现等。
在观看《新世界加载中》之后,界面新闻记者也把它和快手去年发布的《山海奇镜之劈波斩浪》进行了对比,两部短片在画面上确实呈现出了较为明显的差异。
一方面是画面风格更加自然多变。《山海奇镜之劈波斩浪》部分妖怪形象符合中国古代设定,但也有一些看起来风格迥异,整体美术风格AI感明显,给人一种违和的感觉。相比之下,《新世界加载中》在不同的单元剧集中尝试了东方美学、速涂绘画、黏土动画等多种风格,画面也更加自然。
另一方面,人物表情、场景、物体比例与透视等细节处理更加到位。《山海奇镜之劈波斩浪》物面部特写质感差,存在表情僵硬、口型对不上、微表情缺失等问题,关键道具存在透视角度不合理、大小比例失调等问题。在《新世界加载中》中,这些问题都得到了解决,一些镜头的细节处理达到了非常细腻的程度。
这些变化,主要是因为视频生成模型在技术能力上取得了诸多突破。
比如,随着多模态融合发展迅速,新一代模型支持“文本+图像+音频”混合输入,能分别解析各模态信息,并通过动态注意力机制实现跨模态信息对齐,确保生成视频的视听一致性误差极小。
在物理规律与细节模拟上,模型借助物理引擎整合,能够准确模拟流体动力学、刚体运动等,咖啡倾倒、布料褶皱、爆炸特效等复杂动态和细节的还原度大幅提升,使生成内容更贴近真实世界。
据记者了解,《新世界加载中》制作过程中使用了多款大模型,其中超过50%的素材由快手旗下可灵AI生成。陈翔宇透露,剧集制作流程当中,不仅前期的文生图、图生视频都可以使用可灵AI等大模型生成更多素材,制作中期的动画也可以使用大模型制作。
在陈翔宇看来,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。“借助AI大模型,我们很好地实现了人物与风格一致性的问题。同时,AI大模型也让制作成本实现了大幅降低。”
对于大模型对整个制作成本和效率带来的改变,陈翔宇并没有给出准确的数字。他表示,制作过程中,一些原本需要实拍的物体以及主创人员都可以用AIGC替代,都是降本增效。
可灵AI产品及运营负责人李杨对界面新闻表示,这一年时间AI生成视频的能力有很大提升,比如可灵AI在语义跟从、运动表现等方面都有了明显的进步,创作者也能够用大模型做出效果更加出色的片子。
但李杨也强调,当下的AI创作还远远没有达到一键生成的程度。“从拿到工具开始,如何写Prompt、如何调和生成自己脑海中的效果,这个非常专业和考验人的韧性,现在仍以相对偏专业创作者为主。”
评论