正在阅读:

生成式AI都会做视频了 但商业化道路依旧漫长

扫一扫下载界面新闻APP

生成式AI都会做视频了 但商业化道路依旧漫长

生成式AI跑的有点太快了。

文|首席消费官 李东耳

生成式AI不仅成为国外科技领域的热门投资赛道,也正在逼疯内容创作者。

近期,Meta和谷歌先后发布了几条引爆科技圈的短视频。这些视频引发关注并非内容做得多优秀,反而都非常简单,比如一匹正在喝水的马,一只画画的玩具熊,或者一段骑摩托车的第一视角录像,随便找个高中生都可以随手录下一段。这些视频引爆全球的真正原因则在于它们的制作方式:AI内容生成。

这些短视频的创作方式非常简单,创作者仅仅需要向AI输入一段话,甚至只是说一下要求,AI就可以根据需要生成一段视频。

很多人在第一时间就认为,这对于短视频行业将是个巨大的冲击。尽管短视频的火热还只是近几年的事,但从生成式AI的发展速度来看,对视频创作者的冲击会在不久来临。

AI不会的艺术又少了一个

从文字到语音再到图片,Meta和谷歌已经用实际作品向大家宣布,AI已经可以根据使用者的需要“创作”人类目前大部分的艺术作品了。

这听上去很玄幻,但已经有人在这么做了。如AI语音播报也已经大量被应用在自媒体上;AIVA等AI制作软件让创作者可以在毫无音乐知识的情况下,仅仅通过AI就可以制作各种类型的音乐,并已经有AI歌曲作品出现。

近期生成式AI最火的事情除了这一次两大科技巨头发布的AI生成视频外,就是前段时间AI作画夺冠了。虽然AI生成视频这还是第一次,但AI作画已经出现了一段时间了,并且已经出现了不少可免费试用的工具。

随着AI开始能够创作视频作品后,也将有望进入电影等艺术领域,或许随着AI生成视频得到应用后,影视行业也将迎来一次大升级,特别是在场景和特效方面,未来也可只用短短几句话完成特效师加班一个月的工作。因此,AI生成视频作品一经公布,就有不少人想要让Meta和谷歌开源。

不过,谷歌表示出于安全和伦理的考虑,暂时不会发布两个视频生成模型的代码或Demo。虽然不知道谷歌何时能够解决这些问题,但也只是时间问题,更何况并非没有其他企业在研究相关技术。

国内也已经有不少生成式AI的应用。除AI续写、AI语音外,2022年1月,网易推出了一站式AI音乐创作平台“网易天音”,将用户编辑的新年祝福AI生成为歌曲,并在上半年推出了web端专业版。

此次亮相的AI自动生成视频也并非第一次被提出,国内字节跳动旗下的剪映APP提供AI生成视频功能,并可以免费使用。比如剪映的图文成片功能和谷歌类似,创作者可以通过几个关键词或一小段文字生成一段创意小视频。剪映还可以根据文字描述智能匹配视频素材,将视频包装为更垂直的内容作品,包括财经、历史、人文等类别。

生成式AI冲击内容生产者

AI生成视频与其他AI生成作品的方式并没有本质上的不同,只不过生成视频要比生成其他目前可以生成的作品要复杂一些,不仅计算成本高,还很依赖高质量文本视频数据数量。

但与其他类型生成类AI不同的是,若只是生成一个几秒钟的有声音的动图可能还没那么麻烦,但只能生成这种非常短的片段对人们的工作生活意义不大,人们需要的是让AI能够用视频的方式讲故事。

这也是相对于Meta而言,谷歌这次能够引起更多关注的原因。

谷歌发布的两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太多的差别。在Make-A-Video公布了AI生成的视频后,AI圈就已经玩了一波梗,一个能够做出更高清视频的AI还不足以在短时间内戳中兴奋点。

Phenaki更加令人震惊的地方在于,它可以制作出超过2分钟的连贯的也有确切内容的视频,这才是真正让人们感到恐惧的地方。因为无论AI生成的视频多么高清,也只能是为内容生产者提供一个灵感,一个素材,一个过场动画。但能够制作出有具体剧情内容的短视频就意味着,一些短视频创作由AI代替人工完成已经初步有了可能。

自AI诞生之日起,就一直有人担心人工会被AI取代,事实证明,当前的AI还无法胜任大部分创作工作,很多时候只是拿来娱乐,比如AI续写系列能够大火,就是因为AI总能在续写过程中创造出来一些非常搞笑甚至毫无逻辑的桥段。这样的作品娱乐足矣,或者可以在作者没有思绪的时候给他提供一些创作灵感,但真投入到工作中,必然需要大量的人工修改才能成为一个基本合格的作品。

但AI的发展速度已经超过大部分人的想象,并已经开始影响到人们的工作。

近日,成都的一份兼职插画师招聘启示引发了不少人的讨论。虽然该招聘启示文字读起来有点咄咄逼人,但只是直截了当地说出招聘需求而已,不足以击垮一个成年人内心。真正让其崩溃的是工作内容。

该招聘启事显示,该兼职的工作内容就一个,使用AI(人工智能)绘图生成不同风格的插画,筛选后精修。具体而言就是使用AI绘制软件,使用关键词生成图片,以及对作品进行清晰的图层文件夹整理工作。

从其招聘启事来看,这份名为插画师的工作实际上与插画师并没有什么关系,至少不涉及传统意义上的插画师的能力要求,只要能熟练掌握PS,能够翻墙,能够快速交稿,审美在正常人的范围内就可以。至于其绘画水平等专业素养反倒没有要求。

过去插画师这样的工作常被插画师们吐槽钱少事多没前途,但至少还算是个技术工种,但这种招聘需求的出现意味着插画师的门槛进一步降低了,竞争越来越激烈,还是一次对插画师职业前景的否定。当前AI生成还不够成熟,还需要“AI生成+人工干预”的方式进行插画绘制工作,那随着AI生成技术的成熟,未来这些底层的插画师们将何去何从?

如今常常被吐槽是“人工智障”的AI绘图已经威胁到了插画师们的职业生涯,已经初步具备视频制作能力的生成式AI的出现,进一步加深了人们对于人与AI如何共生的思考。这或许也是谷歌所说的伦理问题的一部分。

生成式AI元年到来

尽管生成式AI当前还离不开人工干预,但不可否认的是,生成式AI仍是AI发展的一个重要方向,具有非常大的发展潜力。在Meta、谷歌公布AI生成视频前就有观点认为,2022年将是生成式AI从技术成熟到深入社会基本面的元年。根据Gartner上半年的数据,预计到 2025 年,生成式AI将占所有生成数据的10%,当前这一比例不到1%。

生成式AI的应用场景也非常广阔,除了文创、新闻等内容生产行业外,生成式AI在医疗保健、数字商业、制造业、农业等多个行业都有丰富的应用前景,如帮助医生检测X射线、CT等设备扫描中的病变、创建商品的数字孪生体、辅助检测产品质量等。在XR、数字孪生、自动驾驶汽车等热门技术上也有丰富的应用空间。

但当前生成式AI仍有很多问题需要解决。

如文娱领域,不少人采用生成式AI进行创作的一个原因就是可以避免版权问题,但这并不代表没有隐患。

一方面,AI的创作也是将学习到数据按照要求重新组合起来,虽然颗粒度越来越细,但难免还是有眼尖的人会看出可能是参考了哪些作品,甚至有网友在社交平台上表示曾在某AI生成图片上隐约看到疑似签名的痕迹。另一方面,当前大部分AI生成平台多不主张版权或明确表示可以进行商用,但随着生成式AI逐步商业化,这样的版权环境是否存在,是否会出现新的版权问题也是需要讨论的。

生成式AI的逻辑与安全性也有待提升。当前的生成式AI很容易犯一些常识性的错误,在一些需要长期记忆的地方也容易出现问题。如在AI生成小说的过程中,经常会因为篇幅较长而出现前后矛盾的地方。

因此,即便生成式AI已经可以在很多领域得到应用,真要让生成式AI投入工作,还要通过大量的训练来避免因AI的“错误”造成的重大损失。毕竟医疗、制造业这些应用场景没有文创行业那样的试错空间。

本文为转载内容,授权事宜请联系原著作权人。

谷歌

5.2k
  • 核心通胀顽固,微软、谷歌财报亮眼,美股后市怎么走?
  • 谷歌据悉将扩大在台湾的硬件研发团队

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

生成式AI都会做视频了 但商业化道路依旧漫长

生成式AI跑的有点太快了。

文|首席消费官 李东耳

生成式AI不仅成为国外科技领域的热门投资赛道,也正在逼疯内容创作者。

近期,Meta和谷歌先后发布了几条引爆科技圈的短视频。这些视频引发关注并非内容做得多优秀,反而都非常简单,比如一匹正在喝水的马,一只画画的玩具熊,或者一段骑摩托车的第一视角录像,随便找个高中生都可以随手录下一段。这些视频引爆全球的真正原因则在于它们的制作方式:AI内容生成。

这些短视频的创作方式非常简单,创作者仅仅需要向AI输入一段话,甚至只是说一下要求,AI就可以根据需要生成一段视频。

很多人在第一时间就认为,这对于短视频行业将是个巨大的冲击。尽管短视频的火热还只是近几年的事,但从生成式AI的发展速度来看,对视频创作者的冲击会在不久来临。

AI不会的艺术又少了一个

从文字到语音再到图片,Meta和谷歌已经用实际作品向大家宣布,AI已经可以根据使用者的需要“创作”人类目前大部分的艺术作品了。

这听上去很玄幻,但已经有人在这么做了。如AI语音播报也已经大量被应用在自媒体上;AIVA等AI制作软件让创作者可以在毫无音乐知识的情况下,仅仅通过AI就可以制作各种类型的音乐,并已经有AI歌曲作品出现。

近期生成式AI最火的事情除了这一次两大科技巨头发布的AI生成视频外,就是前段时间AI作画夺冠了。虽然AI生成视频这还是第一次,但AI作画已经出现了一段时间了,并且已经出现了不少可免费试用的工具。

随着AI开始能够创作视频作品后,也将有望进入电影等艺术领域,或许随着AI生成视频得到应用后,影视行业也将迎来一次大升级,特别是在场景和特效方面,未来也可只用短短几句话完成特效师加班一个月的工作。因此,AI生成视频作品一经公布,就有不少人想要让Meta和谷歌开源。

不过,谷歌表示出于安全和伦理的考虑,暂时不会发布两个视频生成模型的代码或Demo。虽然不知道谷歌何时能够解决这些问题,但也只是时间问题,更何况并非没有其他企业在研究相关技术。

国内也已经有不少生成式AI的应用。除AI续写、AI语音外,2022年1月,网易推出了一站式AI音乐创作平台“网易天音”,将用户编辑的新年祝福AI生成为歌曲,并在上半年推出了web端专业版。

此次亮相的AI自动生成视频也并非第一次被提出,国内字节跳动旗下的剪映APP提供AI生成视频功能,并可以免费使用。比如剪映的图文成片功能和谷歌类似,创作者可以通过几个关键词或一小段文字生成一段创意小视频。剪映还可以根据文字描述智能匹配视频素材,将视频包装为更垂直的内容作品,包括财经、历史、人文等类别。

生成式AI冲击内容生产者

AI生成视频与其他AI生成作品的方式并没有本质上的不同,只不过生成视频要比生成其他目前可以生成的作品要复杂一些,不仅计算成本高,还很依赖高质量文本视频数据数量。

但与其他类型生成类AI不同的是,若只是生成一个几秒钟的有声音的动图可能还没那么麻烦,但只能生成这种非常短的片段对人们的工作生活意义不大,人们需要的是让AI能够用视频的方式讲故事。

这也是相对于Meta而言,谷歌这次能够引起更多关注的原因。

谷歌发布的两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太多的差别。在Make-A-Video公布了AI生成的视频后,AI圈就已经玩了一波梗,一个能够做出更高清视频的AI还不足以在短时间内戳中兴奋点。

Phenaki更加令人震惊的地方在于,它可以制作出超过2分钟的连贯的也有确切内容的视频,这才是真正让人们感到恐惧的地方。因为无论AI生成的视频多么高清,也只能是为内容生产者提供一个灵感,一个素材,一个过场动画。但能够制作出有具体剧情内容的短视频就意味着,一些短视频创作由AI代替人工完成已经初步有了可能。

自AI诞生之日起,就一直有人担心人工会被AI取代,事实证明,当前的AI还无法胜任大部分创作工作,很多时候只是拿来娱乐,比如AI续写系列能够大火,就是因为AI总能在续写过程中创造出来一些非常搞笑甚至毫无逻辑的桥段。这样的作品娱乐足矣,或者可以在作者没有思绪的时候给他提供一些创作灵感,但真投入到工作中,必然需要大量的人工修改才能成为一个基本合格的作品。

但AI的发展速度已经超过大部分人的想象,并已经开始影响到人们的工作。

近日,成都的一份兼职插画师招聘启示引发了不少人的讨论。虽然该招聘启示文字读起来有点咄咄逼人,但只是直截了当地说出招聘需求而已,不足以击垮一个成年人内心。真正让其崩溃的是工作内容。

该招聘启事显示,该兼职的工作内容就一个,使用AI(人工智能)绘图生成不同风格的插画,筛选后精修。具体而言就是使用AI绘制软件,使用关键词生成图片,以及对作品进行清晰的图层文件夹整理工作。

从其招聘启事来看,这份名为插画师的工作实际上与插画师并没有什么关系,至少不涉及传统意义上的插画师的能力要求,只要能熟练掌握PS,能够翻墙,能够快速交稿,审美在正常人的范围内就可以。至于其绘画水平等专业素养反倒没有要求。

过去插画师这样的工作常被插画师们吐槽钱少事多没前途,但至少还算是个技术工种,但这种招聘需求的出现意味着插画师的门槛进一步降低了,竞争越来越激烈,还是一次对插画师职业前景的否定。当前AI生成还不够成熟,还需要“AI生成+人工干预”的方式进行插画绘制工作,那随着AI生成技术的成熟,未来这些底层的插画师们将何去何从?

如今常常被吐槽是“人工智障”的AI绘图已经威胁到了插画师们的职业生涯,已经初步具备视频制作能力的生成式AI的出现,进一步加深了人们对于人与AI如何共生的思考。这或许也是谷歌所说的伦理问题的一部分。

生成式AI元年到来

尽管生成式AI当前还离不开人工干预,但不可否认的是,生成式AI仍是AI发展的一个重要方向,具有非常大的发展潜力。在Meta、谷歌公布AI生成视频前就有观点认为,2022年将是生成式AI从技术成熟到深入社会基本面的元年。根据Gartner上半年的数据,预计到 2025 年,生成式AI将占所有生成数据的10%,当前这一比例不到1%。

生成式AI的应用场景也非常广阔,除了文创、新闻等内容生产行业外,生成式AI在医疗保健、数字商业、制造业、农业等多个行业都有丰富的应用前景,如帮助医生检测X射线、CT等设备扫描中的病变、创建商品的数字孪生体、辅助检测产品质量等。在XR、数字孪生、自动驾驶汽车等热门技术上也有丰富的应用空间。

但当前生成式AI仍有很多问题需要解决。

如文娱领域,不少人采用生成式AI进行创作的一个原因就是可以避免版权问题,但这并不代表没有隐患。

一方面,AI的创作也是将学习到数据按照要求重新组合起来,虽然颗粒度越来越细,但难免还是有眼尖的人会看出可能是参考了哪些作品,甚至有网友在社交平台上表示曾在某AI生成图片上隐约看到疑似签名的痕迹。另一方面,当前大部分AI生成平台多不主张版权或明确表示可以进行商用,但随着生成式AI逐步商业化,这样的版权环境是否存在,是否会出现新的版权问题也是需要讨论的。

生成式AI的逻辑与安全性也有待提升。当前的生成式AI很容易犯一些常识性的错误,在一些需要长期记忆的地方也容易出现问题。如在AI生成小说的过程中,经常会因为篇幅较长而出现前后矛盾的地方。

因此,即便生成式AI已经可以在很多领域得到应用,真要让生成式AI投入工作,还要通过大量的训练来避免因AI的“错误”造成的重大损失。毕竟医疗、制造业这些应用场景没有文创行业那样的试错空间。

本文为转载内容,授权事宜请联系原著作权人。