正在阅读:

发布视觉大模型、发力B端,美图围绕AI求变

扫一扫下载界面新闻APP

发布视觉大模型、发力B端,美图围绕AI求变

由服务生活场景向服务生产力场景的转型思路,在此次美图所发布的新产品矩阵中多有体现。

图片来源:视觉中国

界面新闻记者 | 于浩

近日,美图一口气发布了AI视觉创作工具WHEE、AI口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、主打AI商业设计的美图设计室2.0、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision等7款产品。 

此次美图发布的新产品大多会于7月份正式上线,视觉大模型MiracleVision也将于近期开始在美图旗下产品内测。美图公司创始人、董事长兼首席执行官吴欣鸿强调,7款产品发布后,美图逐步形成了由底层、中间层和应用层构建的AI产品生态。

应用层,美图在AI图片、AI视频、AI设计、AI数字人领域探索,并由美图秀秀实现AI影像服务聚合;中间层,美图提供了美图AI开放平台、美图创意平台、美图AI助手RoboNeo的组合;底层则是MiracleVision视觉大模型,为美图全系产品提供AI模型能力。

美图给此次发布的视觉大模型MiracleVision打上的标签为“懂美学”。据美图介绍,MiracleVision从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化,擅长亚洲人像摄影、国风国潮、商业设计等生成方向。 

与文本相比,视觉大模型的训练所消耗的算力会更大;在数据采集方面,图像数据较文本数据更难获取、数据质量也更加参差不齐。如何优化模型结构降低算力消耗、更高效地实现数据的收集和清洗,这些问题都增加了视觉大模型的研发难度。 

美图公司技术副总裁兼美图影像研究院负责人刘洛麒也表示,即便图像模型参数规模扩大至与文本大模型相近的程度,可能还是不够的。他认为,文本本质上是一种压缩过的抽象化表达,而图像则是对真实世界的客观展现,本身带有密度很高的冗余信息。因此,图像模型需要更大的参数规模,这也会是未来需要去突破的技术难点。 

AI相关的投入、视觉大模型的研发成本在美图的财报中也有所体现。2022年美图公司研发投入为人民币5.86亿元,同比2021年增长7.5%。面对研发成本问题,美图选择以构建模型生态的方式来分摊压力。

吴欣鸿提及,未来创作者可以基于MiracleVision进行二次训练,其训练的模型可以在美图旗下产品进行分发,还可以通过API或SDK进行商业使用从中获益。借由这种方式,美图试图围绕MiracleVision搭建起模型生态,以此来反哺模型所需的计算资源、优化模型。 

另一方面,美图也在积极开源以补充其在AI方面的投入。2022年美图公司经调整后归属于母公司权益持有人的净利润为人民币1.11亿元,同比增长29.9%。能够实现全年盈利的一大原因就是VIP订阅业务及SaaS相关业务的营收增长。 

据吴欣鸿透露,截至6月18日,美图的全球VIP会员数从去年影像节公布的450万增长至719万。2022年美图公司VIP订阅业务实现收入7.82亿元,同比增长57.4%。作为简单直接的变现方式,开放VIP订阅服务迅速为美图创造了营收新增长点,但另一方面也带来了用户流失的潜在可能。

对此,美图公司集团高级副总裁,影像产业事业群总裁陈剑毅回应称,在设计VIP功能时美图会秉持“抓小众、刚需”的思路。他以发际线修补功能为例,覆盖的用户不会很多,但是对应到具体用户群时就会成为痛点需求,这类功能才会考虑被列入VIP功能,以此来平衡用户体验与商业化之间的冲突。

在此次影音节上,吴欣鸿曾多次强调了美图正在经历由服务生活场景向生产力场景的变化,这背后正是美图所找到的另一个增长点。上述服务场景转型的思路,在此次美图所发布的新产品矩阵中多有体现。其中,如桌面端AI视频编辑工具WinkStudio就是由原先的Wink产品孵化而来。

在美图的服务场景中,一项底层技术在B端与C端两侧可能会衍生出不同的使用场景。如C端用户用来截取人像的抠图功能,就能够应用到电商商家生成商品图的场景中,而两者在底层技术上是共通的。 

“美图算是主动求变,”吴欣鸿表示,“今天美图产品的工具属性已经发生变化。在AI时代,除生活场景外,美图将提供更多生产力场景的服务,如视觉创作、商业摄影、专业视频编辑、商业设计等等。”与之相对应,2022年美图SaaS及相关收入同比增长1093.2%至4.63亿元。

但具体到文生图、数字人、AI视频剪辑等应用场景上,美图此次发布的新产品不乏竞争对手。在吴欣鸿看来,美图的竞争优势会主要体现在美学积累、用户基数以及使用场景方面。“我们目前是2.43亿的月活,所以我们可以在很短的时间内验证产品。”他表示,“用户在美化自己照片时弹出提示是否要创建自己的数字人,这对用户来说是很自然的场景。”

通过VIP订阅服务、B端转型的方式完成开源,进一步加大对AI方面的研发投入,最终实现AI对业务的反哺,美图希望以此来实现各项业务的正向运转。从目前的业绩数据来看,AI对业绩数据的拉动已经初步得到显现——据吴欣鸿所说,在今年4月份推出的“AI动漫”功能对营收的拉动作用相当明显。

“我觉得现在依然是机会和挑战并存,挑战其实还是非常大的,机会要看我们能不能抓得住。”吴欣鸿说,“因为AI让很多小团队甚至个人,都能够很快地去推出产品,所以我觉得美图还是要保持如履薄冰的心态。”

产品发布当日截至港股收盘,美图股价大涨21.28%。截至今日收盘,美图港股股价报3.27港元/股,较开盘价上涨5.83%。 

未经正式授权严禁转载本文,侵权必究。

美图

4.3k
  • 港股收评:指数低开高走,恒生科技指数涨1.25%,科网股持续走强,石油、内房股下挫
  • 科网股午后持续走强,美图公司16.83%领涨,港股互联网ETF(513770)飙涨超3%,荣登A股榜首

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

发布视觉大模型、发力B端,美图围绕AI求变

由服务生活场景向服务生产力场景的转型思路,在此次美图所发布的新产品矩阵中多有体现。

图片来源:视觉中国

界面新闻记者 | 于浩

近日,美图一口气发布了AI视觉创作工具WHEE、AI口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、主打AI商业设计的美图设计室2.0、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision等7款产品。 

此次美图发布的新产品大多会于7月份正式上线,视觉大模型MiracleVision也将于近期开始在美图旗下产品内测。美图公司创始人、董事长兼首席执行官吴欣鸿强调,7款产品发布后,美图逐步形成了由底层、中间层和应用层构建的AI产品生态。

应用层,美图在AI图片、AI视频、AI设计、AI数字人领域探索,并由美图秀秀实现AI影像服务聚合;中间层,美图提供了美图AI开放平台、美图创意平台、美图AI助手RoboNeo的组合;底层则是MiracleVision视觉大模型,为美图全系产品提供AI模型能力。

美图给此次发布的视觉大模型MiracleVision打上的标签为“懂美学”。据美图介绍,MiracleVision从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化,擅长亚洲人像摄影、国风国潮、商业设计等生成方向。 

与文本相比,视觉大模型的训练所消耗的算力会更大;在数据采集方面,图像数据较文本数据更难获取、数据质量也更加参差不齐。如何优化模型结构降低算力消耗、更高效地实现数据的收集和清洗,这些问题都增加了视觉大模型的研发难度。 

美图公司技术副总裁兼美图影像研究院负责人刘洛麒也表示,即便图像模型参数规模扩大至与文本大模型相近的程度,可能还是不够的。他认为,文本本质上是一种压缩过的抽象化表达,而图像则是对真实世界的客观展现,本身带有密度很高的冗余信息。因此,图像模型需要更大的参数规模,这也会是未来需要去突破的技术难点。 

AI相关的投入、视觉大模型的研发成本在美图的财报中也有所体现。2022年美图公司研发投入为人民币5.86亿元,同比2021年增长7.5%。面对研发成本问题,美图选择以构建模型生态的方式来分摊压力。

吴欣鸿提及,未来创作者可以基于MiracleVision进行二次训练,其训练的模型可以在美图旗下产品进行分发,还可以通过API或SDK进行商业使用从中获益。借由这种方式,美图试图围绕MiracleVision搭建起模型生态,以此来反哺模型所需的计算资源、优化模型。 

另一方面,美图也在积极开源以补充其在AI方面的投入。2022年美图公司经调整后归属于母公司权益持有人的净利润为人民币1.11亿元,同比增长29.9%。能够实现全年盈利的一大原因就是VIP订阅业务及SaaS相关业务的营收增长。 

据吴欣鸿透露,截至6月18日,美图的全球VIP会员数从去年影像节公布的450万增长至719万。2022年美图公司VIP订阅业务实现收入7.82亿元,同比增长57.4%。作为简单直接的变现方式,开放VIP订阅服务迅速为美图创造了营收新增长点,但另一方面也带来了用户流失的潜在可能。

对此,美图公司集团高级副总裁,影像产业事业群总裁陈剑毅回应称,在设计VIP功能时美图会秉持“抓小众、刚需”的思路。他以发际线修补功能为例,覆盖的用户不会很多,但是对应到具体用户群时就会成为痛点需求,这类功能才会考虑被列入VIP功能,以此来平衡用户体验与商业化之间的冲突。

在此次影音节上,吴欣鸿曾多次强调了美图正在经历由服务生活场景向生产力场景的变化,这背后正是美图所找到的另一个增长点。上述服务场景转型的思路,在此次美图所发布的新产品矩阵中多有体现。其中,如桌面端AI视频编辑工具WinkStudio就是由原先的Wink产品孵化而来。

在美图的服务场景中,一项底层技术在B端与C端两侧可能会衍生出不同的使用场景。如C端用户用来截取人像的抠图功能,就能够应用到电商商家生成商品图的场景中,而两者在底层技术上是共通的。 

“美图算是主动求变,”吴欣鸿表示,“今天美图产品的工具属性已经发生变化。在AI时代,除生活场景外,美图将提供更多生产力场景的服务,如视觉创作、商业摄影、专业视频编辑、商业设计等等。”与之相对应,2022年美图SaaS及相关收入同比增长1093.2%至4.63亿元。

但具体到文生图、数字人、AI视频剪辑等应用场景上,美图此次发布的新产品不乏竞争对手。在吴欣鸿看来,美图的竞争优势会主要体现在美学积累、用户基数以及使用场景方面。“我们目前是2.43亿的月活,所以我们可以在很短的时间内验证产品。”他表示,“用户在美化自己照片时弹出提示是否要创建自己的数字人,这对用户来说是很自然的场景。”

通过VIP订阅服务、B端转型的方式完成开源,进一步加大对AI方面的研发投入,最终实现AI对业务的反哺,美图希望以此来实现各项业务的正向运转。从目前的业绩数据来看,AI对业绩数据的拉动已经初步得到显现——据吴欣鸿所说,在今年4月份推出的“AI动漫”功能对营收的拉动作用相当明显。

“我觉得现在依然是机会和挑战并存,挑战其实还是非常大的,机会要看我们能不能抓得住。”吴欣鸿说,“因为AI让很多小团队甚至个人,都能够很快地去推出产品,所以我觉得美图还是要保持如履薄冰的心态。”

产品发布当日截至港股收盘,美图股价大涨21.28%。截至今日收盘,美图港股股价报3.27港元/股,较开盘价上涨5.83%。 

未经正式授权严禁转载本文,侵权必究。