正在阅读:

李开复的零一大模型套壳LLaMA算抄袭吗?

扫一扫下载界面新闻APP

李开复的零一大模型套壳LLaMA算抄袭吗?

首先涉嫌侵犯署名权;其次,LLaMA 2的软件协议对被授权人授权的前提条件是要公示权利标识,没有公示的,可以视为被授权人没有满足授权条件,所以其二次开发及发布均涉嫌侵权。

(创意图)图片来源:视觉中国

文丨游云庭( 上海大邦律师事务所高级合伙人,知识产权律师

近日,李开复投资的零一万物公司曝出其大模型“Yi”使用了Facebook母公司META的LLaMA大模型(全称为"Large Language Model META AI")的开源代码,对外却没有提及。套壳却不说明的做法引来了大量质疑。对此,该公司致歉称:正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中。该公司负责人表示公司不存在抄袭问题。今天就来跟大家聊聊,法律上,这种行为算不算抄袭?法律后果还有哪些?

先说结论。我国《著作权法》规定:署名权,即表明作者身份,在作品上署名的权利。所谓的抄袭,就是侵犯署名权的行为。零一万物的软件使用公司的源代码却不标来源,让别人看起来这部分内容是他们自己开发的,确实涉嫌侵犯署名权,也就是涉嫌抄袭。哪怕是他们是疏漏造成的,侵犯署名权也没跑。至于法律后果,我们要切换一个视角,要从LLaMA的著作权人META公司看,他们被侵了哪些权,就知道了。

一、著作权人META公司的权利

META公司虽然公开了LLaMA2的代码,但其在软件协议中做了多项保留,摘几点大家看看:

  1. 制作发行 LLaMA 材料或任何衍生作品,如果可供第三方使用,应向该第三方提供本协议的副本。并且公示权利标识:“LLaMA 2 已根据 LLaMA 2 社区许可证获得许可,版权所有 (c) META Platforms, Inc. 保留所有权利。”
  2. 不得使用将LLaMA用于改进任何其他大型语言模型,但LLaMA 2或其衍生作品除外。
  3. META对月活7亿用户的授权做了保留。如果被许可人使用LLaMA 2开发的软件产品月度活跃用户超过7亿人的,则被许可人应在此前的一个月向META申请代码许可授权,META有权自行决定是否进行授权,在META授权之前,被授权人无权行使任何权利。

以上条款是否有效?当然有效。LLaMA 2的软件著作权属于META,公开源代码时对权利进行保留,只要不违反法律规定,也是其合法权利。另外,笔者查了一下,OpenAI 用户协议和Claude用户协议中均含有不得用其服务改进竞争对手产品的条款,但Google Bard文心一言的用户协议则没有此类条款。

因为对授权进行了限制,所以虽然META公开了LLaMa 2的源代码,但开源软件机构Open Source并不认为这种做法属于开源,他们还特地发了个文章做了个说明:因为开源许可证不应歧视个人、团体或工作领域,而META对 LLaMa 模型和代码的许可时对月活超过7亿用户的开发者,以及用LLaMa改进其他大型语言模型做了授权限制,因此不符合开源标准。

二、零一万物公司有什么法律责任

笔者查了下零一万物公司的用户协议,其并未包含META对LLaMA 2软件协议中的限制,其也没有公示其大模型是使用LLaMA 2的代码进行了改编(目前已做部分修改)。所以首先涉嫌侵犯署名权,这个前文已述。其次,LLaMA 2的软件协议对被授权人授权的前提条件是要公示权利标识:“LLaMA 2已根据LLaMA 2社区许可证获得许可,版权所有 (c) META Platforms, Inc. 保留所有权利。”

如果没有公示的,可以视为被授权人没有满足授权条件,所以其二次开发及发布均涉嫌侵权,二次开发侵犯META公司的软件修改权,发布修改后的源代码及编译后的目标程序,则侵犯META公司的软件信息网络传播权。

同时,如果零一万物公司不承认套壳的,也就不能算LLaMA 2的衍生作品,会同时违反“不得使用将 LLaMA用于改进任何其他大型语言模型,但LLaMA 2或其衍生作品除外”的用户协议规定。

三、使用零一万物代码开发衍生作品者的法律风险

如果第三方开发者不了解情况,使用了零一万物公司隐匿来源的代码做再次开发的,同样会因为受零一万物公司的牵连,面临侵权法律风险。定性上,零一万物公司的法律风险,第三方开发者都有,只是如果不明知,侵权的性质就没有那么严重。

对零一万物公司侵权代码再次开发(含三次开发、四次开发……)的作品代码如果包含LLaMA 2代码的,首先会侵犯META的署名权,其次是META公司的软件修改权,发布修改后的源代码及编译后的目标程序,则侵犯了META公司的软件信息网络传播权。

LLaMA英文对应的是一种可爱的动物——美洲大羊驼,也就是中国网民俗称的“草泥马”。中文俗称虽然有点粗俗,但LLaMA的软件协议虽然对使用有限制,但规定其实并不严厉,如果像笔者之前介绍的《用GitHub上的开源代码训练人工智能违法吗?一文中提到的,是用了GPL协议项下的代码而不标识的,法律风险会更大。总之,我们对公开源代码软件的态度应该需要更加严谨,要用别人的代码,就应该遵守别人的开源协议,否则,不但自己可能侵权,还会连累用你产品开发衍生产品的人。

 

 

(本文仅代表作者观点。责编邮箱:yanguihua@jiemian.com。)

 

本文为转载内容,授权事宜请联系原著作权人。

Facebook

4.6k
  • Meta最强大模型超越GPT-4o,扎克伯格再次挑起开闭源之争
  • 英伟达推出新的AI Foundry服务,可配合Meta Llama 3.1 生成式AI模型使用

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

李开复的零一大模型套壳LLaMA算抄袭吗?

首先涉嫌侵犯署名权;其次,LLaMA 2的软件协议对被授权人授权的前提条件是要公示权利标识,没有公示的,可以视为被授权人没有满足授权条件,所以其二次开发及发布均涉嫌侵权。

(创意图)图片来源:视觉中国

文丨游云庭( 上海大邦律师事务所高级合伙人,知识产权律师

近日,李开复投资的零一万物公司曝出其大模型“Yi”使用了Facebook母公司META的LLaMA大模型(全称为"Large Language Model META AI")的开源代码,对外却没有提及。套壳却不说明的做法引来了大量质疑。对此,该公司致歉称:正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中。该公司负责人表示公司不存在抄袭问题。今天就来跟大家聊聊,法律上,这种行为算不算抄袭?法律后果还有哪些?

先说结论。我国《著作权法》规定:署名权,即表明作者身份,在作品上署名的权利。所谓的抄袭,就是侵犯署名权的行为。零一万物的软件使用公司的源代码却不标来源,让别人看起来这部分内容是他们自己开发的,确实涉嫌侵犯署名权,也就是涉嫌抄袭。哪怕是他们是疏漏造成的,侵犯署名权也没跑。至于法律后果,我们要切换一个视角,要从LLaMA的著作权人META公司看,他们被侵了哪些权,就知道了。

一、著作权人META公司的权利

META公司虽然公开了LLaMA2的代码,但其在软件协议中做了多项保留,摘几点大家看看:

  1. 制作发行 LLaMA 材料或任何衍生作品,如果可供第三方使用,应向该第三方提供本协议的副本。并且公示权利标识:“LLaMA 2 已根据 LLaMA 2 社区许可证获得许可,版权所有 (c) META Platforms, Inc. 保留所有权利。”
  2. 不得使用将LLaMA用于改进任何其他大型语言模型,但LLaMA 2或其衍生作品除外。
  3. META对月活7亿用户的授权做了保留。如果被许可人使用LLaMA 2开发的软件产品月度活跃用户超过7亿人的,则被许可人应在此前的一个月向META申请代码许可授权,META有权自行决定是否进行授权,在META授权之前,被授权人无权行使任何权利。

以上条款是否有效?当然有效。LLaMA 2的软件著作权属于META,公开源代码时对权利进行保留,只要不违反法律规定,也是其合法权利。另外,笔者查了一下,OpenAI 用户协议和Claude用户协议中均含有不得用其服务改进竞争对手产品的条款,但Google Bard文心一言的用户协议则没有此类条款。

因为对授权进行了限制,所以虽然META公开了LLaMa 2的源代码,但开源软件机构Open Source并不认为这种做法属于开源,他们还特地发了个文章做了个说明:因为开源许可证不应歧视个人、团体或工作领域,而META对 LLaMa 模型和代码的许可时对月活超过7亿用户的开发者,以及用LLaMa改进其他大型语言模型做了授权限制,因此不符合开源标准。

二、零一万物公司有什么法律责任

笔者查了下零一万物公司的用户协议,其并未包含META对LLaMA 2软件协议中的限制,其也没有公示其大模型是使用LLaMA 2的代码进行了改编(目前已做部分修改)。所以首先涉嫌侵犯署名权,这个前文已述。其次,LLaMA 2的软件协议对被授权人授权的前提条件是要公示权利标识:“LLaMA 2已根据LLaMA 2社区许可证获得许可,版权所有 (c) META Platforms, Inc. 保留所有权利。”

如果没有公示的,可以视为被授权人没有满足授权条件,所以其二次开发及发布均涉嫌侵权,二次开发侵犯META公司的软件修改权,发布修改后的源代码及编译后的目标程序,则侵犯META公司的软件信息网络传播权。

同时,如果零一万物公司不承认套壳的,也就不能算LLaMA 2的衍生作品,会同时违反“不得使用将 LLaMA用于改进任何其他大型语言模型,但LLaMA 2或其衍生作品除外”的用户协议规定。

三、使用零一万物代码开发衍生作品者的法律风险

如果第三方开发者不了解情况,使用了零一万物公司隐匿来源的代码做再次开发的,同样会因为受零一万物公司的牵连,面临侵权法律风险。定性上,零一万物公司的法律风险,第三方开发者都有,只是如果不明知,侵权的性质就没有那么严重。

对零一万物公司侵权代码再次开发(含三次开发、四次开发……)的作品代码如果包含LLaMA 2代码的,首先会侵犯META的署名权,其次是META公司的软件修改权,发布修改后的源代码及编译后的目标程序,则侵犯了META公司的软件信息网络传播权。

LLaMA英文对应的是一种可爱的动物——美洲大羊驼,也就是中国网民俗称的“草泥马”。中文俗称虽然有点粗俗,但LLaMA的软件协议虽然对使用有限制,但规定其实并不严厉,如果像笔者之前介绍的《用GitHub上的开源代码训练人工智能违法吗?一文中提到的,是用了GPL协议项下的代码而不标识的,法律风险会更大。总之,我们对公开源代码软件的态度应该需要更加严谨,要用别人的代码,就应该遵守别人的开源协议,否则,不但自己可能侵权,还会连累用你产品开发衍生产品的人。

 

 

(本文仅代表作者观点。责编邮箱:yanguihua@jiemian.com。)

 

本文为转载内容,授权事宜请联系原著作权人。