美法院称“类似人类阅读” 承认变形性
对商业服务和非法数据收集严加限制

学习数百万本图书的AI获免责…“变形性利用”决定胜负 View original image

在著作权法上,生成式人工智能(AI)对作品进行学习要被认定为合理使用,其标准十分明确:必须证明属于变形性利用,并且要彻底消除对原作品市场被侵蚀的忧虑。


文化体育观光部和韩国著作权委员会于26日发布的《生成式人工智能作品学习之著作权法上合理使用指引》,对美国、欧洲等主要国家的最新判例进行了深入分析,提出了判断AI学习是否构成著作权侵权的明确法律标准。


指引在第一要素“利用的目的及性质”中对变形性利用进行了重点阐释。所谓变形性利用,是指人工智能并非单纯替代原作品,而是将其转化为新的表达、意义或信息,从而赋予新的价值的行为。即便以营利为目的开发人工智能,只要不侵害既有作品市场并创造新的价值,就为被认定为合理使用预留了空间。相反,即使是以非营利为目的的研究机构,如果对原作品进行直接模仿,使其沦为经济上的替代品,也将受到严厉制裁。


美国最新的一审判例普遍宽泛认可变形性利用,呈现出支持技术霸权的趋势。美国加利福尼亚北部联邦地区法院认定,Anthropic在大规模语言模型Claude的训练过程中复制合法购买的图书的行为属于合理使用。法院认为,人工智能在不对外再现特定作品的具体表达的前提下,仅对语法、结构等非表达性抽象要素进行统计式提取的行为,与人类阅读大量书籍并将其内化的过程相似。在Meta利用非法图书库数据训练LLaMA的案件中,法院同样将语言模型训练本身认定为高度变形性的利用。


学习数百万本图书的AI获免责…“变形性利用”决定胜负 View original image

但是,对于与原作品直接竞争的商业性服务,美国和欧洲都采取了严格标准。美国特拉华联邦地区法院认定,Ross Intelligence未经授权学习竞争对手Thomson Reuters的法律数据库,以此开发出类似的法律人工智能搜索引擎的行为属于违法。法院认为,该行为与原作品具有相同目的,属于非变形性利用,并且极有可能直接侵蚀竞争对手的市场。


德国慕尼黑第一地方法院同样裁定,OpenAI的ChatGPT未经授权学习音乐著作权团体GEMA的歌词并加以原样再现的行为,构成对复制权和向公众传播权的明显侵害。法院明确表示,模型记忆并永久保存训练数据的行为,不能适用“文本数据挖掘”例外条款。



即便能够证明以变形性利用为目的,如果是通过窃取数据进行训练,也不能指望免责。在前述Anthropic判决中,法院允许对合法购买的图书进行学习,但将利用非法网站下载的图书视为明显的著作权侵权。由此,Anthropic已着手对非法收集的数据集进行永久销毁,并向集体诉讼参与者支付大额和解金。我国政府的指引同样警告称,绕过机器人排除标准或访问限制措施而非法收集的数据,从根本上就不在合理使用保护范围之内。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点