学习数百万本图书的AI获免责…“变形性利用”决定胜负

by Lee Jonggil

Published 27 Feb.2026 08:00(KST)

Updated 27 Feb.2026 15:57(KST)

open/close

美法院称“类似人类阅读” 承认变形性
对商业服务和非法数据收集严加限制

在著作权法上，生成式人工智能（AI）对作品进行学习要被认定为合理使用，其标准十分明确：必须证明属于变形性利用，并且要彻底消除对原作品市场被侵蚀的忧虑。

文化体育观光部和韩国著作权委员会于26日发布的《生成式人工智能作品学习之著作权法上合理使用指引》，对美国、欧洲等主要国家的最新判例进行了深入分析，提出了判断AI学习是否构成著作权侵权的明确法律标准。

指引在第一要素“利用的目的及性质”中对变形性利用进行了重点阐释。所谓变形性利用，是指人工智能并非单纯替代原作品，而是将其转化为新的表达、意义或信息，从而赋予新的价值的行为。即便以营利为目的开发人工智能，只要不侵害既有作品市场并创造新的价值，就为被认定为合理使用预留了空间。相反，即使是以非营利为目的的研究机构，如果对原作品进行直接模仿，使其沦为经济上的替代品，也将受到严厉制裁。

美国最新的一审判例普遍宽泛认可变形性利用，呈现出支持技术霸权的趋势。美国加利福尼亚北部联邦地区法院认定，Anthropic在大规模语言模型Claude的训练过程中复制合法购买的图书的行为属于合理使用。法院认为，人工智能在不对外再现特定作品的具体表达的前提下，仅对语法、结构等非表达性抽象要素进行统计式提取的行为，与人类阅读大量书籍并将其内化的过程相似。在Meta利用非法图书库数据训练LLaMA的案件中，法院同样将语言模型训练本身认定为高度变形性的利用。

但是，对于与原作品直接竞争的商业性服务，美国和欧洲都采取了严格标准。美国特拉华联邦地区法院认定，Ross Intelligence未经授权学习竞争对手Thomson Reuters的法律数据库，以此开发出类似的法律人工智能搜索引擎的行为属于违法。法院认为，该行为与原作品具有相同目的，属于非变形性利用，并且极有可能直接侵蚀竞争对手的市场。

德国慕尼黑第一地方法院同样裁定，OpenAI的ChatGPT未经授权学习音乐著作权团体GEMA的歌词并加以原样再现的行为，构成对复制权和向公众传播权的明显侵害。法院明确表示，模型记忆并永久保存训练数据的行为，不能适用“文本数据挖掘”例外条款。

必读新闻

“股票不用交税” 明年起年超250万韩元币圈收益征税…投资者强烈反对

即便能够证明以变形性利用为目的，如果是通过窃取数据进行训练，也不能指望免责。在前述Anthropic判决中，法院允许对合法购买的图书进行学习，但将利用非法网站下载的图书视为明显的著作权侵权。由此，Anthropic已着手对非法收集的数据集进行永久销毁，并向集体诉讼参与者支付大额和解金。我国政府的指引同样警告称，绕过机器人排除标准或访问限制措施而非法收集的数据，从根本上就不在合理使用保护范围之内。

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。