达沃斯也掀起AI版权争议：“不需要纽约时报” vs “这是偷窃”

by Oh Suyon

Published 17 Jan.2024 09:38(KST)

Updated 17 Jan.2024 14:24(KST)

open/close

奥特曼：“少量高质量数据很重要”
贝尼奥夫：“AI训练数据是被盗走的”

在世界经济论坛年会（WEF·达沃斯论坛）上，围绕人工智能（AI）侵犯知识产权（IP）的问题也展开了讨论。掀起生成式AI热潮的OpenAI主张，外界对AI导致知识产权侵权的担忧被严重夸大。但另一方则反驳称，AI企业是在窃取用于训练的数据。

开发ChatGPT的OpenAI首席执行官（CEO）Sam Altman于16日（当地时间）在瑞士达沃斯接受彭博社采访时表示：“我们的大部分研究都在探索如何从少量的高质量数据中学习到更多内容。”

Sam Altman OpenAI首席执行官9日在首尔汝矣岛63大厦出席由中小风险企业部主办的“K-Startups meet OpenAI”活动并进行对谈。照片=记者Kang Jinhyung aymsdream@

这番话正面反驳了有关OpenAI等AI初创公司擅自使用受版权保护资料来训练AI的指责。Altman CEO称：“有些人相信，我的训练数据对所有人都必不可少，而且极具价值，但总体而言事实并非如此。”他接着表示：“例如，OpenAI并不希望用纽约时报（NYT）的数据进行训练。”

纽约时报于2023年12月27日起诉OpenAI和微软，称该公司生产的数百万篇报道被擅自用于训练OpenAI的ChatGPT，由此导致ChatGPT在信息提供方面与纽约时报形成竞争。纽约时报还主张，在这一过程中，其广告、授权和订阅收入减少，造成高达数十亿美元的损失。在此之前，喜剧演员Sarah Silverman、热门剧集《权力的游戏》原著作者George R.R. Martin以及普利策奖获奖作家Michael Chabon等文化界人士也以侵犯版权为由，对OpenAI提起诉讼。

OpenAI则通过与拥有Politico、Business Insider、Bild等媒体的传媒集团Axel Springer以及美联社（AP）等新闻机构签订新闻使用协议，试图将法律风险降到最低。

Altman CEO表示：“OpenAI希望与媒体机构一起做的事情是，例如，当用户询问今天达沃斯发生了什么时，同时展示彭博社的报道和纽约时报的报道。”他还称：“有些人希望与OpenAI合作，但也有人并不愿意。”