奥特曼:“少量高质量数据很重要”
贝尼奥夫:“AI训练数据是被盗走的”

在世界经济论坛年会(WEF·达沃斯论坛)上,围绕人工智能(AI)侵犯知识产权(IP)的问题也展开了讨论。掀起生成式AI热潮的OpenAI主张,外界对AI导致知识产权侵权的担忧被严重夸大。但另一方则反驳称,AI企业是在窃取用于训练的数据。


开发ChatGPT的OpenAI首席执行官(CEO)Sam Altman于16日(当地时间)在瑞士达沃斯接受彭博社采访时表示:“我们的大部分研究都在探索如何从少量的高质量数据中学习到更多内容。”

Sam Altman OpenAI首席执行官9日在首尔汝矣岛63大厦出席由中小风险企业部主办的“K-Startups meet OpenAI”活动并进行对谈。照片=记者Kang Jinhyung aymsdream@

Sam Altman OpenAI首席执行官9日在首尔汝矣岛63大厦出席由中小风险企业部主办的“K-Startups meet OpenAI”活动并进行对谈。照片=记者Kang Jinhyung aymsdream@

View original image

这番话正面反驳了有关OpenAI等AI初创公司擅自使用受版权保护资料来训练AI的指责。Altman CEO称:“有些人相信,我的训练数据对所有人都必不可少,而且极具价值,但总体而言事实并非如此。”他接着表示:“例如,OpenAI并不希望用纽约时报(NYT)的数据进行训练。”


纽约时报于2023年12月27日起诉OpenAI和微软,称该公司生产的数百万篇报道被擅自用于训练OpenAI的ChatGPT,由此导致ChatGPT在信息提供方面与纽约时报形成竞争。纽约时报还主张,在这一过程中,其广告、授权和订阅收入减少,造成高达数十亿美元的损失。在此之前,喜剧演员Sarah Silverman、热门剧集《权力的游戏》原著作者George R.R. Martin以及普利策奖获奖作家Michael Chabon等文化界人士也以侵犯版权为由,对OpenAI提起诉讼。


OpenAI则通过与拥有Politico、Business Insider、Bild等媒体的传媒集团Axel Springer以及美联社(AP)等新闻机构签订新闻使用协议,试图将法律风险降到最低。


Altman CEO表示:“OpenAI希望与媒体机构一起做的事情是,例如,当用户询问今天达沃斯发生了什么时,同时展示彭博社的报道和纽约时报的报道。”他还称:“有些人希望与OpenAI合作,但也有人并不愿意。”

右侧为Salesforce首席执行官 Marc Benioff 图片由AFP韩联社提供

右侧为Salesforce首席执行官 Marc Benioff 图片由AFP韩联社提供

View original image

相反,拥有时事周刊《TIME》的Salesforce首席执行官(CEO)Marc Benioff则尖锐指出,AI企业为构建技术而窃取了知识产权(IP)。


Benioff CEO当日同样在接受彭博社采访时表示:“所有训练数据都是被盗取的。”他称,“包括泰晤士报和纽约时报在内的媒体内容,正在作为AI企业的成果呈现出来。”据彭博社报道,目前泰晤士报、CNN和福克斯等正与OpenAI推进授权协议谈判。



Benioff CEO还指出,对用于AI训练的数据进行价值评估也存在困难。他表示:“没有人能准确说出AI所学习数据的公平价格是多少。”但他同时强调,为了公平对待内容创作者,AI企业必须将支付体系标准化。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点