要垄断能赚钱的ChatGPT？抛弃“开放”的OpenAI

by Choi Yuri

Published 20 Mar.2023 18:57(KST)

OpenAI 去掉核心技术后公开 GPT-4
“意在垄断超大规模 AI 技术、主导生态”

美国人工智能（AI）初创企业OpenAI因不再公开此前一直对外披露的模型规模、训练数据等核心开发信息而引发争议。以超大规模AI模型“GPT-4”发布为分水岭，其战略发生了转变。分析认为，在围绕超大模型主导权的竞争日益激烈、并且通过AI聊天机器人“ChatGPT”开始实现盈利的背景下，该公司选择不再公开技术，而是转向技术垄断。

OpenAI不公开GPT-4核心技术

OpenAI近期在发布GPT-4的同时公布了技术报告。通过这份技术报告，OpenAI介绍了GPT-4在美国律师资格考试模拟考等各类资格考试以及美国大学入学考试（SAT）各个科目考试中取得的成绩，并展示了其与前一版本相比的性能表现。同时还公开了应用程序编程接口（API）。企业可以借助GPT-4开发各种应用程序，相当于向外界提供了相关工具。

相反，关于模型规模、训练数据、训练方法等信息则未予公开。开发超大规模AI模型所必需的核心信息被一并剔除。如果类比为汽车发动机，外界可以使用构成发动机的零部件，但却无从得知制造发动机的技术。

这与此前共享开发信息的做法形成鲜明对比。决定AI性能的参数数量就是典型例子。GPT-1的参数为1.17亿个，GPT-2为15亿个，GPT-3和3.5版本则各为1750亿个，当时这些参数规模都对外公开，但GPT-4的参数数量却成了秘密。业内目前只能推测其模型规模较此前略有扩大。

这也与OpenAI创立初期提出的愿景不符。OpenAI于2015年以非营利公司身份成立时，曾强调开放与共享，以“为全人类开发AI”为目标，积极开展技术合作。

Naver Cloud AI实验室所长Ha Jungwoo表示：“OpenAI将其他研究团队提出的成果在技术上很好地融合起来，才发展出了GPT模型，例如自监督学习（在仅有极少数据的情况下，AI自行寻找规律并加以分析的技术）、神经网络模型（通过训练模型预测句子中的下一个词，从而学习语言的AI技术）等。”他指出，“（如今关闭技术公开）这扇门，在一定程度上背离了迄今为止AI发展的理念。”

“规避风险并垄断技术与收益”

专家认为，随着超大规模AI模型开发竞争日趋激烈，OpenAI已将战略调整为技术垄断。谷歌相继推出名为“LaMDA”的自家AI模型，Meta也接连发布名为“LLaMA”的自研AI模型。

在OpenAI的ChatGPT开始赚钱之后，技术抢占战被彻底点燃。OpenAI上月推出了月费20美元的“ChatGPT Plus”版本，用户可优先体验新功能或更快的检索速度。上线仅三天，付费用户就突破100万名。业内认为，现有ChatGPT用户的付费转化率在5%以上。即便按目前用户规模仅按1亿人计算，月收入也将超过1亿美元（约合1300亿韩元）。此外，微软（Microsoft，MS）还计划将GPT-4应用于Word、Excel、PowerPoint等办公软件（Software），正式推进商业化变现。

外界还看到其试图规避法律风险的用意。如果公开GPT-4所学习的数据，可能会引发版权纠纷。随着借助ChatGPT的生成式AI走红，版权诉讼呈急剧增加趋势。生成式AI是指通过学习文档、图像等内容后生成新内容的AI。OpenAI也在去年11月卷入了程序员提起的版权诉讼。程序员们起诉称，OpenAI无偿获取他们上传的代码，并将其用于训练AI。