OpenAI 去掉核心技术后公开 GPT-4
“意在垄断超大规模 AI 技术、主导生态”
美国人工智能(AI)初创企业OpenAI因不再公开此前一直对外披露的模型规模、训练数据等核心开发信息而引发争议。以超大规模AI模型“GPT-4”发布为分水岭,其战略发生了转变。分析认为,在围绕超大模型主导权的竞争日益激烈、并且通过AI聊天机器人“ChatGPT”开始实现盈利的背景下,该公司选择不再公开技术,而是转向技术垄断。
OpenAI不公开GPT-4核心技术
OpenAI近期在发布GPT-4的同时公布了技术报告。通过这份技术报告,OpenAI介绍了GPT-4在美国律师资格考试模拟考等各类资格考试以及美国大学入学考试(SAT)各个科目考试中取得的成绩,并展示了其与前一版本相比的性能表现。同时还公开了应用程序编程接口(API)。企业可以借助GPT-4开发各种应用程序,相当于向外界提供了相关工具。
相反,关于模型规模、训练数据、训练方法等信息则未予公开。开发超大规模AI模型所必需的核心信息被一并剔除。如果类比为汽车发动机,外界可以使用构成发动机的零部件,但却无从得知制造发动机的技术。
这与此前共享开发信息的做法形成鲜明对比。决定AI性能的参数数量就是典型例子。GPT-1的参数为1.17亿个,GPT-2为15亿个,GPT-3和3.5版本则各为1750亿个,当时这些参数规模都对外公开,但GPT-4的参数数量却成了秘密。业内目前只能推测其模型规模较此前略有扩大。
这也与OpenAI创立初期提出的愿景不符。OpenAI于2015年以非营利公司身份成立时,曾强调开放与共享,以“为全人类开发AI”为目标,积极开展技术合作。
Naver Cloud AI实验室所长Ha Jungwoo表示:“OpenAI将其他研究团队提出的成果在技术上很好地融合起来,才发展出了GPT模型,例如自监督学习(在仅有极少数据的情况下,AI自行寻找规律并加以分析的技术)、神经网络模型(通过训练模型预测句子中的下一个词,从而学习语言的AI技术)等。”他指出,“(如今关闭技术公开)这扇门,在一定程度上背离了迄今为止AI发展的理念。”
“规避风险并垄断技术与收益”
专家认为,随着超大规模AI模型开发竞争日趋激烈,OpenAI已将战略调整为技术垄断。谷歌相继推出名为“LaMDA”的自家AI模型,Meta也接连发布名为“LLaMA”的自研AI模型。
在OpenAI的ChatGPT开始赚钱之后,技术抢占战被彻底点燃。OpenAI上月推出了月费20美元的“ChatGPT Plus”版本,用户可优先体验新功能或更快的检索速度。上线仅三天,付费用户就突破100万名。业内认为,现有ChatGPT用户的付费转化率在5%以上。即便按目前用户规模仅按1亿人计算,月收入也将超过1亿美元(约合1300亿韩元)。此外,微软(Microsoft,MS)还计划将GPT-4应用于Word、Excel、PowerPoint等办公软件(Software),正式推进商业化变现。
外界还看到其试图规避法律风险的用意。如果公开GPT-4所学习的数据,可能会引发版权纠纷。随着借助ChatGPT的生成式AI走红,版权诉讼呈急剧增加趋势。生成式AI是指通过学习文档、图像等内容后生成新内容的AI。OpenAI也在去年11月卷入了程序员提起的版权诉讼。程序员们起诉称,OpenAI无偿获取他们上传的代码,并将其用于训练AI。
Ha所长表示:“OpenAI似乎打算在独占超大规模AI模型技术的同时,仅公开API,把各方拉入OpenAI的生态体系之中。”他还预测称:“一家公司开始关上大门后,其他大型科技企业也可能跟进。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。