“GPT-oss”开源模型发布…GPT-2以来首次

聊天机器人GPT的开发公司OpenAI表示,将公开两个可以模仿人类推理过程的免费人工智能(AI)模型。


美联社联合新闻社提供

美联社联合新闻社提供

View original image

OpenAI称,将于5日(当地时间)在AI软件托管平台Hugging Face上公开“GPT-oss-120b”和“GPT-oss-20b”这两个模型。


这两个模型采用与Meta的Llama类似的“开放权重(open-weight)”系统。“开放权重”并非完全开源,但会公开AI在训练过程中获得的参数数值,便于开发者进行定制化。OpenAI表示,希望通过这一模型,使个人、企业和政府机构能够根据自身需求直接调优并运行AI系统。


这是OpenAI自2019年GPT-2之后首次公开开放模型。GPT-2是早期聊天机器人GPT的基础软件。OpenAI的大部分模型为封闭式系统,用户无法修改,技术底层信息也仅有限度公开。因此,与其他竞争对手类似,OpenAI一直通过保护训练数据和对高性能模型实行付费策略来回收巨额研发成本。


此次公开的两款模型被评价为在保持相对小型规模的同时兼具高效率。“GPT-oss-120b”可以仅用一块80GB显存的图形处理器(GPU)运行,“GPT-oss-20b”则可在配备16GB内存的一般笔记本电脑上运行。



有观点认为,OpenAI此次公开开放权重模型,受到中国AI初创企业DeepSeek的影响。今年年初,DeepSeek发布了其开放型AI模型“R1”等,在全球科技行业引发高度关注。对此,OpenAI首席执行官(CEO)Sam Altman曾表示,OpenAI也在讨论开放权重的发布,有必要重新制定开源战略。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点