“HyperCLOVA X Seed 14B Think”开源发布
非改造海外开源模型 而是从零开发

Naver Cloud,140亿参数推理模型也免费向商业用途开放 View original image

Naver Cloud以“from scratch(从零开始)”方式自主开发的推理模型面向商业用途免费公开,着手扩展韩国国内人工智能生态。该公司不是对海外模型进行改造,而是基于源头技术,将轻量化、高性能模型以开源形式发布。


22日,Naver Cloud表示,已将结合推理(reasoning)能力和轻量化技术的人工智能模型“HyperCLOVA X Seed 14B Think”以开源形式公开。该模型以可商业使用的形式提供,企业不仅可用于研究,还能自由应用于实际业务。


此次公开的模型是上月发布的“HyperCLOVA X Think”的轻量化版本,在保持性能的同时,大幅降低了训练成本。通过对重要度较低的参数进行剪枝(pruning),并采用将大型模型知识迁移(distillation)到小型模型的方式,将训练效率最大化。


主要模型的学习成本比较。资料由Naver Cloud提供

主要模型的学习成本比较。资料由Naver Cloud提供

View original image

该模型规模为140亿参数,使用的计算资源(GPU时间)少于参数规模为50亿的全球开源模型,与同规模海外模型相比,单次训练成本仅为其百分之一。即便如此,该模型在韩语、韩国文化以及数学、编程等多项基准测试中,仍展现出与同级或更大模型相近的性能。



Naver Cloud此前在今年4月也曾将3种轻量化模型以开源形式公开,累计下载量已突破100万次。以此为基础,已生成并共享50余个第一批衍生模型,韩语端侧人工智能服务也相继出现,HyperCLOVA X开源生态正在迅速扩张。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点