[新闻术语]加快开发“大型语言模型（LLM）”的NCSoft

by Kim Jonghwa

Published 28 May.2024 17:00(KST)

Updated 29 May.2024 07:59(KST)

open/close

LLaMa、HyperCLOVA X、CoGPT 等大公开
“BARCO 2.0”还能使用英语、日语和中文

NCSoft正在悄然加快推进其去年推出的人工智能（AI）“大语言模型（LLM）”VARCO的开发。

“大语言模型（Large Language Model·LLM）”是对能够理解和生成大规模人类语言的人工智能（AI）的统称。为了让资料按照用户期望的方式被处理，在输入指令时会追加或修改的数值信息称为“参数（Parameter）”，而LLM则是在拥有无数参数的人工神经网络所构成的语言模型（LM）基础上进一步扩展的概念。

NCSoft 板桥研发中心办公大楼全景。[照片由 NCSoft 提供]

LLM通过大量文本反复训练，理解语境并生成适切的回答。当给出一句话时，它在一个词结束后预测下一个词时，会把握词语之间的相似性和语境的形成，从而生成更加准确的含义。

与仅在给定语言范围内学习既定模式、结构和关系的传统语言模型不同，LLM通过学习大规模语言数据，掌握句子结构、语法和语义等内容，能够以自然对话的形式进行交互。它也被视为学习内容模式并据此推理生成新内容的生成式AI的核心技术。

由OpenAI开发的“ChatGPT”和Meta的“LLaMA”等就是代表性案例。在韩国，Naver推出了针对韩语优化的“HyperCLOVA X”，Kakao子公司Kakao Brain也发布了韩语特化的超大规模AI模型“KoGPT”，LG AI研究院则公开了自研超大规模AI“EXAONE 2.0”。

据游戏业界28日消息，NCSoft于上月底通过亚马逊云服务（Amazon Web Services·AWS）Marketplace和GitHub官方页面公开了VARCO LLM 2.0模型。

VARCO LLM 2.0是NCSoft在去年8月公开的VARCO LLM的下一代版本，分为拥有70亿参数规模的小型模型和130亿参数规模的基础模型。VARCO 2.0不仅能像以往那样支持韩语和英语，还能熟练使用日语和中文，这是其一大特点。

训练数据量也有所增加。VARCO LLM 2.0在预训练阶段使用的数据量是1.0模型的4.5倍，在调优阶段使用的数据量是其10倍，从而提升了性能。此外，还额外学习了考虑AI伦理而自建的数据集，能够给出更加用户友好的回答。