LLaMa、HyperCLOVA X、CoGPT 等大公开
“BARCO 2.0”还能使用英语、日语和中文

NCSoft正在悄然加快推进其去年推出的人工智能(AI)“大语言模型(LLM)”VARCO的开发。


“大语言模型(Large Language Model·LLM)”是对能够理解和生成大规模人类语言的人工智能(AI)的统称。为了让资料按照用户期望的方式被处理,在输入指令时会追加或修改的数值信息称为“参数(Parameter)”,而LLM则是在拥有无数参数的人工神经网络所构成的语言模型(LM)基础上进一步扩展的概念。

NCSoft 板桥研发中心办公大楼全景。[照片由 NCSoft 提供]

NCSoft 板桥研发中心办公大楼全景。[照片由 NCSoft 提供]

View original image

LLM通过大量文本反复训练,理解语境并生成适切的回答。当给出一句话时,它在一个词结束后预测下一个词时,会把握词语之间的相似性和语境的形成,从而生成更加准确的含义。


与仅在给定语言范围内学习既定模式、结构和关系的传统语言模型不同,LLM通过学习大规模语言数据,掌握句子结构、语法和语义等内容,能够以自然对话的形式进行交互。它也被视为学习内容模式并据此推理生成新内容的生成式AI的核心技术。


由OpenAI开发的“ChatGPT”和Meta的“LLaMA”等就是代表性案例。在韩国,Naver推出了针对韩语优化的“HyperCLOVA X”,Kakao子公司Kakao Brain也发布了韩语特化的超大规模AI模型“KoGPT”,LG AI研究院则公开了自研超大规模AI“EXAONE 2.0”。


据游戏业界28日消息,NCSoft于上月底通过亚马逊云服务(Amazon Web Services·AWS)Marketplace和GitHub官方页面公开了VARCO LLM 2.0模型。


VARCO LLM 2.0是NCSoft在去年8月公开的VARCO LLM的下一代版本,分为拥有70亿参数规模的小型模型和130亿参数规模的基础模型。VARCO 2.0不仅能像以往那样支持韩语和英语,还能熟练使用日语和中文,这是其一大特点。


训练数据量也有所增加。VARCO LLM 2.0在预训练阶段使用的数据量是1.0模型的4.5倍,在调优阶段使用的数据量是其10倍,从而提升了性能。此外,还额外学习了考虑AI伦理而自建的数据集,能够给出更加用户友好的回答。



NCSoft今后计划在VARCO LLM 2.0的基础上,公开用于聊天机器人服务的语言模型“Dialogue”,以及可用于实际游戏企划文档撰写的“Story”模型。此外,能够理解不仅是文本,还包括图像、文档等内容的多模态LLM——VARCO MLLM 1.0也计划在下半年公开。

[新闻术语]加快开发“大型语言模型(LLM)”的NCSoft View original image


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点