[新闻术语]加快开发“大型语言模型(LLM)”的NCSoft
LLaMa、HyperCLOVA X、CoGPT 等大公开
“BARCO 2.0”还能使用英语、日语和中文
NCSoft正在悄然加快推进其去年推出的人工智能(AI)“大语言模型(LLM)”VARCO的开发。
“大语言模型(Large Language Model·LLM)”是对能够理解和生成大规模人类语言的人工智能(AI)的统称。为了让资料按照用户期望的方式被处理,在输入指令时会追加或修改的数值信息称为“参数(Parameter)”,而LLM则是在拥有无数参数的人工神经网络所构成的语言模型(LM)基础上进一步扩展的概念。
LLM通过大量文本反复训练,理解语境并生成适切的回答。当给出一句话时,它在一个词结束后预测下一个词时,会把握词语之间的相似性和语境的形成,从而生成更加准确的含义。
与仅在给定语言范围内学习既定模式、结构和关系的传统语言模型不同,LLM通过学习大规模语言数据,掌握句子结构、语法和语义等内容,能够以自然对话的形式进行交互。它也被视为学习内容模式并据此推理生成新内容的生成式AI的核心技术。
由OpenAI开发的“ChatGPT”和Meta的“LLaMA”等就是代表性案例。在韩国,Naver推出了针对韩语优化的“HyperCLOVA X”,Kakao子公司Kakao Brain也发布了韩语特化的超大规模AI模型“KoGPT”,LG AI研究院则公开了自研超大规模AI“EXAONE 2.0”。
据游戏业界28日消息,NCSoft于上月底通过亚马逊云服务(Amazon Web Services·AWS)Marketplace和GitHub官方页面公开了VARCO LLM 2.0模型。
VARCO LLM 2.0是NCSoft在去年8月公开的VARCO LLM的下一代版本,分为拥有70亿参数规模的小型模型和130亿参数规模的基础模型。VARCO 2.0不仅能像以往那样支持韩语和英语,还能熟练使用日语和中文,这是其一大特点。
训练数据量也有所增加。VARCO LLM 2.0在预训练阶段使用的数据量是1.0模型的4.5倍,在调优阶段使用的数据量是其10倍,从而提升了性能。此外,还额外学习了考虑AI伦理而自建的数据集,能够给出更加用户友好的回答。
NCSoft今后计划在VARCO LLM 2.0的基础上,公开用于聊天机器人服务的语言模型“Dialogue”,以及可用于实际游戏企划文档撰写的“Story”模型。此外,能够理解不仅是文本,还包括图像、文档等内容的多模态LLM——VARCO MLLM 1.0也计划在下半年公开。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。