后天，自研韩语LLM基础模型“Motif”将开源发布

by Kim Bokyung

Published 04 Dec.2024 08:05(KST)

用于专业领域文档学习
“有助于韩国AI生态系统发展”

人工智能基础设施解决方案企业“More”于3日将其自主开发的韩语大型语言模型（LLM）基础模型 Llama-3-Motif-102B（以下简称 Motif）以开源形式公开。

将韩语大型语言模型基础模型连同源代码一并公开，使任何人都可以利用，对韩国人工智能产业的发展具有重要意义。因为掌握本国语言专业人工智能能力是主权人工智能的必备要素。

More 计划在 Hugging Face 上以开源形式发布高性能韩语大型语言模型，从而为韩国人工智能生态系统的成长作出贡献。为此，公司还计划设立子公司，以正式推进人工智能模型业务。

More 方面表示：“Motif 是拥有1020亿个参数的韩语大型语言模型，在韩国版人工智能性能评估体系‘KMMLU’基准测试中取得了64.74分，证明其韩语处理性能优于 Meta、Google、Naver 的大型语言模型。”

Motif 不仅利用了可在网络上收集的文本，还将韩国国内专利及研究报告等公开的专业领域文档作为训练数据。同时，模型还纳入了韩国国内规模最大的韩语清洗数据。此次公开的开源模型包括两种版本：预训练语言模型，以及专门优化为遵循指令的指令模型。

More 代表 Jo Gangwon 表示：“将高性能大型语言模型以开源形式公开、供任何人利用，是为了助力韩国国内人工智能生态系统的成长和主权人工智能的构建，希望为人工智能产业发展而努力的初创企业等众多公司能够积极加以利用。”

More 计划以其人工智能基础设施软件技术实力为基础，在包括知识产权产业等创作领域，以及医疗、法律、金融等领域开发专门化大型语言模型，并推进多模态模型的研发，以打造人工智能模型枢纽为目标推进相关业务。

本报道由人工智能(AI)翻译技术生成。