“得分高于GPT-4o” A.Dot X 4.0
在中国阿里巴巴 Qwen 2.5上学习韩语数据

SK电信于3日表示,已将其韩语特化大型语言模型(LLM)A.Dot X(A.X)4.0以开源形式公开。SKT当天上午通过全球开源社区Hugging Face发布了A.X 4.0的标准模型和两种轻量模型。

SK电信3日表示,已将其发布的韩语特化大模型 A.X 4.0 以开源形式公开。照片为执行 A.X 4.0 大规模训练的 SKT 自建超级计算机“Titan”。SKT提供

SK电信3日表示,已将其发布的韩语特化大模型 A.X 4.0 以开源形式公开。照片为执行 A.X 4.0 大规模训练的 SKT 自建超级计算机“Titan”。SKT提供

View original image

此次公开的A.X 4.0不仅在韩语处理效率方面具有优势,还在数据安全性考量的架构设计以及本地环境运行可行性等方面具备强项。该模型在中国阿里巴巴的开源大型语言模型“Qwen 2.5”基础上,追加学习了韩语数据。


SKT表示,在A.X 4.0自测结果中,当输入相同的韩语句子时,A.X 4.0的令牌效率比GPT-4o高出约33%,在具备较高信息处理容量的同时兼顾了经济性。


A.X 4.0在韩语能力评估基准测试(KMMLU)中取得了78.3分,高于GPT-4o的72.5分。在韩语及韩国文化基准测试(CLIcK)中也获得83.5分,再次高于GPT-4o的80.2分,证明其对韩国文化的理解程度更高。


同时,SKT计划以本地部署(On-Premise)方式提供A.X 4.0,企业无需依赖云端,可直接安装在内部服务器上使用,从而减轻企业对数据安全的顾虑。标准模型拥有72亿个参数,轻量模型拥有7亿个参数,用户可根据使用目的进行选择。


SKT已于今年5月将A.X 4.0应用于A.Dot通话摘要服务,并计划今后不仅在自家服务中,还将在SK集团内部的多种服务中加以应用。

SKT发布韩语特化A.Dot大模型开源版:“企业可直接应用” View original image

借助此次SKT推出的模型,企业可以开发衍生模型,也可在研究领域加以利用。通过这一举措,将为国内企业在自有环境中更便捷地运用人工智能技术提供新的选项。


在此次开源发布A.X 4.0知识型模型的同时,SKT也即将发布推理型模型。SKT计划于本月内公开一款在数学题求解和代码开发能力方面得到强化的推理型模型,并将持续升级模型,使其达到能够同时理解和处理图像与文本的水平。


此外,从主权人工智能(Sovereign AI)的视角出发,SKT正并行推进在A.X 3.0上采用的“From Scratch”方式的开发工作,并将陆续公开后续模型。“From Scratch”是指从模型的最初阶段开始全部自行构建的开发方式。



Kim Jiwon,SK电信AI模型实验室负责人表示:“我们将通过持续的技术开发,高度化SK电信的多种服务,并在企业市场中以韩语特化大型语言模型为基础,打造最适合国内商业环境的模型。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点