Solar Open在三语基准测试中领先DeepSeek
韩语能力是DeepSeek的2倍

据悉,Upstage自主开发的大型语言模型(LLM)“Solar Open 100B(Solar Open)”展现出相比中国DeepSeek等全球模型更为出色的性能。Solar Open是参与政府主导的自主人工智能(AI)基础模型项目的Upstage推出的成果。


6日据Upstage介绍,参数规模为1000亿个(100B)的Solar Open,与中国DeepSeek的AI模型“R1(DeepSeek R1-0528-671B)”相比,在韩语(110%)、英语(103%)、日语(106%)等三种语言的主要基准测试中取得了更优成绩。Solar Open的模型规模仅为DeepSeek R1的15%。


Upstage全面以开源形式公开了其自主研发的大型语言模型(LLM)“Solar Open 100B”。Upstage提供

Upstage全面以开源形式公开了其自主研发的大型语言模型(LLM)“Solar Open 100B”。Upstage提供

View original image

尤其是其韩语能力明显优于全球模型。在韩国文化理解度(Hae-Rae v1.1)、韩语知识(CLIcK)等主要韩语基准测试中,表现出超过DeepSeek R1两倍以上的性能差距;与规模相近的OpenAI开源模型“GPT-OSS-120B-Medium”(GPT-OSS)相比,也展现出领先约100%的性能。


在数学、复杂指令执行、智能体等高阶知识领域,Solar Open与DeepSeek R1实现了相当的性能水平;在综合知识与代码编写能力方面,则与GPT-OSS表现相近。


Upstage表示,此次成果得益于约20万亿标记规模的高质量预训练数据集。为解决韩语数据不足的问题,Upstage在训练中利用了合成数据以及金融、法律、医学等领域的专门数据。今后将通过韩国智能信息社会振兴院(NIA)的“AI Hub”开放部分数据集。


Solar Open采用由129个专家模型组成的“MoE(专家混合,Mixture-of-Experts)”结构,在实际运算中仅激活120亿个参数,从而提升效率。同时,通过图形处理器(GPU)优化,将每秒标记处理量(TPS)提升约80%,并开发了自有强化学习(RL)框架“SnapPO”,将训练周期缩短了50%。仅由此带来的GPU基础设施成本节约规模就达到约120亿韩元。


Upstage以“from scratch”(从零开始)方式开发Solar Open,自主完成了从数据构建到训练的全流程。Upstage一方面在全球AI开源平台“Hugging Face”上公开该模型,另一方面还发布了涵盖开发过程和技术细节的技术报告。


Upstage代表 Kim Seonghun 表示:“Solar Open是Upstage从头自主训练出的模型,是最能深刻理解韩国情感和语言语境、既具韩国特色又面向全球的AI”,“此次Solar Open的发布将成为开启韩国式前沿AI时代的重要转折点”。



Solar Open 的基准测试结果。Upstage 提供

Solar Open 的基准测试结果。Upstage 提供

View original image


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点