自研AI基础模型首场发布会
可在中低价GPU上运行的K-Exaone亮相

Choi Jeonggyu LG AI研究院 AI Agent组长在30日于首尔COEX举行的科学技术情报通信部主办“独立AI基础模型”项目第一阶段发布会上进行发表。照片由记者Park Yujin提供

Choi Jeonggyu LG AI研究院 AI Agent组长在30日于首尔COEX举行的科学技术情报通信部主办“独立AI基础模型”项目第一阶段发布会上进行发表。照片由记者Park Yujin提供

View original image

LG人工智能研究院公开了人工智能(AI)模型“K-Exaone”。在将训练计算量降至以往的三分之一水平的同时,该模型性能超越了美国的ChatGPT和中国的Qwen等全球前沿模型。


LG人工智能研究院AI Agent组长Choi Jeonggyu 30日在首尔COEX举行的由科学技术信息通信部主办的“自主AI基础模型”项目第一次发布会上表示:“在保持性能的前提下,将训练所需的计算量降到了以往约30%的水平”,“通过高效结构,重点在于降低成本负担”。


Choi组长将既有大规模语言模型(LLM)的局限归结为“计算成本”。他解释称,以计算句子中所有单词之间关系的方式虽然性能优异,但在训练和运营上需要大量成本。他表示:“即便不计算全部信息,也可以选择性地利用所需信息”,“为此我们高效设计了混合注意力结构”。


该模型在中低价位图形处理器(GPU)环境中也能运行。Choi组长表示:“即使不是高价基础设施,也能运营该模型,因此初期建设成本和运营负担相对较小”,“是初创企业或中小企业也能立即加以利用的AI模型”。


训练方式采用分阶段构成。先学习一般性的基础知识,再进行强化思维能力的训练,最后学习特定领域的专业知识。Choi组长解释称:“以前一阶段积累的知识为基础,提升下一阶段的性能”,“通过这种训练策略,可以高效利用可用基础设施”。实际GPU基础设施利用效率平均达到89.4%。


性能评估结果也一并公布。LG人工智能研究院对13个主要基准项目进行自我评估的结果显示,平均性能达到目标值的104%。以参数在3000亿个(300B)以下的模型为标准,与OpenAI的GPT-OSS(120B)和中国的Qwen3(235B)等全球模型相比,也取得了位居前列的性能。



安全性和可靠性亦被强调。LG人工智能研究院对全部训练数据进行合规性审查,并运行以其他数据替代可能引发问题数据的流程。此外,该院表示,正以人类普世价值、社会安全、韩国特殊性、未来风险应对等多个领域为标准,对模型进行检查。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。