本土AI模型将接受韩国式评测…面向性能评估数据集建设公司招募

by Kim Bokyung

Published 17 Jul.2025 14:11(KST)

政府为评估将参与“自主人工智能基础模型（自主AI Foundation Model）”项目的精英团队所开发AI模型的性能，面向社会公开征集“性能评估数据集构建项目”承担机构，报名截止至下月7日。

由科学技术信息通信部和韩国智能信息社会振兴院（NIA）主办的本项目，旨在构建可用于评估国内AI模型性能的数据集。

迄今为止，以全球大型科技企业为首，各类生成式AI服务相继出现，但大部分性能评估主要采用英语圈的评价指标，存在难以充分反映韩国本国服务使用环境等局限。

为此，政府计划投入总计24亿韩元（共3个课题，每个课题8亿韩元），构建能够反映我国文化和社会价值，并可对国内外各类AI模型性能进行客观诊断的高质量性能评估数据集。

今年将优先在三个领域构建数据集，分别是：▲用于评估大语言模型（LLM）数学解题能力的评估数据（数学领域） ▲用于评估“韩国型”知识的按主题划分的问答及推理数据（知识领域） ▲在长篇语境下，对多种任务进行性能评估的数据（长文理解领域）。今后还将逐步构建用于评估多模态、智能体等生成式AI模型多种领域的数据集。

有意参与的企业和机构，须由具备基于超大规模AI或自然语言处理、多模态AI等大规模数据集人工智能开发能力的企业或机构，至少一家以上加入到承担机构联合体中。

必读新闻

“股票不用交税” 明年起年超250万韩元币圈收益征税…投资者强烈反对

科学技术信息通信部人工智能基础政策官Kim Gyeongman表示：“要确保让国民切实感受到的高性能国内自主AI Foundation Model，相应的性能评估数据集也必须充分反映我国社会与文化环境。”他还表示：“通过本项目构建的性能评估数据集，不仅将向精英团队开放，今后也计划向国内AI开发机构公开，以便广泛利用。”

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。

本土AI模型将接受韩国式评测…面向性能评估数据集建设公司招募

必读新闻

不容错过的热点