“要汇集国产AI训练数据”……政府招募政企协作供给机构

by Park Eugenie

Published 23 Jun.2025 12:00(KST)

加快获取用于开发AI基础模型的数据
提供数据加工与服务优先权等激励

科学技术信息通信部23日表示，为了开发国产人工智能（AI）基础模型，将面向持有公共和民间数据的机构启动大规模训练数据征集。

科学技术信息通信部当天宣布，将从即日起至7月21日，作为“自主AI基础模型项目”的一环，公开招募数据供给机构。目标是开发世界最高水平的大型语言模型（LLM）。

该项目是政府自今年起正式推进的人工智能战略项目。政府计划通过公开招募选拔开发团队，并向其集中提供图形处理器（GPU）、数据和人才等核心基础设施，以支撑自主超大规模人工智能的开发。

数据供给机构的对象为持有免费或付费高质量数据的公共和民间机构。最终是否利用相关数据，将在开发团队选定后根据需求通过协议决定。协议将在数据供给机构与科学技术信息通信部下属的韩国智能信息社会振兴院（NIA）、韩国数据产业振兴院（K-Data）以及开发团队之间签订。

政府将向供给机构提供多种激励措施，包括支持数据加工和预处理费用，对付费著作物在符合条件的情况下予以费用补偿。此外，还在研究给予优先导入人工智能服务的机会、在政府项目中如数据代金券项目中赋予加分、通过AI Hub平台支持数据流通和交易等方案。

科学技术信息通信部人工智能基础政策官Kim Gyeongman表示：“高质量数据是决定人工智能性能的核心要素”，“由政府和民间共同构建的数据协作体系，将成为开发世界一流水平韩国型大型语言模型的基石”。

政府计划在完成供给机构招募后，于8月选拔开发团队，并以需求为基础签订数据协议。将明确数据提供条件和利用范围、费用及责任关系等，以最大限度减少争议空间。供给机构可通过电子邮件申请，需提交申请书、数据提供计划书、营业执照等材料。

本报道由人工智能(AI)翻译技术生成。