政府为评估将参与“自主人工智能基础模型(自主AI Foundation Model)”项目的精英团队所开发AI模型的性能,面向社会公开征集“性能评估数据集构建项目”承担机构,报名截止至下月7日。
由科学技术信息通信部和韩国智能信息社会振兴院(NIA)主办的本项目,旨在构建可用于评估国内AI模型性能的数据集。
迄今为止,以全球大型科技企业为首,各类生成式AI服务相继出现,但大部分性能评估主要采用英语圈的评价指标,存在难以充分反映韩国本国服务使用环境等局限。
为此,政府计划投入总计24亿韩元(共3个课题,每个课题8亿韩元),构建能够反映我国文化和社会价值,并可对国内外各类AI模型性能进行客观诊断的高质量性能评估数据集。
今年将优先在三个领域构建数据集,分别是:▲用于评估大语言模型(LLM)数学解题能力的评估数据(数学领域) ▲用于评估“韩国型”知识的按主题划分的问答及推理数据(知识领域) ▲在长篇语境下,对多种任务进行性能评估的数据(长文理解领域)。今后还将逐步构建用于评估多模态、智能体等生成式AI模型多种领域的数据集。
有意参与的企业和机构,须由具备基于超大规模AI或自然语言处理、多模态AI等大规模数据集人工智能开发能力的企业或机构,至少一家以上加入到承担机构联合体中。
科学技术信息通信部人工智能基础政策官Kim Gyeongman表示:“要确保让国民切实感受到的高性能国内自主AI Foundation Model,相应的性能评估数据集也必须充分反映我国社会与文化环境。”他还表示:“通过本项目构建的性能评估数据集,不仅将向精英团队开放,今后也计划向国内AI开发机构公开,以便广泛利用。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。