AI游戏实力如何？KRAFTON开发全球首个游戏基准测试

by Jun Youngjoo

Published 16 Jun.2025 10:23(KST)

评估AI游戏执行能力的“游戏”
对情境感知、判断与行动决策进行量化分析
“规划举办比拼游戏AI设计能力的竞赛”

Krafton于18日表示，已公开用于评估人工智能（AI）游戏执行能力的基准测试“Orak”。基于多种类型真实电子游戏的游戏基准测试在全球尚属首次。

Orak是一套在游戏过程中对AI的情景感知、判断和行动决策过程进行定量分析的评估体系。该体系以动作、冒险、角色扮演游戏（RPG）、模拟、策略、益智等6大类型的大众化游戏为基础进行设计。

其核心技术是MCP（Model Context Protocol，模型上下文协议）。MCP负责向语言模型传递文本形式的信息，使其能够理解游戏，并将模型的应答转换为可在游戏中执行的动作。例如，在动作游戏中，模型会先识别障碍物的位置，然后作出移动或跳跃等判断。

Krafton表示，作为实现与AI共同享受游戏体验的一环，公司开发了自有基准测试。通过Orak，Krafton得以掌握利用多种类型游戏进行AI评估的技术能力，从而高度化AI智能体。此外，Krafton还与英伟达（Nvidia）合作开发了可与玩家互动的新概念角色“CPC”（Co-Playable Character，共同可玩角色）。与传统的非玩家角色（NPC，Non-Player Character）不同，该角色能够与玩家对话与协作，像人一样感知情境并灵活应对，这是其一大特点。另外，作为全球最具权威的AI学术会议之一，今年在国际学习表征会议（ICLR）和国际机器学习会议（ICML）上，已有10篇Krafton论文被接收，其中3篇入选占比前5%的“ICLR Spotlight”。