评估AI游戏执行能力的“游戏”
对情境感知、判断与行动决策进行量化分析
“规划举办比拼游戏AI设计能力的竞赛”

AI游戏实力如何?KRAFTON开发全球首个游戏基准测试 View original image

Krafton于18日表示,已公开用于评估人工智能(AI)游戏执行能力的基准测试“Orak”。基于多种类型真实电子游戏的游戏基准测试在全球尚属首次。


Orak是一套在游戏过程中对AI的情景感知、判断和行动决策过程进行定量分析的评估体系。该体系以动作、冒险、角色扮演游戏(RPG)、模拟、策略、益智等6大类型的大众化游戏为基础进行设计。


其核心技术是MCP(Model Context Protocol,模型上下文协议)。MCP负责向语言模型传递文本形式的信息,使其能够理解游戏,并将模型的应答转换为可在游戏中执行的动作。例如,在动作游戏中,模型会先识别障碍物的位置,然后作出移动或跳跃等判断。


AI游戏实力如何?KRAFTON开发全球首个游戏基准测试 View original image

Krafton表示,作为实现与AI共同享受游戏体验的一环,公司开发了自有基准测试。通过Orak,Krafton得以掌握利用多种类型游戏进行AI评估的技术能力,从而高度化AI智能体。此外,Krafton还与英伟达(Nvidia)合作开发了可与玩家互动的新概念角色“CPC”(Co-Playable Character,共同可玩角色)。与传统的非玩家角色(NPC,Non-Player Character)不同,该角色能够与玩家对话与协作,像人一样感知情境并灵活应对,这是其一大特点。另外,作为全球最具权威的AI学术会议之一,今年在国际学习表征会议(ICLR)和国际机器学习会议(ICML)上,已有10篇Krafton论文被接收,其中3篇入选占比前5%的“ICLR Spotlight”。



Krafton深度学习本部长 Lee Kanguk 表示:“Orak是集中了Krafton前瞻性研究与经验的游戏特化型大型语言模型(LLM)基准测试”,并称“以此为基础,今后还计划举办比拼LLM智能体设计能力的竞赛”。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点