GIST开发提升机器人人工智能“抓取能力”技术

by Min Chanki

Published 09 Sep.2025 11:23(KST)

光州科学技术院人工智能融合学科 Lee Gyubin 教授研究团队。

光州科学技术院（GIST）9日表示，人工智能融合学科的Lee Kyubin教授研究团队构建并公开了全球最大规模、能够精细反映真实环境复杂性的机器人抓取（Grasp，拾取）数据集“GraspClutter6D”，用于机器人抓取研究。

这一成果突破了以往机器人人工智能只能在简单、整洁场景中有限运行的局限，为在物体交叠纠缠的真实环境中也能稳定运作的“机器人基础模型”（Robot Foundation Model）构建奠定了核心基础，并有望对近期在全球范围内备受关注的“物理人工智能（Physical AI）”研究发展作出重要贡献。本次研究是与韩国机械研究院（KIMM）协作完成的。

机器人抓取物体这一动作，既是最基本、又是最困难的课题之一。在仓库中取出货物，或在家庭中整理物品等场景下，物体往往存在重叠和遮挡，机器人难以对物体进行精准识别并稳定抓取。

近年来，随着深度学习技术的发展，机器人的抓取性能大幅提升，但迄今为止的训练用数据集大多以整洁、简单的环境为前提，在真实环境中的适用性存在局限。因此，在多种物体相互缠绕、背景多样的真实场景下，机器人的性能会急剧下降。

例如，全球广泛使用的数据集“GraspNet-1Billion”中，每个场景的平均物体数量不足9个，被遮挡比例也仅约35%，难以充分反映现实世界的复杂程度。

GraspClutter6D 数据集示例图像与现有数据集的比较。

为克服这些局限，研究团队构建了精确再现真实生活与工业环境的超大规模数据集“GraspClutter6D”。研究团队搭建了包括箱子、货架、桌子等在内的75种不同环境，并在机械臂上安装4台RGB-D（彩色+深度）相机，在总计1,000个场景中采集了5.2万张图像。

该数据集包含▲200种真实物体的高质量三维模型 ▲73.6万个六维（6D）物体姿态 ▲多达93亿个机器人的六维（6D）抓取姿态，规模远超既有公开数据集。

研究团队还在发布数据集的同时，公开了利用该数据集对最新人工智能识别与抓取模型进行性能评估的基准测试结果。对▲最新目标分割 ▲六维姿态估计 ▲抓取检测方法进行评估后发现，在物体高度重叠、环境复杂的情况下，现有人工智能技术的性能大幅下降，但利用“GraspClutter6D”数据集训练的人工智能模型在真实机器人抓取实验中表现出明显的性能提升。