让机器人掌握处理电线、衣物、橡皮筋等形状会变化物体的技术,是制造业和服务业自动化的核心课题。然而迄今为止,当物体形状不固定且运动难以预测时,机器人很难对其进行精确识别和操作。


如今,克服这一局限、即便只依靠不完整视觉信息也能精确把握可变形物体状态并熟练操控的机器人技术,已在韩国国内研发成功。


预计该技术今后将有望应用于线缆·电线组装、处理软性部件的制造业,以及服装整理与包装等多种产业·服务领域,推动智能化自动化发展。


(自左起)硕士研究生 Song Minseok、教授 Park Daehyung。KAIST 提供

(自左起)硕士研究生 Song Minseok、教授 Park Daehyung。KAIST 提供

View original image

KAIST表示,计算机科学系 Park Daehyeong 教授研究团队于21日开发出一项人工智能(AI)技术“INR-DOM(Implicit Neural-Representation for Deformable Object Manipulation,变形物体操控隐式神经表示)”,使机器人也能熟练处理如弹性带般形状连续变化、且在视觉上难以区分形态的物体。


INR-DOM可使机器人仅凭观测到的部分三维信息,完整复原可变形物体的整体形状,并以此为基础学习相应的操控方式。


研究团队还引入了一种将“强化学习”和“对比学习”相结合的新型两阶段学习结构,以便INR-DOM能够高效学习特定任务。


首先在第一阶段的预训练中,研究团队利用不完整的点云(将物体三维形状表示为“在表面上采样得到的点的集合”的方式)来训练复原完整形状的模型,从而获得对遮挡具有强鲁棒性、且能良好刻画可伸展物体表面的状态表示模块。


随后在第二阶段微调时,同时应用强化学习和对比学习,使机器人能够清晰区分当前状态与目标状态之间的细微差异,从而高效搜索完成任务所需的最优动作,这就是两阶段学习结构的总体框架。


在应用INR-DOM技术的仿真环境中,机器人在将橡胶圈嵌入凹槽(密封,sealing)、将O形圈安装到零部件上(installation)、以及解开缠绕橡皮筋(disentanglement)这三项任务中,成功率均高于以往方法。


尤其是在难度最高的解缠任务中,成功率高达75%,比此前最佳技术ACID(26%)高出约49个百分点。


经过两阶段学习过程的 INR-DOM 示意图。KAIST 提供

经过两阶段学习过程的 INR-DOM 示意图。KAIST 提供

View original image

研究团队还对INR-DOM技术在真实环境中的适用性进行了验证。结果显示,在真实环境中,机器人在嵌入、安装、解缠任务中的成功率同样超过90%。


尤其是在视觉上难以区分方向的双向缠绕解开任务中,相比传统基于图像的强化学习方法,成功率提升了25个百分点,证明其能够克服视觉模糊,实现高效操控。


研究员 Song Minseok 表示:“本研究展示了机器人即便仅依赖不完整信息,也能理解变形物体的整体形态,并以此为基础执行复杂操控过程的可能性。研究团队期待,本次研究成果今后将发展为在制造、物流、医疗等产业·服务领域,与人类协作或替代人类执行作业的机器人技术。”



此次研究由KAIST计算机科学系硕士研究生 Song Minseok 作为第一作者参与完成。研究成果已于2025年6月21日至25日在洛杉矶南加州大学(USC)举行的机器人学国际学术会议“Robotics: Science and Systems 2025(机器人:科学与系统2025)”上发布。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点