围绕类人机器人技术的竞争可以说已经激烈到堪称“一场战争”的程度。在自动驾驶、量子计算机、全固态电池等被称为能改变人类生活的“梦想技术”之新技术中,类人机器人目前被认为是最具商业化可能性的领域。业内普遍认为,今年将成为类人机器人商业化元年。从今年起,美国和中国的主要机器人制造商已开始小规模量产,现代汽车集团也计划最快从今年10月起,在其美国汽车工厂生产线上试投放旗下子公司Boston Dynamics制造的类人机器人。包括现代汽车集团在内的全球企业接连投入类人机器人商业化的2025年,当下各家厂商的技术实力究竟处于何种水平?本文梳理主要企业技术的现状。
类人机器人技术竞争日益白热化
类人机器人开发的核心技术大体可分为三类:△使机器人实现精密动作的硬件技术 △感知、判断外部环境并自主思考的人工智能(AI) △将上述两项技术整合起来的控制系统。
首先,在硬件技术方面,精密驱动机构和高度先进的执行器必不可少。作为核心部件的执行器,相当于人类的“肌肉”,接收来自控制系统的信号,将电能转化为物理运动。在这一过程中,机器人能在多大程度上实现与人类相似的动作,取决于“自由度”(机器人关节可以运动的方向或轴的数量)。自由度越高,机器人就越能实现复杂且接近人类的动作。类人机器人企业在硬件开发中最为头疼的部分,正是“机器人的手”。人类通过双手完成最多的作业。只有能够执行需要精细力量控制的手部动作,才能成为真正可以替代人类的类人机器人。
第二项是像人一样思考和推理的AI技术。要将来自视觉、听觉、触觉、位置信息等复合传感器采集的数据进行实时融合,从而理解周围环境,并根据情境作出恰当判断与行动,高度先进的AI至关重要。尤其是通过强化学习,即便没有人类教授,也能自行学习并不断进步的“自主性”,是类人机器人AI技术实力的核心。让类人机器人在突发状况下也能自主判断并行动,是最终目标。
最后一项核心技术,是连接精密硬件与AI“大脑”的控制系统。该系统一方面将AI作出的判断传递给执行器控制器,另一方面又将传感器、马达状态等各类硬件信息迅速反馈给AI。从人体角度看,其作用类似连接大脑与末梢神经的“中枢神经系统”。
顶级“体能”叠加新大脑,Boston Dynamics居于“第一顺位”
近期展现出技术进步速度最快的企业是Boston Dynamics(以下简称BD)。从本月21日上传的视频中,可以一窥BD类人机器人“Atlas”的当前技术水平。Atlas利用由三根手指组成的抓取器(类似人手的装置),将盒子里的零部件取出,放入另一只盒子。当盒盖突然合上时,它会先确认情况,再重新打开盒盖继续作业。当搬运中的部件掉到地上时,它会感知到这一情况,调整姿势后把掉落的部件重新捡起装入盒中。如果发现细长部件与货架尺寸不匹配,还会将部件折叠后整理摆放。此次视频是BD在宣布与丰田集团先进技术研究子公司——丰田研究院(Toyota Research Institute,TRI)合作后发布的首个视频,因此颇具意义。
长期以来,BD在机器人行业一直被公认为硬件领域的“业界第一”。早期的液压版Atlas曾展示后空翻、高空跳跃等惊人的运动能力。出色的运动神经和平衡感意味着其具备让机器人实时感知外部环境,并同时快速而精确地运动的控制技术。然而在生产现场,能做后空翻的机器人反而可能是“性能过剩”。性能越强,价格越高,设备也越沉重。
为克服这一问题,BD去年推出了更轻量的电动新款Atlas。通过简化设备结构提升成本竞争力,并通过与TRI的联合研究,不断提升AI和机器人控制技术。TRI将其自主开发的LBM(大规模行为模型)应用于Atlas,使之能够在各种情境下自主判断并执行复杂操作。如果说LLM(大规模语言模型)是通过学习海量语言数据来理解文本并生成新句子的巨大神经网络,那么LBM则是理解和学习多种行为动作,并据此执行新行为的神经网络。仅凭BD卓越的硬件技术与TRI的LBM技术的结合,业内就已对Atlas技术的快速成长感到紧张。
可协同作业的机器人AI“Helix”,目前仅能使用上半身
美国类人机器人企业Figure AI推出了面向类人机器人的机器学习AI模型Helix。这一AI的核心在于,两台以上机器人可以协同作业。过去,该公司通过与开发ChatGPT的OpenAI合作来推进类人机器人开发,但自今年起宣布将走独立路线。作为这一转向的首个成果,他们公开了类人机器人AI学习模型Helix。应用在类人机器人“Figure 02”上的Helix采用VLA(视觉·语言·行动)模型。机器人通过摄像头感知周围环境,理解人类的自然语言指令,并执行相应行动。
例如,在搭载Helix的机器人面前摆上鸡蛋、番茄酱、苹果、饼干等物品,对其说“请把这些东西整理一下”,两台机器人就会开始区分冷藏与常温保存的物品并进行整理。其中最令人印象深刻的画面,是一台机器人向另一台机器人递交物品的场景。两台机器人像对视一样互相看着对方,完成递送与接收。即便是像鸡蛋这类易碎物品,它们也会调节手部力量,打开冰箱后小心放入。当一台机器人在寻找摆放苹果的位置时,另一台会递上碗。整理结束后,机器人关上冰箱门和抽屉,视频随之结束。
搭载Helix的机器人在协作过程中,会实时互相交换各自感知到的视觉信息、行动规划以及同伴机器人的状态数据。为防止通信延迟,它们采用专用协议和高速无线通信技术,即便出现网络故障,也能依靠“容错机制”实现自我适应。就目前公开的技术水平来看,搭载Helix的类人机器人在自然语言理解、情境感知和响应性能等方面,被评价为最聪明的类人机器人之一。但目前这款机器人仍只能活动上半身。
特斯拉将自动驾驶技术应用于Optimus量产
Elon Musk是将类人机器人作为下一代创新技术而广为人知的人物。Musk在2021年的“Tesla AI Day”上首次透露,正在开发类人机器人“Optimus”。特斯拉于2022年9月公开了Optimus的原型机,2023年中期推出第一代Optimus,2024年4月又发布第二代Optimus。目前第三代机型正在开发之中。令外界最为震惊的是特斯拉的开发速度。最初公开开发消息时,人们还当作玩笑,但特斯拉仅用两年时间就做出了成品。
Optimus最大的优势在于,特斯拉可以将其自动驾驶AI技术同样应用于类人机器人。特斯拉通过自动驾驶全自动辅助驾驶功能(Full Self-Driving)积累了海量自动驾驶数据,被认为是自动驾驶领域最领先的企业之一。自动驾驶AI的核心,在于感知周围环境、判断当前状况并适当控制设备的技术连通性。这一自动驾驶技术机理与机器人控制技术在本质上是一致的。
特斯拉的另一大优势是量产能力。凭借通过汽车生产积累的制造经验,特斯拉具备快速构建机器人量产体系的基础。如果将全球各地特斯拉工厂部分生产线转为机器人生产线,还可以在本地化生产和向周边国家出口等方面获得多样的战略机遇。不过,这一点同样适用于拥有强大制造能力的现代汽车集团子公司BD。
在最近公开的视频中,Optimus在工厂内悠然行走,避开人和机器。它会用手将小电池搬运到箱子里,与人互动并递交物品。当电池电量耗尽时,它会自行寻找最近的充电站,完成充电后再继续作业。特斯拉已于今年开始Optimus的小规模量产。下半年将把产量扩大至数千台,计划战略性部署在物流中心和电动汽车制造现场。自2026年起,其目标是实现真正的大规模生产与商业化。将单价降至2万美元(约2800万韩元)是首要课题。
中国的“惊喜”技术:机器人可自行更换电池
在国民经济中制造业占比较高的中国,对类人机器人投入了极大热情。在全球236家类人机器人相关企业中,中国企业多达140家,占比高达59%;在去年公开的51款类人机器人机型中,中国企业制造的就有35款。尤其是以制造业为主导产业、对机器人与自动化高度关注的中国,在机器人硬件相关技术方面具有独到优势。相对而言,美国则更侧重于开发让机器人自主运动的软件技术。不过,随着中国近来也加大对AI技术开发的投入,有舆论认为,中国在类人机器人领域同样有望崭露头角。
优必选是中国在商业化进程上最为领先的类人机器人企业之一。该公司已经向比亚迪、蔚来、吉利汽车、北京汽车、大众等多家整车品牌的中国工厂生产线供应类人机器人“Walker S”。在全球类人机器人企业中,其被认为拥有最多的客户。第一代版本“Walker S1”的价格约为7万美元(约9600万韩元),最近还公开了价格减半的低价型号“Tiangong Walker”。
Walker S的技术实力也相当可观。视频中的机器人不仅能拾取小贴纸并贴在汽车车身上,还展现了两台机器人各自抓住重箱两端协同抬起、作为协作机器人的作业场景。一个月前公开的“Walker S2”视频则更具冲击力。当机器人在工作过程中电池电量耗尽时,它会自行走向电池站,将手臂伸到身后,从背部取下已安装的电池,再将电池站中已充满电的电池自行装回。此举旨在缩短充电等待时间,最大化提升作业效率。