最新AI基础认知力
连人类的三分之一都不到
高级认知力却已“超车”人类

人工智能(AI)能够解出连顶尖天才都束手无策的数学难题,可以预测蛋白质结构,还能替人做出复杂的决策。另一方面,AI却又会在最基础的算术上出错,甚至把橙色的交通信号灯识别成太阳。


那么,目前最新一代AI的智力水平究竟处在什么程度?是超越人类的超级智能,还是一个十足的笨蛋?有趣的是,从最新研究结果来看,很可能“二者兼而有之”。


人类大脑 vs 最新AI,在空间认知能力上正面对决

图片由路透社 联合新闻社提供

图片由路透社 联合新闻社提供

View original image

以通用人工智能(AGI)为目标开发中的最新大型模型,被称为“前沿AI”。上月9日(当地时间),苹果公司与多位AI科学家合作,针对这类前沿AI模型开展了一项有趣的实验,用以测量它们的认知能力。参与实验的AI模型包括GPT-4o、Llama 3 70B、Mistral 123B等目前最前沿的一代模型。


认知能力是衡量机器智能智力水平的重要指标之一。包括人类在内的动物,都具备从找路、周围空间感知等基础认知能力,到逻辑推理、决策等抽象认知能力。一般认为,越偏向后者的物种,就越“高级”。


研究人员设计了一套名为“SPACE”的自编认知能力测试。在专为AI设计的迷宫环境中,他们设置了找路、空间感知、物体识别、记忆力测试、最短路径搜索等多种任务,用以测量这些模型与对照组——人类大脑之间的性能差异。


随着测试逐步深入,任务变得越来越抽象、复杂。后期甚至还包括这样的任务:例如当装有水的容器倾斜时,要求预测水会朝哪个方向流动,并给出答案。


人类智力几乎完胜……除了“高阶注意力”这一项

人工智能(AI)先天缺乏空间认知能力,这也是自动驾驶研发困难的原因之一。

人工智能(AI)先天缺乏空间认知能力,这也是自动驾驶研发困难的原因之一。

View original image

结果如何?在大多数测试中,人类的认知能力都远远压倒了AI。尤其是在简单找路或识别物体这类任务上,AI反而更加吃力。有些基础测试的得分只有人类的三分之一左右,几乎到了难以实用的程度。


然而,在SPACE测试中的唯一一个领域,AI超越了人类,那就是完全以文字形式进行的“选择性注意”任务。选择性注意是人类大脑的一项特性,指的是只专注于当下对自己有用的信息,而忽略其他信息的能力。该任务用来测试个体在排除周围各种干扰因素的情况下,能在多大程度上保持专注。


选择性注意力比简单认知能力更需要高层次的专注力和耐力。并且,对人类而言,以文字而非图像的方式来执行这类任务更加棘手。然而,AI一方面在对人类来说极其简单的任务上频频受挫,另一方面却在对人类而言属于高阶认知的领域取得了出色成绩。


从人类视角看,AI的精神状态更接近“障碍”

无法从人类的视角来解读人工智能的智能。

无法从人类的视角来解读人工智能的智能。

View original image

SPACE测试结果提醒我们,AI与人类的“智能”本质上是两回事。进行测试的报告作者也表示:“我们的研究表明,最前沿的AI智能与人类或其他动物的智能存在差异”,并解释称,“因为在生物大脑中,如果没有先具备基础认知能力,就不可能发展出高级认知能力”。


也就是说,人类与AI很可能在特性上恰好相反。那些在人类看来需要高度精神力和专注力的功能,对AI来说反而可能是自然而然的事情。作者还指出:“对于生物而言,基础认知能力的缺失是一种障碍的症状。”


换句话说,以人类标准来看,目前的AI处于接近智力障碍的状态。它在维持生命活动所必需的能力上几乎完全匮乏,却在高度抽象化的某些特定领域表现出远超常人的专注力。由此得出的结论是,仅凭AI能直接解出数学奥林匹克题目,或推导复杂方程式的定理,就宣称“AI已经超越人类智能”,是不恰当的。


在自然中进化的人类 vs 通过数据学习成长的AI,有何不同?

人类祖先南方古猿。包括人在内的动物通过接受并分析视觉、听觉、嗅觉等外部刺激而获得智能。 [图片出处=韩联社提供]

人类祖先南方古猿。包括人在内的动物通过接受并分析视觉、听觉、嗅觉等外部刺激而获得智能。 [图片出处=韩联社提供]

View original image

这次测试同样说明,动物与机器是何等迥异的存在。包括人类在内的动物智能,是在适应生存的过程中进化而来的结果。我们将对视野、听觉、嗅觉等各类外部刺激的反应,以及对空间和距离感的感知能力视为首要任务,因此才发展出如今这样的认知能力。


相反,刚刚开始萌芽的AI,从一开始就依赖“数据”成长,尤其是大型语言模型,通过不断摄取文本资料进行训练。也就是说,它与我们在发展路径和环境上都截然不同。



AI在某些领域展现出的成就令人敬畏,而在另一些特定领域却依然停留在初级阶段,人们推测原因正源于此。尤其是在自动驾驶等必须具备“对外部刺激作出反应的能力”的任务中,AI频频受挫,很可能也是出于同样的原因。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点