“像人脑一样” KAIST 构思出能建立并验证假设的 AI 模型

by Jeong Ilwoong

Published 27 Feb.2025 08:11(KST)

韩国国内研究团队构想出一种全新概念的人工智能模型，使其能够像人类和动物一样自主提出并检验假设。这一成果得益于研究团队揭示了人类和动物通过建立假设来维持一致的行为策略，并通过自行怀疑和检验证实假设，从而适应环境的过程。

KAIST表示，脑认知科学系的 Lee Sangwan 教授与 Jung Minhwan 教授共同研究团队提出了新的强化学习理论，并阐明了其中的脑科学原理，此消息于27日公布。

（自左起）KAIST 脑认知科学系 Lee Sangwan 教授、Yang Minsu 博士研究生。KAIST 提供

根据共同研究团队介绍，为了适应当前情境，在行为的一致性与灵活性之间寻找适当平衡点的问题，被称为“稳定性-流动性的两难（Stability-flexibility dilemma）”。

要解决这一两难，就必须能够持续检验和修正当前自己的判断是否正确。虽然脑科学和人工智能领域围绕这一问题已展开多种研究，但迄今尚未找到完美的解决方案。

共同研究团队注意到，传统强化学习理论和最新人工智能算法都无法很好地解释动物行为，由此着眼，提出了一种新方法：可以对基于动物自身假设、预测并确认下一情境的行为模式进行动力学画像。

研究团队还提出了一种新的适应型强化学习理论和模型：动物先对当前情境建立假设，再根据该假设的预测误差，以非对称方式更新其行为策略。

多数最新人工智能模型往往侧重高效解决问题，因此常常无法很好地解释人类或动物的行为。相比之下，本次提出的模型在预测动物面对意外事件时的行为方面，平均比最新人工智能模型准确约15%（最高可达31%）。

这一结果在以往研究中发表的四种不同动物实验数据（two-step task、two-armed bandit task、T-maze task、带有中型棘状神经元失活的 two-armed bandit task）分析中，都得到了高度一致的再现。

在研究过程中，共同研究团队还发现，中脑基底核（负责运动调节和学习功能的脑区）中，纹状体（基底核的一部分，与价值评估和强化学习能力相关）里的中等大小棘状神经元（占纹状体约90%的代表性神经细胞，具有抑制神经活动的特征），也参与了基于假设的适应型强化学习过程。

共同研究团队的研究结果表明，大脑进行语境推理的方式与大规模人工智能模型在根本上存在差异。

例如，ChatGPT、DeepSeek 等人工智能模型会从用户输入中推断语境信息，并据此匹配所需的专家系统（DeepSeek 模型通过强化学习进行匹配），在有新信息输入之前，默认当前推断是正确的。

但大脑会主动怀疑自己推断出的语境（假设），一旦这种怀疑被确认，就会立即积极接纳新的语境。共同研究团队强调，这一机制为缓解人工智能因过度自信而产生的“幻觉”（Hallucination）现象，或构建类似人类的推理引擎，提供了新的方向。

共同研究团队认为，本次研究成果属于脑科学与人工智能的融合研究，有望在实际领域得到广泛应用。

例如，利用人类的动力学行为画像技术，可以分析个体的假设建立与检验证实的学习能力，从而直接应用于定制化教育课程设计、人事与人力资源管理系统以及人机交互等领域。

此外，所提出的适应型强化学习模型作为“像大脑一样思考的人工智能”技术，有望用于解决人类与人工智能的价值对齐（Value alignment）问题。

Lee Sangwan 教授表示：“本次研究揭示了以往仅凭人工智能强化学习理论难以解释的大脑基于假设的适应学习原理”，并称：“如果将这种能够自我怀疑和检验的脑科学理论，反映到大规模人工智能系统的设计与学习过程中，将有助于提升其可靠性。”

另一方面，本研究在科学技术信息通信部信息通信企划评价院的软件明星实验室项目、极限挑战研究开发（Research and Development）项目、韩国研究财团中坚研究者项目以及 KAIST Kim Jaechul 人工智能研究生院项目的支持下完成。

本报道由人工智能(AI)翻译技术生成。