[新闻术语]生成式AI的谎言“幻觉”

by Jo Inkyung

Published 12 Jun.2024 16:35(KST)

“人一天应该吃多少石头呢？”

“据加州大学伯克利分校的地质学家称，人每天至少要吃一块小石头。”

上个月，搭载生成式人工智能（AI）“Gemini”的谷歌新搜索引擎“AI Overview”针对用户略显离谱的问题，给出了上述荒唐的回答。在X（原推特）等社交媒体上，还有人提问“美国有多少位穆斯林总统”，AI Overview却回答“第一位穆斯林美国总统是Barack Obama”等案例接连被发布，引发争议。相关错误曝光后，批评和恶评不断，谷歌最终在推出AI Overview仅两周后就宣布缩减该服务。

像这样，生成式AI如大型语言模型（LLM）在回答给定问题时给出错误信息，或输出与语境无关内容的现象，被称为“幻觉（Hallucination）”。汉语中对应“幻觉”“幻影”“幻听”等含义。

产生幻觉的原因在于以大规模数据学习为前提的生成式AI的统计特性。大型语言模型在构建并训练大规模语料数据的过程中学习语言模式，并据此预测在给定输入之后最有可能出现的下一个数据，从而生成文本。在这一过程中，可能会凭空生成与事实不符、却看似合理的虚假信息，或将其包装成真实存在的事实。此外，在必须回答原本不存在的数据相关问题时，模型已学习的既有模式也可能被不恰当地套用。例如，如果大型语言模型仅基于2022年以前的数据进行训练，那么对于2023年之后的情况就缺乏知识，更容易出现幻觉。

幻觉不仅会出现在大型语言模型中，在生成图像等内容的多模态模型中也可能发生。例如，在被要求生成某一特定人物或地区的图像时，模型可能生成现实中并不存在的特征，或者画出在物理上根本不可能成立的画面。

如此生成的错误虚假信息，不仅会给用户带来巨大混乱，还有可能被恶意用来制造和传播有意图的假新闻。这类问题可能引发名誉侵权、版权侵权等多种法律风险，需要格外注意。同时，在对话过程中获取的个人信息或企业机密被泄露的安全风险也不容忽视。

必读新闻

“股票不用交税” 明年起年超250万韩元币圈收益征税…投资者强烈反对

因此，在ChatGPT、Gemini等生成式AI行业内部，将尽量减少幻觉视为亟待解决的课题。鉴于生成式AI无法准确核实数据真伪这一特性，业界认为幻觉是一种难以避免的错误，正研究改进或防止幻觉的方法。例如，集中训练某一特定专业领域的数据，使其拥有更可靠的知识，或者额外学习特定语言的数据，以提升多语言能力等，都属于这类尝试。

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。

[新闻术语]生成式AI的谎言“幻觉”

必读新闻

不容错过的热点