科幻作家 Ted Chiang：“ChatGPT 是人类知识劣化的复本”

by Lim Juhyeong

Published 14 Feb.2023 06:30(KST)

Updated 14 Feb.2023 08:02(KST)

open/close

“ChatGPT将知识‘压缩’后学习
只留下原本的模糊副本
凭副本无法进行创造性工作”

由OpenAI开发的人工智能（AI）聊天机器人“ChatGPT”有时会给出错误答案，让用户感到困惑。谷歌作为“ChatGPT对手”推出的“Bard”，甚至在首次演示时就输出了错误答案。用海量文档训练出来的人工智能，为什么连简单事实都会混淆？

美国顶级科幻作家之一Ted Chiang在美国媒体《纽约客》（New Yorker）上发表长文，对此进行了说明。根据他的文章，人工智能是通过对信息进行“压缩”来学习的，在这一过程中，人工智能的知识相较原始信息会变得迟钝、模糊。

Ted Chiang：“ChatGPT是互联网的模糊版本”

图片由Pixabay提供

Ted Chiang于本月9日（当地时间）在《纽约客》上发表了一篇题为“ChatGPT是互联网的模糊JPEG版本”的文章。在这篇文章中，他为了说明复杂而晦涩的语言生成模型人工智能，借用了图像文件扩展名“JPEG”作为比喻。

JPEG是我们在电脑或手机中保存照片、图画等文件时使用的扩展名之一。虽然还有PNG、GIF等多种扩展名，但在互联网上流通最为活跃的扩展名是JPEG/JPG。

JPEG在各类图像文件格式中成为“主流”的原因在于其占用空间小。与PNG等扩展名相比，使用JPEG的文件能够更快地在互联网上上传和下载。相应地，以JPEG格式保存的文件，相比体积更大的其他格式，画质会有所降低。如果在画图软件中画一幅图，分别以PNG和JPEG格式保存，那么JPEG那一侧看上去会稍微更“模糊”一些。

像图像文件一样，知识也在有损压缩

PNG 图像（左）与 JPEG 的差异。可以看出 JPEG 这边的画质稍微更模糊一些。

像JPEG这样的文件保存方式被称为“有损压缩（lossy compression）”。这是一种即便牺牲一部分数据，也要大幅减小文件体积的技术。照片本身即使画质略有下降，用肉眼观看也不会造成太大不便，相反，多亏了JPEG，互联网加载速度变得更快，因此收益远大于损失。

这种JPEG有损压缩技术，与ChatGPT学习知识的方法十分相似。它会将复杂而细致的细节抽象化后进行存储，再将其重新用人类语言展开输出。

Ted Chiang表示：“可以把ChatGPT等类似语言模型看作散布在互联网上的模糊JPEG文件”，“ChatGPT几乎掌握了互联网上的大部分信息，但这些信息更接近于JPEG文件那样被模糊化的图像”。

他接着强调说：“因此，如果把这幅图像的一部分放大到想要看清极其细微的细节，就会发现什么也看不到。我们能从ChatGPT那里获得的，只是‘近似值’而已。”

ChatGPT有时给出错误答案，甚至生成根本不存在的事实，这些错误同样是“有损压缩”留下的痕迹。由于在重构那些已经变得模糊的部分时进行再创造，就会出现与事实完全不符的内容。

“明明还有原件……真的要用劣质拷贝吗”

OpenAI的ChatGPT。联合新闻供图

Ted Chiang对于将人工智能作为创作过程中的辅助工具也持怀疑态度。他表示：“一台只能输出原件模糊拷贝的机器，不可能成为原创性工作的起点”，“相反，人类在写作过程中经历的试错与思考，才是孕育独创性想法的真正过程”。

反而在某些时刻，ChatGPT会显得尤为有用，那就是当互联网完全中断、无法访问信息的时候。因为一旦无法接触到知识的原始来源，哪怕只是一份略显不准确的拷贝，拥有它也要好过一无所有。

然而，Ted Chiang指出：“目前我们并没有面临突然失去互联网接入权限的危机”，“既然原件仍然存在，我们真的有必要特意去使用那种模糊的JPEG版本知识吗？”

另一方面，Ted Chiang是横扫各类科幻小说（SF）大奖的人物。

《巴别塔》（1990）、《理解》（1991）、《你一生的故事》（2002）、《呼吸》（2019）等都是他的代表作。

必读新闻

“股票不用交税” 明年起年超250万韩元币圈收益征税…投资者强烈反对

他在美国名校布朗大学主修物理学和计算机工程，是一位理工科出身的作家，并分别四次获得被视为科幻界最高荣誉的雨果奖、轨迹奖（Locus Award）和星云奖（Nebula Award）。

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。