科幻作家 Ted Chiang:“ChatGPT 是人类知识劣化的复本”
“ChatGPT将知识‘压缩’后学习
只留下原本的模糊副本
凭副本无法进行创造性工作”
由OpenAI开发的人工智能(AI)聊天机器人“ChatGPT”有时会给出错误答案,让用户感到困惑。谷歌作为“ChatGPT对手”推出的“Bard”,甚至在首次演示时就输出了错误答案。用海量文档训练出来的人工智能,为什么连简单事实都会混淆?
美国顶级科幻作家之一Ted Chiang在美国媒体《纽约客》(New Yorker)上发表长文,对此进行了说明。根据他的文章,人工智能是通过对信息进行“压缩”来学习的,在这一过程中,人工智能的知识相较原始信息会变得迟钝、模糊。
Ted Chiang:“ChatGPT是互联网的模糊版本”
Ted Chiang于本月9日(当地时间)在《纽约客》上发表了一篇题为“ChatGPT是互联网的模糊JPEG版本”的文章。在这篇文章中,他为了说明复杂而晦涩的语言生成模型人工智能,借用了图像文件扩展名“JPEG”作为比喻。
JPEG是我们在电脑或手机中保存照片、图画等文件时使用的扩展名之一。虽然还有PNG、GIF等多种扩展名,但在互联网上流通最为活跃的扩展名是JPEG/JPG。
JPEG在各类图像文件格式中成为“主流”的原因在于其占用空间小。与PNG等扩展名相比,使用JPEG的文件能够更快地在互联网上上传和下载。相应地,以JPEG格式保存的文件,相比体积更大的其他格式,画质会有所降低。如果在画图软件中画一幅图,分别以PNG和JPEG格式保存,那么JPEG那一侧看上去会稍微更“模糊”一些。
像图像文件一样,知识也在有损压缩
像JPEG这样的文件保存方式被称为“有损压缩(lossy compression)”。这是一种即便牺牲一部分数据,也要大幅减小文件体积的技术。照片本身即使画质略有下降,用肉眼观看也不会造成太大不便,相反,多亏了JPEG,互联网加载速度变得更快,因此收益远大于损失。
这种JPEG有损压缩技术,与ChatGPT学习知识的方法十分相似。它会将复杂而细致的细节抽象化后进行存储,再将其重新用人类语言展开输出。
Ted Chiang表示:“可以把ChatGPT等类似语言模型看作散布在互联网上的模糊JPEG文件”,“ChatGPT几乎掌握了互联网上的大部分信息,但这些信息更接近于JPEG文件那样被模糊化的图像”。
他接着强调说:“因此,如果把这幅图像的一部分放大到想要看清极其细微的细节,就会发现什么也看不到。我们能从ChatGPT那里获得的,只是‘近似值’而已。”
ChatGPT有时给出错误答案,甚至生成根本不存在的事实,这些错误同样是“有损压缩”留下的痕迹。由于在重构那些已经变得模糊的部分时进行再创造,就会出现与事实完全不符的内容。
“明明还有原件……真的要用劣质拷贝吗”
Ted Chiang对于将人工智能作为创作过程中的辅助工具也持怀疑态度。他表示:“一台只能输出原件模糊拷贝的机器,不可能成为原创性工作的起点”,“相反,人类在写作过程中经历的试错与思考,才是孕育独创性想法的真正过程”。
反而在某些时刻,ChatGPT会显得尤为有用,那就是当互联网完全中断、无法访问信息的时候。因为一旦无法接触到知识的原始来源,哪怕只是一份略显不准确的拷贝,拥有它也要好过一无所有。
然而,Ted Chiang指出:“目前我们并没有面临突然失去互联网接入权限的危机”,“既然原件仍然存在,我们真的有必要特意去使用那种模糊的JPEG版本知识吗?”
另一方面,Ted Chiang是横扫各类科幻小说(SF)大奖的人物。
《巴别塔》(1990)、《理解》(1991)、《你一生的故事》(2002)、《呼吸》(2019)等都是他的代表作。
他在美国名校布朗大学主修物理学和计算机工程,是一位理工科出身的作家,并分别四次获得被视为科幻界最高荣誉的雨果奖、轨迹奖(Locus Award)和星云奖(Nebula Award)。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。