[Unstagram] 曾说“要为你读懂照片”的AI
AI难以将视觉信息转化为文本
人类感官之海,机器难以跨越
在“人工智能(AI)”这个名字以及它的能力显得了不起之前(大约在从现在算起的10年前),曾经有一个网站,号称“电脑会为你‘读(narrate)照片’”。我很好奇,机器究竟会如何用语言来解释自己所看到的东西。于是我上传了一张在济州岛旅行时拍的油菜花与松树构成的风景照。等了大约30分钟,收到了一段英文句子,既复杂又杂乱。
“蓝色的天空与原野,还有宁静。蓝色的天空依然是未知的领域。原野让人联想到农耕,而宁静是佛教的重要德目。光明也被称为光辉,夕阳则泛着玫瑰色。日落是多彩的,一般来说是美丽的。这是上帝告别的方式……”之类的话,像是一首有时说得通、有时又说不通的诗般冗长的句子。它不是在说明画面内容,而是在写联想与感觉,这一点让我十分惊讶。
网站虽然已经消失,但作为机器第一次评价我照片而生成的文字,我一直小心地保存着。运营者至今仍在进行一些以句子与图像之间的关系为媒介的有趣创作,比如制作一种“相机”,拍照后不会输出照片,而是像收据一样吐出一句话。他似乎想要呈现的并不是技术本身,而是观看技术的一种艺术方式。
现在的AI在模仿艺术和脱离事实的创作方面更“有天赋”。只凭几个词就能生成华丽而细腻的图像,也能写出模仿名家名作的文章。只要稍微下点功夫,就能生产出比现实还要逼真的图像,和比现实还要逼真的文字。
反而比较薄弱的,是把承载事实场景的照片或视频等视觉信息转写成文字。当前在事实性视觉信息面前,将其文本化的技术被运用的领域之一,是安全与报警产业。通过观看闭路电视画面,提取诸如“有人在打架”“起火了”“水溢出了”这类基本事实,并加以应用。虽然仍处于初级阶段,却是十分有用的技术。连接人和机器、守护并推动世界发展的关键,是作为跳板的语言。
对AI来说,难以言说的并不是事物的名字,也就是名词,而是像动词和形容词那样,活生生流动的样态与种种关系。世上充满了各种关系、擦肩、交流与冲突,机器很难将它们区分并转化为语言。对于人类来说属于最简单一类的——美丽、悲伤、迫切之类的感觉与情感世界,对机器而言却是茫茫大海。只不过,艺术有时会用另一种语言,渡过这片茫茫大海。
而那张由电脑“读给我听”的照片,又像是某部小说中反复出现的句子,那些句子曾像图像一样向我袭来。它们是凭借感官而非语法被阅读的、似懂非懂的句子。
“他能感觉到时间成群结队地向自己聚拢,
还能看到那些庞大而沉重的块状物,
从百慕大到布宜诺斯艾利斯,
密密麻麻——密得过头了。”
(Anne Carson,《红的自传》,韩民族出版社)
这部小说是以诗的形式写成的。诗就是图像。那么有没有以小说写成的诗呢?应该是有的。
如果不刻意去加以区分的话……
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。