生成式AI与预测式AI技术被夸大
训练数据来源为何
误差范围多大必须搞清

[烤面包的打字机]AI热潮时代…想买的不是幻想而是真正的技术 View original image

“让你拥有健康与美丽。”


19至20世纪的美国街头,号称能创造奇迹的治疗药或滋补强壮剂的“蛇油”曾经畅销一时。当然,商贩所承诺的功效根本不存在,这种东西从一开始就不可能做到那样的效果。即便如此,购买者依然十分迫切,更重要的是,他们愿意相信广告。“最新产品”这几个字本身,就在某种程度上给人带来安慰,即便其中蕴含的意义一时难以理解。


新书《AI泡沫来临》将当今的人工智能(AI)市场比作蛇油。由普林斯顿大学计算机科学家Arvind Narayanan、Sayash Kapoor等人合著的这本书,提出了区分围绕AI的“真正创新”和“伪技术”的标准。其问题意识在于:应当剥离夸张的营销,分辨并选择那些真正起作用而非虚幻的技术。


本书将AI大致分为“生成式AI”和“预测式AI”。生成式AI可以生成看上去像模像样的句子,从而提高生产效率,但与其说是“智能”,不如说更接近基于概率的生成。因此,会出现所谓“幻觉(虚假生成)”现象,把不真实的内容也包装得似乎言之凿凿。问题在于,在验证尚不充分的领域,生成式AI被不加节制地使用,其性能却伴随夸大的广告被迅速扩散。在新闻写作、法律文书、判例引用等方面接连出现错误,动摇社会信任的案例也并不少见。


更为严重的领域,是在招聘、治安、医疗等直接“决定”人类生活的场景中被应用的预测式AI。它常被介绍成仿佛能够洞察未来的技术,但实际上不过是在可观测数据范围之内进行预测而已。人类社会的未来本质上具有高度不确定性,因此无论如何增加数据的数量和质量,这一局限都不会消失。


实际上,在美国,自招聘流程的初期阶段起就大量引入自动化工具,求职者一直将这种“不透明性”视为问题。由于无法知道自己是依据什么标准被筛掉的,导致简历甚至来不及接受人类审阅就被淘汰的情况一再发生。求职者开始通过关键词优化等方式进行“算法应对”,而企业则不断添加各种装置加以防范,双方你来我往。技术一旦进入社会,人们就会对技术做出策略性反应。这一情形表明,良好的预测并不必然保证良好的决策。


在谈论“AI威胁人类身份认同”的末日恐慌之前,我们更应警惕那些悄然侵蚀我们钱包和制度的“伪AI”。企业可能在引进昂贵解决方案之后,既解释不了成效,又只是一味消耗预算;在公共领域,以“AI行政”之名将不透明的判断委托给系统的风险也在增大。


因此,本书要求的态度出人意料地简单。我们无法否定AI本身,但必须果断筛除那些“行不通的技术”。蛇油商人之所以消失,并不是因为人们变得更健康,而是因为谎言一再上演,最终摧毁了信任。与其在“AI将改变我们整个生活”这样的主张面前退缩,不如执着地提出诸如“用什么数据进行训练”、“误差范围是多少”、“失败时由谁承担责任”之类的问题。


本书最强调的是“接受不确定性”。只有承认AI所产生结果的随机性与局限性,才有可能做出更好的决策和政策。“我们必须致力于建立真正承认‘过去无法预测未来’这一事实的开放制度。这样的世界完全有可能实现,只要我们愿意拥抱支撑我们生活的那份随机性。”



《AI泡沫来临》|Arvind Narayanan、Sayash Kapoor著|Kang Mikyung译|Willbook|420页|2.48万韩元


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点