让AI相互竞争生成“以假乱真”内容
被用于数字性犯罪引发社会问题

生成式对抗网络(Generative Adversarial Networks,GAN)是一种让两个人工智能(AI)相互“对抗竞争”,以不断减小误差,从而生成以假乱真的图像、视频、音频等内容的技术。GAN由美国计算机科学家Ian Goodfellow于2014年在神经信息处理系统大会(NIPS)上首次提出。GAN属于深度学习(Deep Learning)的一个分支,主要应用于深度伪造(Deepfake)技术。

警察与伪钞犯示意图 [图片来源=科学技术信息通信部博客提供]

警察与伪钞犯示意图 [图片来源=科学技术信息通信部博客提供]

View original image

GAN由生成器(Generator)和判别器(Discriminator)这两个网络(人工神经网络)构成。生成器和判别器之间是对立关系。生成器负责生成与真实数据相似的数据;相反,判别器负责判断给定数据是真实还是伪造。生成器为了欺骗判别器而不断改进,判别器则为了识别生成器制造的假数据而不断提升能力。


Ian Goodfellow用“警察与伪钞犯”的例子来解释这一过程。伪钞犯的目标是制作尽可能逼真的伪钞来欺骗警察;警察的目标则是识别伪钞并抓获罪犯。随着这种对抗不断重复,伪钞犯在某个时刻能够制作出几乎与真钞无异的伪钞,而警察也会陷入难以区分真假钞票的境地。类似地,这两个人工神经网络通过对抗性、反复性的学习过程,不断提升彼此的性能。


应用GAN的各种案例陆续出现。美国大型信息技术企业英伟达(NVIDIA)在2017年公开了“一组并不存在于现实中的人物图像”。英伟达提出了一种新的训练方法,让GAN的生成器和判别器从较低分辨率开始逐步学习,实现渐进式成长。通过这种方式生成的图像,其逼真程度已经很难分辨是否为真实人物。同年,美国华盛顿大学研究团队制作的前美国总统巴拉克·奥巴马的假演讲视频也引发关注。该视频从奥巴马前总统的多段演讲视频中提取声音,再生成与该声音相匹配的口型并进行合成。

利用GAN技术制作的美国前总统奥巴马演讲视频  图片来源=YouTube

利用GAN技术制作的美国前总统奥巴马演讲视频 图片来源=YouTube

View original image

与AI播音员、AI总统候选人等正面案例不同,深度伪造技术被用于数字性犯罪,已上升为全社会问题。不仅是本国艺人,一般人的面部也被与色情内容进行合成,制作成深度伪造视频并被肆意传播。随着所谓“熟人凌辱群”“多重熟人群”等在Telegram上的聊天室盛行,用于分享此类视频,遭受侵害的女性忧虑日益加深。



各国政府正从国家层面出台对策。美国在去年10月发布行政命令,要求对AI生成的视频、照片、音频强制附加水印(识别标记)。韩国在上月30日决定推动修改法律,提高对深度伪造视频制作和传播行为的处罚标准。用于追踪、检测深度伪造的技术也相继出现。2022年,英特尔公开了“FakeCatcher”技术,通过分析面部血管,以96%的准确率检测假视频。又在去年,美国麻省理工学院(MIT)研究团队宣布开发出名为“PhotoGuard”的技术,通过扭曲图像的关键像素,防止AI对图像进行未经授权的编辑。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点