[新闻术语]基于深度伪造的技术“生成对抗神经网络（GAN）”

by Choi Hokyung

Published 03 Sep.2024 17:01(KST)

让AI相互竞争生成“以假乱真”内容
被用于数字性犯罪引发社会问题

生成式对抗网络（Generative Adversarial Networks，GAN）是一种让两个人工智能（AI）相互“对抗竞争”，以不断减小误差，从而生成以假乱真的图像、视频、音频等内容的技术。GAN由美国计算机科学家Ian Goodfellow于2014年在神经信息处理系统大会（NIPS）上首次提出。GAN属于深度学习（Deep Learning）的一个分支，主要应用于深度伪造（Deepfake）技术。

警察与伪钞犯示意图 [图片来源=科学技术信息通信部博客提供]

GAN由生成器（Generator）和判别器（Discriminator）这两个网络（人工神经网络）构成。生成器和判别器之间是对立关系。生成器负责生成与真实数据相似的数据；相反，判别器负责判断给定数据是真实还是伪造。生成器为了欺骗判别器而不断改进，判别器则为了识别生成器制造的假数据而不断提升能力。

Ian Goodfellow用“警察与伪钞犯”的例子来解释这一过程。伪钞犯的目标是制作尽可能逼真的伪钞来欺骗警察；警察的目标则是识别伪钞并抓获罪犯。随着这种对抗不断重复，伪钞犯在某个时刻能够制作出几乎与真钞无异的伪钞，而警察也会陷入难以区分真假钞票的境地。类似地，这两个人工神经网络通过对抗性、反复性的学习过程，不断提升彼此的性能。

应用GAN的各种案例陆续出现。美国大型信息技术企业英伟达（NVIDIA）在2017年公开了“一组并不存在于现实中的人物图像”。英伟达提出了一种新的训练方法，让GAN的生成器和判别器从较低分辨率开始逐步学习，实现渐进式成长。通过这种方式生成的图像，其逼真程度已经很难分辨是否为真实人物。同年，美国华盛顿大学研究团队制作的前美国总统巴拉克·奥巴马的假演讲视频也引发关注。该视频从奥巴马前总统的多段演讲视频中提取声音，再生成与该声音相匹配的口型并进行合成。

利用GAN技术制作的美国前总统奥巴马演讲视频图片来源=YouTube

与AI播音员、AI总统候选人等正面案例不同，深度伪造技术被用于数字性犯罪，已上升为全社会问题。不仅是本国艺人，一般人的面部也被与色情内容进行合成，制作成深度伪造视频并被肆意传播。随着所谓“熟人凌辱群”“多重熟人群”等在Telegram上的聊天室盛行，用于分享此类视频，遭受侵害的女性忧虑日益加深。

必读新闻

“我们月薪也要破1000万了”创历史新高…“半导体效应”引爆大型电子部件企业绩效奖金

各国政府正从国家层面出台对策。美国在去年10月发布行政命令，要求对AI生成的视频、照片、音频强制附加水印（识别标记）。韩国在上月30日决定推动修改法律，提高对深度伪造视频制作和传播行为的处罚标准。用于追踪、检测深度伪造的技术也相继出现。2022年，英特尔公开了“FakeCatcher”技术，通过分析面部血管，以96%的准确率检测假视频。又在去年，美国麻省理工学院（MIT）研究团队宣布开发出名为“PhotoGuard”的技术，通过扭曲图像的关键像素，防止AI对图像进行未经授权的编辑。

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。