bar_progress

아시아경제 최신 기획이슈

딥페이크, 창과 방패 대결 될까 [임주형의 테크토크]

최종수정 2020.09.13 08:00 기사입력 2020.09.13 08:00

댓글쓰기

AI 이용한 합성 기술 '딥페이크' 보편화
누구나 쉽게 합성 영상 제작 가능…악용 우려도
딥페이크 AI 맞서는 '딥페이크 탐지' AI도 등장
AI vs AI 형세…'창과 방패' 대결 될지도

'딥페이크' 기술을 이용해 도널드 트럼프 미국 대통령의 몸에 '미스터 빈' 배우  얼굴을 합성한 영상. / 사진=유튜브 캡처

'딥페이크' 기술을 이용해 도널드 트럼프 미국 대통령의 몸에 '미스터 빈' 배우 얼굴을 합성한 영상. / 사진=유튜브 캡처



[아시아경제 임주형 기자] 최근 유튜브에서는 이른바 '딥페이크 매시업'이라는 제목의 영상들을 쉽게 찾아볼 수 있습니다. 인공지능(AI)을 이용해 사람의 신체부위 일부를 다른 영상에 덮어 씌우는 딥페이크 기술과, 여러 노래를 섞어 새로운 음악을 탄생시키는 매시업 장르를 결합한 신조어이지요.


딥페이크 매시업은 주로 유명 영화·드라마·뉴스 장면 등에 다른 배우의 얼굴을 덧씌우는 방식으로 제작됩니다. 영화 '아이언맨'의 배우 얼굴을 톰 행크스로 바꾸거나, 도널드 트럼프 미국 대통령의 인터뷰 장면에 '미스터 빈'으로 유명한 영국 배우 로완 앳킨슨 얼굴을 삽입하기도 합니다.

아직까지는 영상 기술자의 실력에 따라 편차가 있지만, AI가 발달하면서 딥페이크는 점점 육안으로 구분하기 어려울 만큼 정교해지고 있습니다. 딥페이크가 가까운 미래에 가짜뉴스, 신상정보 도용 등 범죄에 악용될 수 있다는 우려가 나오는 이유입니다.


딥페이크는 이미 우리 사회 전반에서 광범위하게 쓰이고 있습니다. 이를테면 전세계 150여개국에서 8억명이 넘는 이용자 수를 보유하고 있는 중국 동영상 공유 소셜네트워크서비스(SNS) '틱톡'은 딥페이크를 지원하고 있습니다. 틱톡 내에선 '페이스 스왑'이라고 불리는데, 사용자가 자신의 얼굴을 찍은 뒤 다른 사람 몸에 덮어씌울 수 있는 기능입니다.


SNS뿐 아니라 글로벌 광고업계에서도 딥페이크 기술이 쓰입니다. 지난 2019년 4월 영국 축구선수 데이비드 베컴은 말라리아 퇴치 공익광고를 촬영했습니다. 당시 베컴은 영어로 말을 했지만, 딥페이크 기술을 이용해 입 모양을 조작함으로써 총 9개 국어로 이뤄진 광고가 탄생했습니다.

영국 축구선수 데이비드 베컴의 얼굴을 딥페이크 기술로 일부 조작, 9개 국어 더빙 영상을 만드는 장면. / 사진='말라리아 머스트 다이' 유튜브 캡처

영국 축구선수 데이비드 베컴의 얼굴을 딥페이크 기술로 일부 조작, 9개 국어 더빙 영상을 만드는 장면. / 사진='말라리아 머스트 다이' 유튜브 캡처



문제는 딥페이크가 점점 보편화하는 만큼, 이를 진짜와 구분하는 것도 힘들어졌다는 데 있습니다. 만일 딥페이크를 가짜뉴스 전파, 타인 신상정보 도용 등에 사용하면 사회적인 혼란이 닥칠 가능성도 있습니다.


딥페이크는 이미 사회적 문제로 떠오르고 있습니다. 메신저 '텔레그램'에 모인 이들이 성착취 동영상을 제작, 돈을 받고 유포했던 'n번방' 사건 당시 일부 피의자들은 해당 기술을 이용해 여성 사진을 다른 음란물에 합성한 뒤 유포하는 이른바 '지인능욕' 범행을 벌이기도 했습니다.


다른 나라에서도 유사한 사건이 벌어졌습니다. 미국 최대 음란물 영상 홈페이지인 '폰O'에서는 지난해부터 연예인이나 일반인 얼굴을 음란물에 합성하는 이른바 '딥페이크 음란물'이 만들어지기 시작했습니다.


이를 인지한 폰O 측은 지난 2월 "딥페이크는 리벤지포르노와 다를 바 없는 영상"이라며 "AI를 이용해 합성한 모든 음란물 영상을 홈페이지 내에서 삭제하고 금지하겠다"고 밝혔습니다.


네덜란드 사이버보안 연구기업 '딥트레이스'가 지난 6월3일 공개한 보고서에 따르면, 온라인상에 존재하는 딥페이크 영상은 지난 2018년 7964개에서 지난해 7월 1만4678개로 2배 가까이 폭증했다고 합니다. 이 가운데 96%(1만4090개)는 딥페이크 음란물이었습니다.


그렇다면 딥페이크 기술이 악용되는 것을 막을 수는 없는 걸까요?


현재 딥페이크의 핵심기술은 GAN(Generative Adversarial Network·생성적 적대 신경망)입니다. GAN은 AI가 '생성 모델'과 '감별 모델'이라는 두 개의 모델을 만든 뒤, 감별 모델이 생성 모델에서 가짜를 찾아내 파괴하는 과정을 반복하는 방식입니다. 이같은 방식으로 생성 모델에서 부자연스러운 부분이 점점 줄어들면서 결국 마지막에는 가장 정교한 모델이 탄생합니다.


쉽게 말하면, AI가 데이터를 보고 스스로 교차 검증하면서 점점 더 '진짜 같은 가짜'를 만들어낸다는 겁니다. 기존에는 정교한 합성 영상이나 사진을 만들려면 인간의 기술이 필요했지만, 이제는 AI 소프트웨어에 간단한 명령을 입력하는 것만으로도 진짜 같은 합성을 하는 게 가능해진 셈입니다.


게다가 AI의 합성 숙련도는 날이 갈수록 발전할 테니, 결국 머지않아 인간의 눈은 딥페이크와 진짜 영상을 완전히 구분할 수 없게 될 겁니다.


마이크로소프트가 지난 1일(현지시간) 공개한 '어센터케이터.' 화면에서 딥페이크 편집이 이뤄진 부분을 감지해 영상의 진위 여부를 판별한다. / 사진=마이크로소프트

마이크로소프트가 지난 1일(현지시간) 공개한 '어센터케이터.' 화면에서 딥페이크 편집이 이뤄진 부분을 감지해 영상의 진위 여부를 판별한다. / 사진=마이크로소프트



하지만 딥페이크가 보편화하고 있는 것처럼, 딥페이크를 막는 '딥페이크 탐지' 기술도 서서히 발전하고 있습니다. 지난 1일 미국의 IT 대기업 '마이크로소프트'는 동영상의 딥페이크 여부를 감별하는 '비디오 어센터케이터'를 발표했습니다.


어센터케이터 또한 딥페이크처럼 AI를 이용한 기술입니다. AI가 특정 영상을 프레임 단위로 분석한 뒤, 화면에서 딥페이크 기술로 편집된 흔적을 찾아내 '신뢰 점수'를 계산하는 방식입니다. 이 신뢰 점수를 바탕으로 영상에 '인증'을 부여해, 딥페이크 영상과 진짜 영상을 구분하는 것이지요.


이 외에도 구글, 페이스북 등 인터넷 기업들 또한 딥페이크를 탐지하고 색출하는 기술을 개발하고 있습니다.


딥페이크와 딥페이크 탐지 둘 다 딥러닝 AI를 사용합니다. 다만 딥페이크 AI가 가짜 영상을 더욱 정교하게 만드는 훈련을 받는다면, 딥페이크 탐지 AI는 그런 가짜 영상의 편집된 부분을 식별하는 훈련을 받는다는 차이가 있을 뿐이지요.


어찌 보면 AI와 AI가 서로 창과 방패가 되어 영원히 끝나지 않을 경쟁을 하게 된 셈입니다.




임주형 기자 skepped@asiae.co.kr

<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

간격처리를 위한 class