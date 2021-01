[아시아경제 조슬기나 기자] 인공지능(AI) 챗봇 '이루다'의 개발사인 스캐터랩이 개인정보 유출 의혹에 관한 조사에 성실히 임하겠다고 사과했다. 이루다를 둘러싼 논란이 불거진 지 5일만에 나온 첫 공식 사과문이다. 스캐터랩은 오픈소스 공유 플랫폼 '깃허브'에 이루다 관련 개발 기록을 공유하는 과정에서 개인정보 보호 조치를 제대로 하지 않은 점도 인정했다. 원하는 이용자에 한해 데이터베이스에서 개인정보를 삭제하겠다는 입장이다.

스캐터랩은 13일 밤 11시쯤 배포한 사과문을 통해 "개인정보 처리 관련 관계 기관 조사에 성실하게 임하고 있다. 서비스를 이용해주신 모든 이용자분들께 진심으로 사과드린다"고 밝혔다.

스캐터랩은 "논란이 되는 모든 사항에 대해 진상조사위원회를 구성해 철저히 조사하는 한편, 외부 전문가를 포함한 상시 개인정보 보호 체계를 구축하고 재발 방지를 위한 강화된 보안 교육을 실시하는 등 노력하겠다"고 강조했다. 이어 "이번 사안으로 인해 AI 산업계에 계신 여러 동료 기업들, 연구자분들, 파트너들께도 누를 끼치지 않기를 바란다"며 "AI 윤리에 관한 사회적 합의에 부합할 수 있도록 노력하겠다"고 덧붙였다.

스캐터랩은 20세 여대생의 인격을 가진 AI인 이루다 개발 과정에서 연애 분석 앱 '연애의 과학'을 통해 이용자들의 카카오톡 데이터를 수집하며 개인정보보호법을 어겼다는 의혹을 받고 있다. 연애의 과학 앱 이용자와 이용자의 연인에게 개인정보 이용·활용 동의를 제대로 받지 않은 점, 데이터를 이루다 재료로 쓰는 과정에 익명화(비식별화)를 제대로 하지 않은 점 등이 핵심으로 손꼽힌다.

또한 스캐터랩은 이루다 관련 개발 기록을 오픈소스 공유 플랫폼 '깃허브'에 공유하는 과정에서도 익명화를 제대로 하지 않은 것으로 확인됐다.

스캐터랩은 사과문과 함께 배포한 자료에서 "깃허브에 공개한 오픈소스에 내부 테스트 샘플이 포함된 사실이 확인됐다"며 "실명을 자동화 비식별 처리했는데, 필터링 과정에 걸러지지 않은 부분이 일부 존재했다"고 이를 인정했다. 해당 연구에는 내부 테스트를 위해 샘플로 추출한 100건의 데이터(100개 세션, 개별 문장으로 환산 시 1700여 건)가 포함된 것으로 파악된다.

아울러 "데이터 관리에 신중하지 못했다. 민감할 수 있는 정보가 노출된 점에 진심으로 사과드린다"고 고개를 숙였다. 스캐터랩은 해당 깃허브 게시물을 비공개 처리한 상태다.

스캐터랩은 AI 학습에 데이터가 활용되기를 원하지 않는 이용자들의 정보를 개인정보보호법에 따라 DB에서 삭제하고 앞으로 이루다 DB에 활용되지 않도록 적극적인 조치를 취하겠다고 밝혔다. 하지만 구체적인 삭제 요청 경로 등은 언급되지 않았다. 카카오톡 대화를 수집하면서 충분한 동의를 얻지 않은 것에 대해서도 “법적 문제가 없다”는 기존의 입장을 이어갔다. 이용자들은 스캐터랩이 해당 카톡 데이터를 전량 파기해야 한다고 주장하고 있다.

일부 연애의 과학 이용자들은 스캐터랩이 개인정보를 유출했다면서 집단소송을 준비 중이다. 이날 개인정보보호위원회와 한국인터넷진흥원(KISA)은 서울 성동구 스캐터랩 사무실을 방문해 개인정보 유출 의혹에 관한 본격적인 조사에 착수했다.

진보네트워크센터와 민변 디지털정보위원회, 사단법인 정보인권연구소, 참여연대 등은 ‘이루다’ 사태에 대해 “100억 건의 개인정보 침해가 빚어낸 참사”라며 구체적이고 명료한 법적 규범을 조속히 마련할 것을 촉구했다.

