
'토큰화' 없이 사용자 정보 모조리 수집
특히 딥시크 출시 초기 키보드 입력 패턴까지 수집해 논란이 있었는데, 지난 14일 수집 대상에서 제외했다. 키보드 입력패턴은 이용자 개인을 특정할 수 있을 뿐 아니라 비밀번호처럼 사용자가 입력한 중요 정보를 유추하는 데 쓰일 수 있어 민감정보로 분류된다.
이는 다른 AI기업의 정보수집과는 차이가 있다. 오픈AI의 챗GPT도 사용자가 입력한 텍스트나 업로드한 파일, 기기 식별자 등은 마찬가지로 수집한다. 하지만 누구로부터 수집한 정보인지 알 수 없도록 ‘토큰화’하는 과정을 거친다. ‘토큰화’란 필요한 정보만 안전하게 활용할 수 있게 해주는 방법이다. 예를 들어 편의점에서 영수증에 카드번호 전체 대신 마지막 4자리만 보여주는 것과 비슷한 방식이다. 이 과정을 거쳐 사용자 식별 정보는 제거되고, 입력된 데이터만 남아 서비스 개선에 활용된다.
AI 업계 관계자는 딥시크의 개인정보처리방침에 대해 "내가 입력한 디지털 정보가 모두 넘어간다고 보면 된다"고 지적하며 "미국 등 선진국은 개인정보 보호법에 특정 개인의 데이터를 활용하는 것에 대한 규제가 명시돼 있어 수집과 활용이 불가능한 상황"이라고 설명했다.

정보 활용 기간도 명시 안 해, 거부권도 없어
수집한 데이터를 저장하는 기간도 명확하지 않다. 딥시크는 개인정보처리방침에서 정보 보관 기간에 대해 ‘서비스를 제공하는 데 필요한 기간 동안’이라고만 명시했다. 수집된 데이터의 삭제 기한 역시 ‘더 이상 필요하지 않을 경우’로 모호하다. 반면 챗GPT와 클로바X는 사용자가 입력한 데이터의 보유 기간을 최대 30일로 정했다. 제미나이는 데이터 보유 기간을 사용자가 직접 정할 수 있고 클로바X는 입력했던 데이터를 사용자가 직접 삭제할 수 있는 기능도 제공한다.

121만명 개인정보 노출…중국 내 서버에 저장
개인정보보호위원회는 이미 딥시크 사용자 정보가 중국 사회관계망서비스(SNS) 틱톡 모회사인 ‘바이트댄스’에 넘어간 것으로 확인됐다고 밝혔다. 장동인 한국과학기술원(KAIST·카이스트) AI대학원 책임교수도 "딥시크가 수집되는 개인정보는 알아서 쓰겠다고 고지를 해놓은 상황이라 주의해야 한다"고 말했다.
개인정보위가 딥시크에 내린 권고로 신규 앱 다운로드는 중단됐지만, 이번 조치의 실효성을 두고도 논란이 일 것으로 보인다. 이미 딥시크 앱을 내려받은 이용자들은 계속해서 앱을 이용할 수 있는 데다가, 딥시크 웹 페이지는 이번 조치 대상에서 제외됐기 때문이다. 앱 분석 서비스 와이즈앱·리테일에 따르면 딥시크 앱의 지난달 넷째 주 이용자 수는 121만명으로 집계됐다. 이는 같은 기간 생성형 AI 앱 가운데 챗GPT(493만명)에 이어 두 번째로 많은 수치다. 개인정보위 관계자는 "기존에 (딥시크 앱을) 다운로드받아 이용하는 이용자의 경우 사업자 측에서 특별히 할 수 있는 조치가 없어 각자 개인정보 입력에 신중해야 한다"며 "인터넷은 성격상 차단이 쉽지 않다"고 설명했다.