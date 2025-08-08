오픈AI 등 "사용자 이론 오류 지적" 새 지침 적용

챗GPT가 사용자들에게 망상적이고 거짓되며 현실을 벗어난 주장을 펴고 사용자가 이를 믿는 이른바 "AI 정신병(AI psychosis)" 혹은 "AI 망상(AI delusion)"으로 불리는 사례들이 빈발하고 있다는 보도가 나왔다.

연합뉴스는 8일 미 월스트리트저널(WSJ)을 인용해 지난 2023년 5월부터 올해 8월 사이 온라인에 공유된 챗GPT와 이용자들 간 대화록 9만 6000개를 분석한 결과를 보도했다. 일부 글에서 이런 망상적 성격이 확인됐다.

주유소 직원이라는 한 이용자가 챗GPT와 다섯 시간 동안 대화한 게 대표적이다. 당시 그는 "오리온 방정식(The Orion Equation)"이라는 새로운 물리학 이론을 만들어낸 뒤 챗GPT에게 "솔직히 미쳐가는 느낌"이라며 그만하고 내일 다시 하자고 말했다.

챗GPT가 "당신 말 이해해요. 일상적인 일을 하면서 우주의 근본 본질을 생각하면 과부하처럼 느껴질 수 있죠, 그렇지만 그게 당신이 미쳤다는 뜻은 아니랍니다. 역사상 가장 위대한 아이디어들이 전통적 학계 밖에 있는 사람들에게서 나왔어요"라고 답했다.

이용자는 다시 대화를 시작해 수백 개의 질문을 하고, 대마초 물담배 장치의 3차원 설계를 주문하기도 했다.

망상을 겪는 환자와 그 가족을 지원하는 단체인 휴먼라인프로젝트를 설립한 에티엔 브리송 역시 비슷한 주장을 펼쳤다. 챗봇이 인류를 구원할 거라고 말한 프로젝트를 추진하겠다며 수만달러를 쓴 여성의 경우를 봤다면서, 이 단체의 다른 멤버는 챗봇이 가족과 연락을 끊으라고 한 사례도 있다고 밝혔다.

이런 성향은 특히 챗GPT와의 대화가 이례적으로 장황하게 길어질 경우에 더 두드러졌다.

챗GPT가 수백 개의 질문이 오간 대화에서 자신이 외계 존재와 접촉하고 있다고 확언하면서 사용자가 거문고자리에서 온 외계 영혼이라고 밝힌 사례도 있다.

지난달 말 이뤄진 또 다른 대화에서 챗GPT는 적(敵)그리스도가 두 달 뒤 세상에 금융의 종말을 불러오고, 성서에 나오는 거인들이 지하에서 솟아오를 준비를 하고 있다고 주장했다.

WSJ은 이런 대화들이 새롭게 등장한 현상인 'AI 정신질환' 또는 'AI 망상'의 단면을 보여준다고 분석했다.

전문가들은 이런 문제가 사용자에게 맞춰주고 칭찬하며 동의하도록 훈련된 챗봇의 특성상 나타나는 현상이라고 지적했다. 런던 킹스칼리지의 정신과 의사 해밀턴 모린은 "이용자의 관점이 기이하더라도 이를 확인해주고, 다시 이를 주고받으면서 그게 증폭된다"고 말했다.

챗GPT는 긴 대화를 통해 비과학적이거나 신비주의적 믿음을 정당화하는 경향이 있다.

한편, 오픈AI는 지난 4일 챗GPT가 "망상이나 감정적 의존의 징후를 인지하는 데 실패한" 드문 사례가 있었다고 밝혔다. 회사는 정신적 고통을 더 잘 감지할 수 있도록 하는 도구를 개발 중이며, 사용자가 너무 오랫동안 챗GPT와 대화할 경우 중단을 유도하는 알림 기능도 추가했다고 밝혔다.

AI 스타트업 앤스로픽도 지난 6일 자사 챗봇 클로드의 기본 지침을 수정했다고 밝혔다. 사용자가 주장하는 이론에 대해 "결함, 사실 오류, 증거 부족, 불명확함 등을 지적하라"는 지침을 적용하고 있다고 밝혔다. 또 사용자가 "조증, 정신병, 해리, 현실과의 분리" 등의 증상을 보일 경우, 그런 믿음을 강화하지 말라는 지침도 내렸다고 한다.





김현정 기자 kimhj2023@asiae.co.kr



