"모를 땐 '모른다' 답해야" AI의 과신 원인규명·신뢰성 'UP'

대전=정일웅 기자

입력 2026.04.27 08:56

01분 39초 소요

숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

인공지능(AI)의 '과도한 확신'은 자율주행과 의료 진단 등 분야에서 경계해야 할 위험 대상이다. 모르는 것을 모른다고 답하지 않고, 틀린 답 또는 애매모호한 답을 내놓을 때는 되레 사용자의 판단을 흐릴 수 있는 까닭이다. 학습을 통해 AI가 스스로 '알지 못하는 상황'을 인식, 과신을 줄여 신뢰성을 높이는 방안을 국내 연구팀이 제시했다.

KAIST는 뇌인지과학과 백세범 석좌교수 연구팀이 AI의 과신을 유발하는 근본 원인으로 '무작위 가중치 초기화'를 지목, 이를 해결할 방법으로 '무작위 노이즈'로 신경망을 짧게 학습시키는 일종의 '예열' 전략을 고안했다고 27일 밝혔다.

KAIST 백세범 석좌교수, (상단)KAIST 천정환 석사. KAIST

무작위 가중치 초기화는 신경망 학습이 시작될 때 가중치를 확률 분포에 따라 무작위로 설정하는 방식이다. 인공신경망을 활용해 데이터를 학습하는 '딥러닝(deep learning)'에서 널리 사용된다. 무작위 노이즈(random noise)는 의미 없는 임의의 입력 데이터를 의미한다.

연구팀은 AI의 과신 문제가 학습 이후는 물론 학습하는 출발점인 초기화 단계부터 이미 나타나는 점에 주목했다. 무작위로 초기화된 신경망에 임의의 데이터를 입력했을 때 배운 내용이 없는 상태에서도 높은 확신도를 보이는 현상이 확인된 것이다.

이러한 특성은 생성형 AI에서 '사실과 다른 내용'을 만드는 일종의 '환각(존재하지 않는 정보를 그럴듯하게 만드는 현상)' 문제로 이어질 수 있다.

연구팀은 이 같은 문제를 해결할 실마리를 생물학적 두뇌에서 찾았다.

인간의 두뇌는 출산 전부터 외부 자극 없이 '자발적 신경 활동(외부 입력 없이 스스로 발생하는 뇌 신호)'을 통해 신경회로를 형성한다.

연구팀은 이 개념을 인공신경망에 적용해 실제 학습이 진행되기 전 무작위 노이즈를 입력하는 것으로 사전 학습을 수행하는 일종의 '예열 단계'를 적용했다. AI가 본격적으로 학습을 시작하기 전 스스로 불확실성을 조정할 수 있게 하는 과정이다.

예열 과정을 거친 AI 모델은 초기 확신도가 낮지만, 기존에 보였던 과신 편향은 완화된 것으로 확인됐다. AI가 데이터를 배우기 전 스스로 '나는 아직 아무것도 모른다'는 상태를 먼저 학습하는 구조다. 이 과정을 거친 AI는 모델의 정확도(예측이 맞는 비율)와 확신도(모델이 스스로 맞다고 믿는 정도)가 자연스럽게 일치하는 방향으로 개선됐다는 게 연구팀의 설명이다.

예열 과정을 거친 AI는 처음 데이터를 대할 때의 반응에서도 차이를 보였다. 기존 모델은 학습하지 않은 데이터에도 높은 확신을 보이며 잘못된 답을 제시하는 경향이 있었다. 하지만 예열 학습을 적용한 모델은 확신도를 낮춰 '모른다'고 판단하는 능력이 뚜렷하게 향상된 것이다.