코로나가 드러낸 인공지능 한계…'쓸만한 데이터'가 없다 [임주형의 테크토크]

임주형 기자

입력 2021.08.23 06:00

수정 2023.03.15 19:25

펼치기/접기

02분 00초 소요

숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

코로나19 진단용 AI 알고리즘, 대부분 엉터리
영국·네덜란드 연구팀 약 600여개 AI 툴 분석한 연구 결과
'잘못된 데이터' 이용해 학습했기 때문
연구진 "잘못된 데이터가 AI 무용지물 만들어"
"준비 안된 AI 이용하면 오히려 위험할 수도"

지난해 부산 북구청에 설치된 고객 안내용 로봇. / 사진=연합뉴스

[아시아경제 임주형 기자] 주식 투자부터 물류 배송까지, 오늘날 인공지능(AI) 없는 세상은 상상조차 할 수 없습니다. AI는 막대한 데이터를 통해 학습함으로써 가격이 오를 가능성이 큰 주식 종목을 추천하거나, 택배 수요를 예측하는 등 우리의 삶을 도와주고 있지요.

하지만 이렇게 만능처럼 보이는 AI임에도, 유독 코로나19 대응에는 난항을 빚고 있습니다. 일례로 코로나19 바이러스 확진 여부를 알려주는 AI 알고리즘을 개발하기 위해 전세계 수백개 업체들이 달려들었지만, 이들 중 성공한 사례는 손에 꼽을 정도로 적습니다. 미래의 혁신 산업 중 하나로 알려진 AI는 어째서 코로나19에서만큼은 애물단지로 전락했을까요?

지난 6월31일 미국 매사추세츠 공과대학교(MIT)가 발행하는 기술 전문지 '테크놀러지 리뷰'는 "전세계에서 개발한 수백개의 AI 모델들이 실제 임상에서 효과를 보지 못했다"는 기사를 게재했습니다.

이 매체에 따르면 최근 영국과 네덜란드의 두 연구팀은 지난해 개발된 코로나19 진단용 AI 알고리즘 600여개의 유용성을 검토했습니다. 이 알고리즘들은 아픈 환자의 증상이나 신체 변화, 엑스레이 및 흉부 컴퓨터 단층 촬영(CT) 이미지 등 의료정보를 종합해 코로나19 확진 여부를 판단합니다.

지난해 코로나19가 팬데믹(pandemic·세계적 대유행)에 이르면서 세계적으로 검체 진단 장비와 시약이 부족해져 환자 진단에 차질을 빚는 나라가 많았는데, AI 기업들은 진단 알고리즘을 개발해 위기에 대응하려 했지요.

코로나19 검체를 채취하는 의료진 모습 / 사진=연합뉴스

그러나 정작 뚜껑을 열어보니 결과는 충격적이었습니다. 두 연구팀이 조사한 결과, 600개 이상에 이르는 AI 알고리즘 가운데 임상 단계로 옮길 만한 정확도를 보여준 모델은 고작 2개 정도에 불과했습니다.

이같은 연구 결과는 각각 '브리티시 메디컬 저널', '네이처' 등 영국 과학 저널에 실렸습니다. 연구진 측은 '테크놀러지 리뷰'에 "정말 충격적이었다'라며 "(AI가 쓸모없을지도 모른다는) 염려는 하고 있었지만, 실험 결과는 내가 우려했던 수준을 훨씬 넘어섰다"고 토로했습니다.

왜 수백개에 달하는 AI 알고리즘들은 환자의 코로나19 감염 여부를 판단하는 데 실패했을까요? 연구진은 '엉터리 데이터'의 문제라고 지적합니다.

통상 요즘 쓰이는 기계 학습 AI는 수많은 데이터를 반복적으로 학습하면서 정확도를 높입니다. 즉, AI의 목적에 맞는 데이터를 주입해 훈련할 수 있게 만들어줘야 한다는 뜻입니다.

문제는 코로나19 팬데믹 당시 인터넷에는 너무 많은 관련 데이터들이 만들어졌고, 이들 중 상당수가 전문가의 손길을 거치지 않은 '엉터리 정보'였다는 데 있습니다. 이런 데이터들이 AI가 학습할 데이터셋에 포함되어 있다 보니, 결국 AI들도 엉터리가 되어 버렸습니다.

영국 연구팀을 이끌었던 데릭 드릭스 박사는 이에 대해 "AI 연구자들이 기본적인 실수를 범하고 있다. AI 툴을 훈련하고 테스트하는데 부정확한 데이터를 쓰고 있다는 것"이라며 "잘못된 데이터 때문에 AI가 무용지물이 되는데, 많은 기업들이 마케팅 용어에만 치중하며 준비도 안 된 많은 AI 툴의 사용을 부추긴다. 이런 추세 때문에 오히려 환자들이 위험해질 수 있다"고 경고했습니다.

엉터리 데이터를 이용해 학습한 인공지능은 엉뚱한 판단을 내리는 등 제대로 성능을 발휘하지 못하게 될 가능성이 높다. / 사진=연합뉴스

잘못된 데이터로 학습한 '엉터리 AI'는 심각한 의학적·윤리적 문제를 초래할 수 있습니다. 오진을 내려 환자의 목숨을 위태롭게 만들 위험이 있고, 인종차별적인 선입견을 습득할 수도 있지요.

이런 위험성은 AI 상용화의 주요한 걸림돌이기도 합니다. 지난 2월 미국 금융 매체 '월스트리트저널(WSJ)'에 따르면 IT 기업 IBM은 현재 수조원이 넘는 돈을 들여 개발한 의료용 AI '왓슨'의 매각을 검토하고 있는데, 왓슨의 진단 정확도가 그리 높지 않아 미국 병원들이 도입을 주저하고 있기 때문입니다.

그렇다면 AI를 쓸모 있게 만드는 방법은 무엇일까요?

드릭스 박사는 전문성을 갖춘 업계 전문가와 AI 엔지니어들의 밀접한 협업을 통해 돌파구를 마련할 수 있다고 주장합니다. 전문가들이 양질의 데이터를 가다듬으면, 그 데이터셋을 바탕으로 AI를 훈련해 '똑똑한 AI'로 만드는 방식입니다.

또 드릭스 박사는 AI 연구의 투명성을 강화하는 방안도 중요하다고 강조합니다. 그는 "AI 연구원들이 자신들의 모델을 어떻게 학습했는지 다른 이들에게 공유해야 한다"며 "그래서 다른 연구자들이 이를 기반으로 테스트하고 개발할 수 있게 해야 한다"고 말했습니다. AI가 어떻게 데이터를 학습했는지 알 수 있다면 문제점을 파악하고 개선할 부분을 찾아내는 일도 쉬워지기 때문입니다.