“노란 포도·보라색 바나나?…시각 개념 이해 넘어 '상상하는 인공지능' 구현”

대전=정일웅 기자

입력 2023.11.30 08:54

01분 04초 소요

숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

‘노란 포도’와 ‘보라색 바나나’ 등 본적 없는 시각 개념을 이해하고, 상상할 수 있는 인공지능 능력 구현이 가능해졌다. 이를 토대로 인공지능의 추론 능력과 상상력 관련 분야의 발전 속도가 빨라질 수 있다는 기대가 나온다.

KAIST는 안성진 전산학부 교수 연구팀이 구글 딥마인드 및 미국 럿거스대와의 국제 공동연구를 통해 시각적 지식을 조합해 새로운 개념을 이해할 수 있는 인공지능 모델과 관련 프로그램을 수행할 벤치마크를 개발했다고 30일 밝혔다.

(왼쪽부터) 안성진 KAIST 전산학부 교수, 김영빈 KAIST 전산학부 석사과정, 가텀 싱 럿거스대 박사과정, 박준영 KAIST 전산학부 석사과정, 딥마인드 책임 연구원 찰라 걸셔. KAIST 제공

인간은 ‘보라색 포도’와 ‘노란색 바나나’ 등 일반적 개념을 학습하고, 이를 분리·재조합해 ‘노란색 포도’와 ‘보라색 바나나’ 등 실재하지 않는 개념을 ‘상상할 수 있는’ 능력을 가졌다.

이러한 능력은 체계적 일반화 또는 조합적 일반화로 명명되며, 범용 인공지능을 구현하는 과정에서 핵심적 요소로 여겨진다.

체계적 일반화는 1988년 미국의 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망으로 문제를 해결할 수 없다고 주장한 이래 35년간 인공지능 딥러닝 분야에서 풀어가야 할 숙제로 남았다.

인공지능 딥러닝 분야에서 발생하는 체계적 일반화 과정에서의 문제는 비단 언어 뿐 아니라, 시각 정보에서도 생긴다. 하지만 그간에는 주로 언어의 체계적 일반화에 초점이 맞춰져 상대적으로 시각 정보에 관한 연구는 부족했던 실정이다.

이에 국제 공동 연구팀은 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했고, 이는 그간 공백으로 남았던 시각 정보에 관한 연구에 새로운 지평을 열 것으로 기대된다. 다만 시각 정보는 언어와 달리 명확한 ‘단어’ 또는 ‘토큰’ 구조가 없어, 이 구조를 학습해 체계적으로 일반화하는 과정이 새로운 도전과제가 될 것으로 보인다.

안성진 교수는 “시각 정보의 체계적 일반화는 범용 인공지능을 달성하기 위한 필수 능력”이라며 “이번 연구를 통해 인공지능의 추론 능력과 상상 능력 관련 분야의 발전에도 속도가 붙을 것으로 기대한다”고 말했다.

딥마인드의 책임 연구원으로 이번 연구에 참여한 연구원이자, 스위스 로잔연방공과대(EPFL) 교수인 찰라 걸셔(Caglar Gulcehre)는 “체계적 일반화가 가능해지면 현재보다 훨씬 적은 데이터로도 인공지능에 성능을 한층 더 향상할 수 있을 것으로 기대한다”고 말했다.