본문 바로가기
Dim영역

진화하는 AI…그림보고 대화까지 나눈다

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

MS 연구진, 300만개 이미지·글 학습시켜 효율화

진화하는 AI…그림보고 대화까지 나눈다
AD
원본보기 아이콘


[아시아경제 이민우 기자] 그림 및 사진과 그 설명을 보고 대화를 나눌 수 있는 인공지능(AI)이 개발됐다.


8일(현지시간) 벤처비트 등 정보기술(IT) 전문 외신들에 따르면 마이크로소프트(MS) 연구진은 사람이 사물을 바라보고 인식하는 방식을 본딴 AI 학습모델인 '시각·언어 사전학습모델(VLP)'을 개발했다. 사진이나 영상 등 이미지와 그에 딸린 설명을 학습시킨 뒤 관련 질문에 답하는 방식이다. 예를 들어 '비가 내리는 가운데 여러 사람들이 우산을 들고 있다'라는 설명과 함께 그에 맞는 사진을 제시한 후 '모두 같은 옷을 입고 있는가?'라고 물으면 스스로 사진을 분석해 '그렇다' 또는 '아니다'라고 답할 수 있는 것이다.

하미드 팔랑기 MS 수석연구원은 "주변의 사물과 환경을 이해하는 것은 인간이 어릴적에 겪는 기본적인 학습 과정"이라며 "주변과 상호작용을 늘릴 수록 주변에 있는 사물이나 각종 행동들을 묘사하기 위해 언어를 더 잘 이해하고 사용하게 된다"고 설명했다. 이어 "반면 이 같은 것들을 기계에게 가르치는 것은 무척 어려운 작업"이라고 덧붙였다.


기존에도 유사한 알고리즘이 있었지만 몇가지 과제를 해결하지 못했었다. 이미지를 묘사하고 추론하기 위해 맥락을 이해할 수 없는데다, 사전 학습을 위한 대규모 데이터를 확보하기 어려웠다. 팔랑기 연구원은 "우리는 이 같은 문제를 해결하기 위해 수많은 표현을 학습한 입력기(인코더)와 입력기의 표현을 인간이 이해할 수 있는 형태로 제공하는 변환기(디코더), 이 두가지를 결합해 최적의 결과물을 뽑아낼 수 있는 사전학습모델 등을 마련했다"고 설명했다.


MS연구진들은 VLP모델이 다양한 분야에서 보다 저렴한 비용으로 활용될 수 있을 것이라고 전망하고 있다. 300만개의 영상과 설명 묶음을 학습한 이 모델은 현재 세계 최대 오픈소스(소스코드 무료로 공개) 사이트 '깃허브'에 공개된 상태다. 연구진은 향후 사전 학습에 더 많은 데이터를 추가하는 동시에 모델 아키텍쳐를 강화해 나아갈 계획이다.



이민우 기자 letzwin@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • 하이브-민희진 갈등에도…'컴백' 뉴진스 새 앨범 재킷 공개 6년 만에 솔로 데뷔…(여자)아이들 우기, 앨범 선주문 50만장 "편파방송으로 명예훼손" 어트랙트, SBS '그알' 제작진 고소

    #국내이슈

  • 때리고 던지고 휘두르고…난민 12명 뉴욕 한복판서 집단 난투극 美대학 ‘친팔 시위’ 격화…네타냐후 “반유대주의 폭동” "죽음이 아니라 자유 위한 것"…전신마비 변호사 페루서 첫 안락사

    #해외이슈

  • [포토] '벌써 여름?' [포토] 정교한 3D 프린팅의 세계 [포토] '그날의 기억'

    #포토PICK

  • 신형 GV70 내달 출시…부분변경 디자인 공개 제네시스, 中서 '고성능 G80 EV 콘셉트카' 세계 최초 공개 "쓰임새는 고객이 정한다" 현대차가 제시하는 미래 상용차 미리보니

    #CAR라이프

  • [뉴스속 인물]하이브에 반기 든 '뉴진스의 엄마' 민희진 [뉴스속 용어]뉴스페이스 신호탄, '초소형 군집위성' [뉴스속 용어]日 정치인 '야스쿠니신사' 집단 참배…한·중 항의

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼