본문 바로가기
Dim영역

AI학습의 답은 '물량공세'…구글, 이미지 500만개 오픈소스로 공개

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

AI 시각 인식 모델 '구글 랜드마크 V2' 오픈소스로공개
랜드마크 20개·이미지 500만개로 대폭 늘려

구글 랜드마크V2에 데이터로 포함된 세계 각지의 명소들(출처=구글 AI블로그)

구글 랜드마크V2에 데이터로 포함된 세계 각지의 명소들(출처=구글 AI블로그)

AD
원본보기 아이콘


[아시아경제 이민우 기자] 구글이 인공지능(AI) 기반 시각 인식을 위한 방대한 데이터를 오픈소스로 공개했다. 현실 속의 여러 사물을 구분하는 사진 속의 사물과 실물을 구분하는 등의 기술을 더욱 발전시키겠다는 목표에서다.


5일(현지시간) 벤처비트 등 정보기술(IT) 외신들에 따르면 구글은 이 같은 AI 탐지모델 '구글 랜드마크 V2'를 오픈소스(소스코드까지 무료로 공개) 방식으로 내놨다.

앞서 구글 AI 연구팀은 나이아가라 폭포와 다른 폭포를 구분하거나, 카탈로그 상의 사물과 실제 사물을 구분하는 AI 시스템을 꾸준히 개발해왔다. 올해 발표한 랜드마크 V2는 500만개의 이미지와 20만곳의 랜드마크를 확보했다. 독일 노이반슈타인성, 미국 샌프란시스쿄의 금뮨교, 이집트 기자 스핑크스, 페루 잉카문명 유적지 마추 픽추 등 여러 유명한 지역의 이미지를 정교하게 분류해 포함시킨 것이다.


또한 구글 연구팀은 위키피미디어 커먼즈의 덜 유명한 랜드마크의 이미지, 위키미디어 재단의 무료 공개 사진 등도 모두 포함시켰다. 지난해 발표한 V1보다 이미지는 2배, 랜드마크는 7배 가량으로 대폭 늘린 셈이다.


인식 기법도 개선됐다. 기존 8만6000여개의 이미지를 학습해 사물과 랜드마크를 처음에 인식한 뒤 새롭게 추가된 데이터셋으로 학습한 내용을 토대로 가중치를 부여하며 정확도를 올리는 식이다. 구글 AI 소프트웨어 엔지니어인 빙이 카오와 토비어스 웨이얀드는 "사물을 구분하고 이미지를 보다 정확하게 검색하기 위해서는 AI에게 학습시킬 막대한 데이터가 필요하다"며 "구글 랜드마크 V2는 방대한 데이터셋을 확보한 만큼 AI의 학습량을 대폭 늘리려 AI 시각 인식 기술을 발전시킬 수 있을 것"이라고 설명했다.



이민우 기자 letzwin@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • 하이브-민희진 갈등에도…'컴백' 뉴진스 새 앨범 재킷 공개 6년 만에 솔로 데뷔…(여자)아이들 우기, 앨범 선주문 50만장 "편파방송으로 명예훼손" 어트랙트, SBS '그알' 제작진 고소

    #국내이슈

  • 때리고 던지고 휘두르고…난민 12명 뉴욕 한복판서 집단 난투극 美대학 ‘친팔 시위’ 격화…네타냐후 “반유대주의 폭동” "죽음이 아니라 자유 위한 것"…전신마비 변호사 페루서 첫 안락사

    #해외이슈

  • [포토] '벌써 여름?' [포토] 정교한 3D 프린팅의 세계 [포토] '그날의 기억'

    #포토PICK

  • 신형 GV70 내달 출시…부분변경 디자인 공개 제네시스, 中서 '고성능 G80 EV 콘셉트카' 세계 최초 공개 "쓰임새는 고객이 정한다" 현대차가 제시하는 미래 상용차 미리보니

    #CAR라이프

  • [뉴스속 인물]하이브에 반기 든 '뉴진스의 엄마' 민희진 [뉴스속 용어]뉴스페이스 신호탄, '초소형 군집위성' [뉴스속 용어]日 정치인 '야스쿠니신사' 집단 참배…한·중 항의

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼