韓 AI 개발사 솔트룩스, "20년 모은 데이터 80억건 개방"

"국내 중소·스타트업 AI 경쟁력 확대 기대"

이경일 솔트룩스 대표

이경일 솔트룩스 대표

원본보기 아이콘

[아시아경제 강희종 기자]국내 대표적인 인공지능(AI) 개발 기업인 솔트룩스(대표 이경일)는 인공지능 산업 발전을 위해 지난 20년간 축적해 온 80억 건의 데이터를 단계적으로 개방한다고 19일 밝혔다.솔트룩스는 "이번에 개방되는 데이터는 오픈 데이터와 소셜 데이터뿐 아니라 방대한 언어자원과 지식베이스를 포함한 아시아 최대 규모가 될 예정"이라고 설명했다.

최근 인공지능 붐이 크게 일고 있고 강력한 알고리즘들이 오픈소스로 개방되고 있지만 실용적 인공지능시스템 구현을 위해 필수적인 데이터 확보는 매우 어려운 실정이다. 구글, 페이스북 등도 인공지능 플랫폼을 개방하고 있지만 데이터는 공개하지 않고 있다.

기계학습과 딥러닝을 위해서는 고품질 데이터 구축이 필수적이지만 막대한 비용과 오랜 투자가 필요하다. 인공지능을 개발하는 국내 중소·스타트업 기업에게 데이터 확보는 가장 큰 고충중 하나였다.이경일 솔트룩스 대표는 "자사의 핵심 자산인 데이터 개방을 결정하기까지 많은 고민이 있었고 용기도 필요했다"며 "이번 결정을 통해 더 늦기 전에 해외 선도기업과 경쟁할 수 있는 국내 인공지능 생태계가 마련될 수 있기를 기대한다"며 데이터 개방의 배경을 설명했다.

솔트룩스는 인공지능 원천기술 개발을 위해 20년간 데이터를 자체 구축하고 외부 지식을 수집, 정제하기 위해 노력해온 기업이다. 솔트룩스는 주요 산업별 오픈데이터와 통계 지표 및 소셜 빅데이터, 다국어 언어자원 등 80억 건 이상의 정제된 빅데이터를 확보하고 있다고 설명했다.

솔트룩스는 오는 11월 데이터 포털과 이를 활용하기 위한 오픈API를 레스트풀( RESTful) 형식으로 개방할 예정이다. 솔트룩스는 이를 통해 여러 전문기업과의 파트너십을 체결하고 세계 시장에서의 공통 경쟁력을 조기 확보할 수 있으리라 기대하고 있다.

이경일 대표는 "국내의 실력 있는 스타트업과 협력해 해외 진출 및 세계적 기업으로 도약하기 위한 교두보를 마련하고 미래 지능정보 사회 구현에 기여할 수 있도록 노력하겠다"고 향후 계획을 밝혔다.

한편, 국내 데이터 축적과 공유/활용 수준은 매우 낙후된 것으로 평가받고 있다. 언어지능 구현에 필수적인 위키백과 기준으로 보면 우리나라는 전 세계 국가 중 27위 수준으로 베트남(7위), 중국(9위)보다 낮고 세르비아와 비슷하다.

솔트룩스는 2013년부터 한국전자통신연구원(ETRI)과 함께 엑소브레인 프로젝트를 진행하고 있다. 엑소브레인은 기계가 사람의 말을 이해하고 각종 데이터로부터 지식을 습득하며 사람처럼 지적인 질문에 대답할 수 있는 인공지능 기술이다.



강희종 기자 mindle@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>