구글은 하루 6억 명 이상이 방문해서 10억 건이 넘는 검색을 하는 과정에서 독감과 관련된 단어를 검색하는 빈도를 보고 독감 발생을 예측 해낸다. 이른바 ‘빅 데이터’다. 빅 데이터란 기존의 데이터 관리도구의 능력을 넘어서는 대량의 정형 또는 비정형 데이터를 말한다.
미국의 통계전문 블로거 네이트 실버(Silver)는 최근 끝난 미국 대선에서 박빙의 승부라는 언론의 보도와는 달리 오바마의 당선 확률이 90.9%라고 예측했고 각 주별 승자를 예측했는데 50개 주에서 정확히 맞았다. 실버의 ‘마법’ 뒤에도 빅 데이터가 있었다.
빅 데이터 속에는 기업이 새로 출시한 상품에 대한 반응에서부터 앞으로 유행할 제품 트렌드까지 들어 있다. 이뿐 아니다. 의료, 복지, 관광, 교육 등 활용 영역은 무궁무진하다. 앞으로 빅 데이터를 적절히 활용하면 페이스북이나 구글 같이 혜성처럼 나타나는 기업도 얼마든지 생길 수 있다는 얘기다. 세계 여러 나라 정부가 빅 데이터를 새로운 산업기회로 보고 앞다퉈 육성 방침을 표방하고 있는 것도 이 때문이다. 한 마디로 빅 데이터는 디지털 시대의 금광(金鑛)이라 할 만하다.
유럽연합(EU)도 지난해 12월 27개 회원국에서 생산하는 모든 공공정보와 데이터를 의무적으로 공개토록 했다. 이렇게 공개된 데이터를 일반 시민이나 기업이 재가공해 사업으로 활용할 수 있도록 한 것이다. EU는 이들 공개된 정보의 가공산업으로 연간 400억 유로(약 61조원) 규모의 생산유발효과가 발생할 것으로 내다보고 있다.
한국도 지난해 10월 대통령 직속의 국가정보화전략위원회가 빅 데이터를 활용한 스마트 정부 구현방안을 발표한 바 있다. 이와 관련 현재 공유자원포털 사이트(data.go.kr)에서 13종 126개 정보세트를 제공하고 있다. 올해 안에 특허정보, 통계정보, 실시간 항공운항정보, 전국 동식물정보 등 23종의 정보가 추가될 예정이다. 이들 정보를 활용한 애플리케이션 등 다양한 활용이 기대된다.
문제는 아직 인식과 제도가 뒷받침 되지 못하고 있다. 공유자원포털을 운영하는 한국정보화진흥원 관계자는 “아직도 정부기관 중 상당수가 단순히 정보를 공개하는 것으로 역할을 다한 것으로 생각한다"며 "공개된 정보가 실제로 활용될 수 있도록 개방하겠다는 단계까지 인식의 발전이 필요하다”고 지적했다. 관련하여 이들 공공기관이 특별한 이유 없이 정보를 개방하지 못하도록 규정한 ‘공공 데이터의 제공 및 이용활성화에 관한 법률’이 국회에서 낮잠을 자고 있는 것도 문제다.
백재현 기자 itbrian@
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>