bar_progress

"여론조사는 거짓말을 해도 데이터는 진실을 말한다"

최종수정 2020.07.16 10:02 기사입력 2020.07.16 10:00

댓글쓰기

[데이터경제에 길을 묻다] 도플갱어ㆍ개도국 GDP...빅데이터가 아는 사실들

[아시아경제 김흥순 기자] 구글의 데이터 분석가 세스 스티븐스 다비도위츠가 쓴 '모두 거짓말을 한다'에는 미국 프로야구 보스턴 레드삭스의 간판 타자이던 데이비드 오티스의 사례가 등장한다. 오티스는 2003년부터 14시즌 동안 보스턴에서 뛰었다. 2004년 팀이 '밤비노의 저주'를 끊고 86년 만에 월드시리즈를 제패하는 데 기여했고 2007년에도 우승을 달성했다.


승승장구하던 그의 기량은 33살이던 2008년에 꺾였다. 타율은 0.068, 출루율 0.076, 장타율은 0.114 하락했다. 2009년에는 이보다 성적이 더 나빴다. 보스턴 구단이 눈여겨본 건 미국 통계학자 네이트 실버가 산출한 '도플갱어' 모델이다. 실버는 메이저리그 선수 1만8000여명의 키, 나이, 포지션, 홈런, 타율 등 모든 데이터를 매년 구축했다. 여기서 오티스의 나이(24~33세) 때 가장 비슷한 성적을 낸 선수 20명을 추려 이들의 야구 경력을 파악했다. 대표적인 선수가 호르헤 포사다와 짐 토미. 이들도 20대 후반에 최고의 기량을 뽐내다가 30대 초반에 고전했고 이후 다시 기량을 되찾았다는 사실을 발견했다.

보스턴 구단은 도플갱어 예측에 따라 오티스에게 더 기회를 주기로 했고 이 선택은 들어맞았다. 오티스는 38살이던 2013년 월드시리즈에서 타율 0.688로 맹활약하며 세 번째 정상에 오르고 최우수선수(MVP)로 뽑혔다. 2016년 은퇴한 그는 '빅 파피'라는 애칭과 함께 보스턴 팬들이 가장 사랑하는 선수로 남았다. 도플갱어 모델은 데이터 수집과 분석이 야구뿐 아니라 각종 비즈니스에서도 유용하게 활용될 수 있음을 안내한다. 보유한 데이터 세트가 많을 수록 정확한 분석과 예측이 가능하다.



개발도상국에서 제시하는 국내총생산(GDP) 대신 데이터를 활용해 경제 산출량을 측정한 사례도 있다. 버넌 헨더슨, 애덤 스토리가드, 데이비드 웨일 등 미국 브라운대 연구팀은 '우주 공간으로부터의 경제성장 측정'이라는 논문을 통해 개도국의 야간 조명이 경제 산출량을 측정하는 데 도움을 줄 수 있다는 주장을 폈다.


이들은 개도국의 경제활동 대부분이 기록되지 않고 경제 산출량을 측정할 정부기관의 자원이 제한적이라 기존 방식으로 GDP를 측정하는 것은 비효율적이라고 판단했다. 그래서 하루 14회 지구 주위를 도는 미국 공군 위성 사진을 통해 야간 조명을 분석했다. 그 결과 1998년 아시아 금융위기 때 인도네시아의 야간 조명이 급감한 사실을 파악했다. 한국은 1992~2008년 야간 조명이 72% 증가한 것으로 나타났다. 연구진은 "취약한 정부 데이터와 불완전한 야간 조명 데이터를 결합하면 한 가지만 사용할 때보다 나은 추정치가 나온다"고 설명했다.

8월5일 데이터 3법(개인정보보호법·정보통신망법·신용정보법) 시행을 앞두고 우리나라에서도 데이터경제 활성화에 대한 기대감이 무르익고 있다. 한편에서는 데이터의 경제적 가치를 구현해낼 수 있을지 미심쩍어 하는 시선도 있다. 다비도위츠는 책을 통해 "사용할 수 있는 모든 데이터를 활용하고 무엇이 데이터로 간주되는지 광범위한 시각으로 보는 것이 학자와 기업가에게 큰 가치를 지닌다"고 역설했다. 그러면서 "마트의 대기 줄을 찍은 사진도, 우주에서 찍은 사진 등 모든 것이 데이터"라며 "이 새로운 데이터로 사람들의 거짓말(잘못된 예측)을 꿰뚫어 볼 수 있다"고 강조했다.


김흥순 기자 sport@asiae.co.kr
TODAY 주요뉴스 "유서 썼다" 고백한 박하선 "부모님이 모르는 부분 세세하게 적어" "유서 썼다" 고백한 박하선 "부모님이 모르는 ... 마스크영역

<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

간격처리를 위한 class