본문 바로가기
Dim영역

[Book]대박, 통계의 장난?...'벌거벗은 통계학'

스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

언론, 정치권 신뢰 높이려 단골 인용..잘못된 표본은 여론 조작 악용되기도

[아시아경제 조민서 기자]#정치인A "우리나라 경제가 심각하게 추락하고 있습니다. 지난해 30개 지역에서 소득이 줄었습니다."

#정치인B "우리나라 경제가 주목할 만한 성장을 보여주고 있습니다. 지난해 국민 가운데 70%가 소득이 늘어났습니다."
대중주의자인 정치인 A, 그리고 엘리트주의자인 정치인 B. 과연 누구의 말이 맞을까. 힌트는 각 지역마다 거주자들의 수가 같지 않다는 것이다. 이 두 사람의 주장은 얼핏 보기에 모순돼 보인다. 하지만 자세히 보면 한 정치인은 분석 단위로 '지역'을, 다른 정치인은 '국민'을 사용했음을 알 수 있다. 분석 단위란 통계에서 비교되거나 묘사되는 대상이다. 두 정치가의 발언에서 추론할 수 있는 것은 대도시 등 규모가 큰 지역은 경제 상태가 건전한 반면, 평균 임금이 하락한 주는 규모가 작은 지역일 것이라는 점이다. 각 지역의 크기가 제각각이라는 점을 감안하면 대다수 국민들의 상황은 좋아졌고, 대부분 지역의 상황은 나빠졌다는 추론도 충분히 가능하다.

우리는 숫자라면 무조건 믿고 보는 경향이 있다. 정치인들이 각종 연설에서 수치화된 지표를 자주 인용하는 것도 대중에게 신뢰를 주기 위해서다. 하지만 엄밀히 말해 숫자와 통계는 다르다. 숫자를 바탕으로 하는 수학은 정확하지만, 이 숫자를 해석하는 통계의 활용은 정확하지 않다. 이로 인해 진실이 가려질 가능성도 있다. 마크 트웨인도 다음과 같은 명언을 남겼다. '거짓말에는 세 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계.'

신간 '벌거벗은 통계학'은 독자들이 복잡한 수식을 몰라도 통계에 대한 직관력을 키울 수 있도록 다양한 주제를 쉽게 풀어내주고 있다. 전작 '벌거벗은 경제학'으로 이름을 알린 찰스 윌런 미국 다트머스 대학 경제학과 교수가 썼다. 찰스 윌런 교수는 '오바마의 경제교사'로 알려져 있는 오스탄 굴스비 백악관 경제자문위원회 의장이 "통계학을 가장 재미있게 설명하는 학자"라고 평가한 학자이다. 저자는 "통계는 고성능 무기와 같아서 올바로 이용되면 유익하지만, 잘못 쓰이면 치명적인 재앙을 불러올 수 있다"고 말한다.
통계는 이미 우리생활과 밀접한 관계를 맺고 있다. 대학 학점, 회사에서의 성과, 보험료 계산 등에서부터 대선 전에 실시하는 여론조사나 식료품의 세균 검사에도 활용된다. 평균, 중앙값, 표준편차 등의 통계의 기본개념은 대학수학능력시험의 성적표만 받아보더라도 확실하게 알 수 있다. 학생들은 자신의 성적이 몇 점인지, 평균치에서는 얼마나 떨어져있는지, 어떤 과목의 실력이 부족한지 등을 분석하면서 대학입시 전략(?)을 짠다. 또 제대로 추출된 표본집단의 평균값은 모집단의 평균값과 거의 일치한다는 개념의 중심극한정리나, 분석대상의 데이터를 교란시키는 변수들을 제외시켜 진짜 원인을 찾아낼 수 있는 회귀분석도 흔히 사용되는 통계다.

하지만 찰스 윌런은 "수많은 양의 정보가 겉으로 보기에는 서로 관련이 있어 보이더라도 우연히 생긴 연관성만으로 쉽게 판단하는 것을 주의해야 한다"고 강조한다. 언론이나 각종 광고에서 내놓는 자료들을 의심하는 것에서부터 출발해보자. 미국 영화정보 사이트 무비웹에서는 2011년 기준으로 미국에서 지금까지 가장 매출을 많이 올린 영화 다섯편으로 '아바타', '타이타닉', '다크 나이트', '스타워즈 에피소드4', '슈렉2' 등을 선정했다. 하지만 이 영화들이 흥행에 성공한 것은 맞지만 왠지 수상쩍은 느낌을 지울 수 없다. 과연 '슈렉2'가 역대 5위 흥행작 안에 꼽힐 만한 작품일까.

비밀은 쉽게 밝혀졌다. "할리우드 영화사들이 서로 다른 시점의 금액들을 비교할 때 인플레이션으로 인한 왜곡을 가장 터무니없이, 그것도 의도적으로 무시"했기 때문이다. 최근 영화들이 더 성공한 것처럼 보이는 이유는 티켓 가격이 예전에 비해 그만큼 비싸졌기 때문이다. 때문에 영화표 매출액을 인플레이션을 감안해 조정해야만 더 정확한 결과를 도출해낼 수 있다. 이렇게 하면 영화 흥행 순위는 '바람과 함께 사라지다', '스타워즈 에피소드4', '사운드 오브 뮤직', 'E.T.', '십계' 등의 순으로 바뀌게 된다. 통계는 몇 개의 숫자만으로 정보를 쉽게 전달할 수도 있지만, 그만큼 쉽게 조작도 가능한 것이다.

주의해야 할 점은 정확한 통계를 얻으려면 제대로 된 데이터를 활용해야 한다는 것이다. 지난 대선이 끝나고 인터넷에서는 "내 주변에서는 아무도 여당을 찍지 않았는데 어떻게 된 일인지 모르겠다"며 의아해하는 일부 유권자들의 글을 심심찮게 볼 수 있었다. 이는 엉터리 표본(진보 성향의 친구들)을 가지고 모집단(전체 유권자들)에 대해 잘못된 결론을 내렸기 때문이다. "표본이 좋을 때는 표본 크기가 클수록 오차 범위가 줄기 때문에 설문조사도 좋아진다. 반면 표본이 쓰레기 같을 때는 표본 크기가 클수록 결과적으로 쓰레기 더미만 거대해지고 악취도 고약해질 뿐이다."

메이저리그 역대 최고의 야구선수는 누구일까, 왜 항상 우리 가족의 소득은 뉴스에 발표하는 중산층의 평균치보다 낮을까, 2012년 대선에서 오바마가 승리할 것이라고 어떻게 예측할 수 있었을까 등 저자는 누구나 품었던 궁금증을 각종 통계를 곁들여 분석해 독자들에게 '수학적 통찰력'을 제공해준다. 이 책 한권으로 통계학을 꿰뚫지는 못하더라도 적어도 광고나 마케팅의 홍보문구, 뉴스나 신문의 여론조사의 눈속임에서는 벗어날 수 있을 것이다. 스웨덴의 수학자 안드레예스 등켈스는 말했다. "통계로 거짓말하기는 쉬워도, 통계 없이 진실을 말하기는 어렵다."

(벌거벗은 통계학 / 찰스 윌런 / 김명철 옮김 / 책읽는수요일 / 1만8000원)




조민서 기자 summer@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • [포토] 오동운 후보 인사청문회... 수사·증여 논란 등 쟁점 오늘 오동운 공수처장 후보 인사청문회…'아빠·남편 찬스' '변호전력' 공격받을 듯 우원식, 22대 전반기 국회의장 후보 당선…추미애 탈락 이변

    #국내이슈

  • 골반 붙은 채 태어난 샴쌍둥이…"3년 만에 앉고 조금씩 설 수도" "학대와 성희롱 있었다"…왕관반납 미인대회 우승자 어머니 폭로 "1000엔 짜리 라멘 누가 먹겠냐"…'사중고' 버티는 일본 라멘집

    #해외이슈

  • '시스루 옷 입고 공식석상' 김주애 패션…"北여성들 충격받을 것" 이창수 신임 서울중앙지검장, 김 여사 수사 "법과 원칙 따라 제대로 진행" 햄버거에 비닐장갑…프랜차이즈 업체, 증거 회수한 뒤 ‘모르쇠’

    #포토PICK

  • 車수출, 절반이 미국행인데…韓 적자탈출 타깃될까 [르포]AWS 손잡은 현대차, 자율주행 시뮬레이션도 클라우드로 "역대 가장 강한 S클래스"…AMG S63E 퍼포먼스 국내 출시

    #CAR라이프

  • [뉴스속 용어]한-캄보디아 정상 '전략적 동반자 관계' 수립 세계랭킹 2위 매킬로이 "결혼 생활 파탄이 났다" [뉴스속 용어]머스크, 엑스 검열에 대해 '체리 피킹'

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼