한은 '뉴스심리지수' 발표…머신러닝으로 뉴스문장 분석
[아시아경제 김은별 기자] 한국은행이 경제뉴스 보도에 사용된 문장을 분석, 지수화한 '뉴스심리지수(NSI)'를 다음주부터 시험 공개한다. 코로나19 경제위기를 겪으면서 빠른 속도로 발표되는 경제지표가 필요하다는 판단에 따른 것이다.
1일 한은은 "다음주부터 한은 경제통계시스템(ECOS)에 NSI를 심헝 공개하고, 통계청의 시범통계 제도가 마련되면 승인절차를 진행할 계획"이라고 밝혔다. 시험공개 기간동안은 NSI가 발표된 후 경제뉴스에 실리면서 다시 지수가 영향을 받는 피드백 현상의 존재를 검토할 계획이다. NSI는 매주 한 번씩 공개될 예정이다.
NSI는 경제뉴스 데이터를 문장 단위로 긍정·부정·중립 감성으로 분류하고 이 문장의 차이를 지수화한 결과다. 지수가 100을 웃돌면 긍정문장이, 100 미만이면 부정문장이 더 많음을 의미한다. 발표되는 일별 지수는 직전 7일간의 뉴스기사를 이용해 작성된다. 분석된 뉴스기사는 2005년 이후 기사를 대상으로 하며, 최근의 경우 약 50개 언론사의 기사를 포함시켰다.
특히 NSI는 통상 뉴스 제목만 분석해 발표하는 심리지수와 달리, 문장을 무작위로 추측해 그 문장에 담긴 뜻을 머신러닝으로 분석한다는 것이 특성이다. 예를 들어 '정부는 내수 회복에 대해 비관적이다'라는 문장이라면 부정적으로 분류하고, '정부는 국내총생산(GDP) 예상치를 2.1%로 잡았다'는 문장은 중립 등으로 분류하는 것이다. 사람이 먼저 문장의 특성을 분류시켜두고, 이후 기계가 학습 능력을 갖고 스스로 문장을 판단해 지수를 만들게 된다.
NSI는 주요 경제심리지표 및 실물경제지표에 1~2개월 선행하며, 높은 상관관계를 보였다고 한은은 설명했다. 월별 뉴스심리지수는 소비자심리지수(CCSI) 및 주요 CSI 항목과 0.7 이상의 상관계수, 기업경기실사지수(BSI)와도 높은 상관관계를 나타냈다. 선행종합지수엔 1개월 선행하며 0.67의 상관관계를 보였고, 국내총생산(GDP) 성장률(실질 계절조정계열 전기대비 증가율)과는 0.60의 상관관계를 보였다.
꼭 봐야 할 주요 뉴스
텀블러에 담아 입 대고 마셨는데…24시간 지난 후...
박양수 한은 경제통계국장은 "코로나19 상황을 거치면서 속보성있는 데이터가 필요하다는 지적이 많이 나왔다"며 "경기 상황이 빠르게 변화하는 만큼 빨리 발표되는 데이터로 경제정책 대응을 할 필요가 있기 때문"이라고 말했다. 이어 "한은은 빅데이터를 활용해 카드소비나 바코드 인식 등을 분석하는 작업도 진행 중"이라고 덧붙였다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>