[아시아경제 권해영 기자] '뉴스페이퍼(newspaper·신문)'라는 단어는 책 속에서 얼마나 많이 등장할까? 이제 구글을 이용하면 그 답을 쉽게 찾을 수 있을 것 같다.


16일(현지시간) 뉴욕타임스(NYT)에 따르면 구글이 디지털북 520만권에서 단어와 짧은 구문을 발췌, 각각의 연간 사용 빈도수를 데이터베이스화해 관련 정보를 제공한다. 이 서비스를 이용하면 특정 단어가 책 속에서 얼마나 자주 사용되는 지를 알 수 있다. 무료로 다운로드받거나 온라인 검색을 통해 자료 활용이 가능하다.

신문에 따르면 구글은 1500~2008년 동안 영어·프랑스어·독일어·중국어·러시아어로 출간된 책을 분석해 5000억개의 단어를 데이터베이스화한 상태다.


예를 들어 'woman(여성)'이라는 단어를 입력하면 페미니즘이 도입되기 직전인 1970년대 초까지는 'man(남성)'이라는 단어와 비교해 거의 쓰이지 않았다는 사실을 알 수 있다. 구글 데이터베이스에 따르면 'woman'은 여권이 신장된 1986년이 돼서야 널리 쓰이기 시작했다.

'미키마우스'와 '마릴린 먼로'를 넣으면 '지미 카터'와 비교해 책 속에 등장하는 빈도수가 덜하다는 것을 알 수 있다. 1989년 천안문 사건 이후 '천안문 광장'이 중국어보다는 영어로 더 많이 언급됐다는 사실도 드러난다.

AD

신문은 단어 사용 빈도 수를 알려주는 구글 서비스를 통해 그 시대의 사회상을 읽을 수 있고 인문학 연구 및 교육에도 새로운 지평이 열릴 것이라고 평가했다.


한편 구글은 향후 디지털 도서관을 설립, 지금까지 출판된 모든 책을 데이터베이스화하고 인문학 연구 발전에 기여한다는 계획이다. 구글은 지금까지 출판된 모든 책의 11% 이상을 스캔했으며 여기에는 총 20조개의 단어가 들어가 있다.


권해영 기자 roguehy@

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 보면 좋은 기사

새로보기

내 안의 인사이트 깨우기

취향저격 맞춤뉴스

많이 본 뉴스

당신을 위한 추천 콘텐츠

놓칠 수 없는 이슈