구글을 비롯한 공동연구팀이 지난 500여년간 전세계에서 발행된 도서 520만권을 데이터베이스(DB)화하는데 성공, 언어학과 인문학 연구에 새 지평을 열었다.
구글과 하버드대, 매사추세츠공대(MIT), 브리태니커백과사전 등이 참여한 연구팀은 지난 1500년부터 2008년까지 전세계에서 출간된 도서 520만권을 디지털화해 DB로 만들어냈다.
영어뿐 아니라 불어, 스페인어, 독어, 중국어, 러시아어 등이 포함됐고 단어 수만 5천억개에 달한다.
4년간에 걸친 이들의 연구성과는 `컬처러믹스(Culturomics)`로 명명됐으며, 17일 저널 사이언스에 실렸다.
온라인에서 이용할 수 있는 이 DB는 한 단어가 시대의 변화에 따라 얼마나 자주 사용됐는지를 그래프와 함께 알려준다.
예를 들어 `여성들(WOMEN)`이라는 단어를 `남성들(MEN)`이라는 단어와 비교하면 `여성들`은 페미니즘을 주장하는 목소리가 커지기 시작했던 1970년대 초까지는 거의 사용되지 않다가 이후 급격히 늘어 1986년엔 사용빈도가 `남성들`을 넘어섰음을 알 수 있다.
마찬가지로 미키 마우스와 마릴린 먼로라는 단어는 지미 카터라는 단어보다 사용빈도가 크게 못 미쳤다는 점도 나타난다.
연구팀에 참가한 하버드대학의 에레즈 리버먼 에이든 연구원은 "목표는 8살짜리 어린이가 서적의 기록을 통해 역사 속의 문화적 트렌드를 열람할 수 있게 해주는 것이었다"고 설명했다.
NYT는 이번 성과에 대해 양적인 분석을 회피해왔던 문학이나 역사, 여타 인문학 분야의 교수들에게 풍부한 연구의 기회를 제공해주는 것이라고 의미를 부여했다.
<연합뉴스>