구글이 지난 500여 년 동안 전 세계에서 발행된 도서 520만권을 데이터베이스(DB)화하는 작업을 완료했다. 이에 따라 언어학ㆍ인문학ㆍ사회과학 분야의 체계적 연구에 큰 도움을 줄 수 있게 됐다.
이번 DB화 작업에는 구글 주도로 하버드대, 매사추세츠공대(MIT), 브리태니커백과사전 등이 참여했다.
작업 대상은 서기 1500년부터 2008년까지 출간된 도서들이다. 영어뿐 아니라 프랑스어ㆍ스페인어ㆍ독일어ㆍ중국어ㆍ러시아어 등으로 된 도서도 포함됐다. 단어 수로는 5억개에 이른다.
뉴욕타임스(NYT)는 "문학이나 역사, 인문학 분야의 연구자들이 양적 분석 등 보다 풍부한 연구 기회를 가질 수 있게 됐다"고 평가했다.
구글은 지난 4년 동안의 작업으로 완성된 이번 DB를 `컬처로믹스`(Culturomics)로 이름 지었다. 온라인에서 이용할 수 있는 이 DB는 한 단어가 시대 변화에 따라 얼마나 자주 사용됐는지를 그래프와 함께 보여준다.
예컨대 `여성들`(WOMEN)이라는 단어를 `남성들`(MEN)이라는 단어와 비교하면 `여성들`은 페미니즘을 주장하는 목소리가 커지기 시작했던 1970년대 초까지는 거의 사용되지 않다가 이후 급격히 늘어 1986년엔 사용 빈도가 `남성들`을 넘어섰음을 알 수 있다.
직업별 분석도 가능하다. 정치인은 보통 50세가 넘어야 대중적 인기를 얻었고 작가는 40대, 배우는 30세 전후가 전성기였다.
[매일경제 정욱 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
국제 많이 본 뉴스
-
1
공중화장실 휴지에 '이 자국'있다면...“절대 사용하지 마세요”
-
2
“인도서 또”… 女 관광객 집단 성폭행, 동행한 남성은 익사
-
3
필리핀, 두테르테 대통령 체포…ICC 체포영장 집행
-
4
“하늘을 나는 선박 곧 나온다”…씨글라이더, 1차 테스트 완료 [숏폼]
-
5
아이폰17 프로 맥스, 기존보다 더 두꺼워진다… “배터리 때문”
-
6
중국 동물원의 '뚱보 흑표범' 논란? [숏폼]
-
7
가스관 통해 우크라 급습하는 러 특수부대 [숏폼]
-
8
정신 못 차린 '소녀상 조롱' 美 유튜버… 재판서 “한국은 미국 속국” 망언
-
9
애플, 스마트홈 허브 출시 미룬다… “시리 개편 지연”
-
10
“체중에 짓눌려 온몸에 멍이” … 튀르키예 정부도 경고한 '먹방'
브랜드 뉴스룸
×