“구글의 꿈을 가로챌 인문학자 누구인가”
세상의 모든 책을 디지털화하겠다는 구글 북스 라이브러리 프로젝트는 이미 3000만 종의 책을 디지털화했다. 현존하는 책이 1억 3천만 종이니 이미 4분의 1 가까이 진척이 된 셈이다. 이보다 큰 도서관은 전 세계에 단 한 곳, 미의회도서관뿐이다. 아직 놀라기는 이르다. 제일 큰 도서관을 만드는 게 목표는 아니었으니 말이다. 요즘 빅데이터가 유행처럼 번지는데, 이 프로젝트는 빅에 롱을 더한다. 500년이 넘는 동안 책으로 축적된 데이터이기에 공시적인 분석뿐 아닐 통시적인 분석도 가능하다는 말이다.
이런 특징을 한 눈에 보여주는 게 구글 엔그램 뷰어다. 특정한 단어를 넣으면, 수백 년에 걸친 역사에서 언제 이 단어가 등장했는지, 어느 때에 자주 등장하고 어느 때에 사그라졌는지 그래프로 확인할 수 있다. 인류 문명을 들여다볼 새로운 도구가 생긴 셈인데, 이 디지털 렌즈의 시야는 800만 권에 이르고, 초첨을 맞추는 데 걸리는 시간은 순식간이다. 익히 아는 사건이나 지표를 확인하는 건 기본이고, 반대로 엔그램 뷰어 결과를 바탕으로 당시를 추정할 수도 있다. 이 책은 이 프로젝트의 기획, 문제 해결 과정, 이로 인해 벌어진 변화상을 들려주며 지식 세계 전환의 현장을 생동감 넘치게 전한다.
빅데이터 인문학은 남의 이야기가 아니다. 지금 기준으로 보면 낮은 수준이지만, <조선왕조실록>이 데이터로 정리되고 공개되면서 사료 접근이 쉬워져 연구자가 아닌 이들도 실록을 직접 읽으며 작가로 거듭날 수 있었고, 연구자 또한 암기와 필기에 의존하던 검색을 새로운 도구에 맡기며 달라진 속도에 적응했다. 이제 이와는 비교할 수 없을 정도로 전면적인 변화가 시작될 게 분명하다. 도구는 만드는 사람이 아니라 쓰는 사람이 임자다. 이 책의 다음 장을 장식할 빅데이터 인문학자의 출현을 기대한다.
- 인문 MD 박태근 (2015.02.03)