본문 바로가기
bar_progress

글자크기 설정

닫기

'클릭 한번으로 800만권을 본다"‥구글神과 인문학의 만남

시계아이콘읽는 시간1분 39초

에레즈 에이든 외 '빅데이터의 인문학: 진격의 서막'

[아시아경제 이규성 기자]

'클릭 한번으로 800만권을 본다"‥구글神과 인문학의 만남 빅데이터 인문학
AD

'구글신(神)은 알고 있다?'. 19세기 말 니체가 '신(神, god)는 죽었다'고 말했다. 정말 신이 죽었는지, 살았는지 구글 엔그림 뷰어를 통하면 금방 알 수 있다. 19세기 초 1000단어 중 1회로 언급되던 '신'은 19세기 말 절반으로 줄더니 1973년 기점으로 급기야 '데이터'라는 용어보다 적은 횟수를 기록했다. 따라서 '신'은 간신히 연명하고 있으며 데이터보다 덜 중요할 만큼 과거보다 힘이 현저하게 약해졌다.


이미 여러 선거과정을 살펴보면 구글 검색 통계가 당선 여부 등 결과를 정확히 예측하고 있다. 구글이 득표율 등을 예측한다는 것은 특정 키워드에 대한 구글 검색량, 즉 대중의 관심도가 유의미한 지표로 나타나기 때문이다. 오늘날 우리의 일거수 일투족은 디지털 기록으로 남는다. 각종 인터넷 검색, 이메일, 문자 메시지, 페이스북 등 SNS 상의 대화, '좋아요' 심지어는 교통카드, 신용카드 내역 등 수많은 디지털 지문과 발자욱을 남긴다.

디지털 세계는 각 개인들의 행적 뿐만 아니라 그림과 지도, 옛 문헌, 수많은 지식과 정보, 유물, 유적 등이 속속 축적되고 있다. 현재 인류의 문화 생산물을 공유할 수 있게 하는 '구텐베르크 프로젝트', 유럽 48개 공공도서관을 통합한 '유러피언 라이브러리', '위키피디아'에 이르기까지 한곳으로 모여드는 '꿈의 세계 보편 도서관'이 만들어 졌다. 바로 2004년 구글은 전 세계 책들을 디지털화하는 '구글 북스 라이브러리' 프로젝트를 선언, 3000만권 이상의 책을 디지털화했다. 2011년 추산 전 세계의 책이 1억3000만권이라는 걸 감안하면 엄청난 량이다. 이에 엄청난 디지털 기록을 빅데이터로 읽어야하는 시대가 왔다. '빅데이터 인문학: 진격의 서막'은 빅데이터라는 새 환경에서 인문학이 처한 혁명적 변화를 보여주는 책이다.


2007년 이 책의 저자이기도 한 하버드의 젊은 과학자 에레즈 에이든과 장바티스트 미셸은 구글이 구축한 '구글 북스 라이브러리'인 '디지털 바벨의 도서관'에 들어가 클릭 한번으로 800만권의 책을 검색하는 '구글 엔그램 뷰어'를 개발했다. 검색창에 단어 하나를 입력하면 데이터가 아름다운 곡선을 그려주는 프로그램이다. 구글 엔그램 뷰어는 해당 단어가 지난 200년간 책에서 사용된 빈도의 추이를 그래프로 보여준다.

이 책은 엔그램 뷰어라는 디지털 렌즈를 통해 사람들이 어떻게 유명해지고 정부가 어떻게 사상을 억압하는지 등등 다양한 연구 결과물을 보여준다. 한 데이터를 보자. 지난 200년간 가장 명성을 누릴 인물은 누구일까 ? 엔그림 데이터가 내놓은 인물은 '히틀러'다. 이어 스탈린, 무솔리니 등 대량 학살자 3명이 2위와 5위를 차지한다. 즉 살인과 명성은 비례하며 명성을 얻는 방법 중 하나가 사악한 행동에 달려있음을 알려준다.


엔그램 독일어 검색에서는 1936∼1943년새 '마르크 샤갈'이라는 이름은 딱 한 번 등장한다. 나치가 '퇴폐 예술품'이라고 억압했던 유대인 초현실주의이자 표현주의자였던 '마르크 샤갈'을 대표적인 단속 대상으로 삼아 철저히 은폐하고, 인멸한 결과다. 히틀러와 나치는 현대미술의 여러 사조를 '퇴폐 미술'이라고 낙인찍어 수천 점을 압수, 폐기하고 사회적 조롱거리로 삼았다. 샤갈의 작품은 독일과 독일문화에서 철저히 배제됐다. 이같은 억압과 검열, 통제, 감시가 샤갈이라는 이름조차 나타나지 못 하게 했다. 시대가 침묵하면 빅데이터도 침묵했다는 건 자명하다.


억압의 잔혹한 역사는 중국의 톈안먼(천안문)에서도 그대로 드러난다. 톈안먼은 중국 현대사에서 1976년 1차 톈안먼 사태와 1989년 2차 톈안먼 사태 등 두번의 역사 무대로 떠오른다. 전자는 저우언라이 총리 사망, 후자는 후야오방 총서기 사망으로 애도 물결이 모여들자 중국정부는 군대를 동원, 총칼로 막았다. 그리고 억압과 검열을 펼처 수많은 신문사, 출판사를 없애고, 정부 입장에 반하는 내용을 지웠다. 하지만 엔그램에 나타난 거대한 지문은 지우지 못 했다. 엔그램 그래프상의 중국어 간체자 검색 결과는 1976년 뾰족하고 큰 봉우리로 나타난다. 그러다 1989년 반짝 빈도가 증가하지만 그 이후로는 정상으로 돌아갔다. 이와 관련, 저자들은 "중국이 수행하고 있는 검열의 잔혹한 증거"라고 설명한다. 이어 "빅데이터 혁명은 우리 사회의 본질을 더 효율적으로 탐색할 수 있는 관찰도구를 창조하고 인문학을 바꾸고 사회과학을 변형시키고 상업세계와 상아탑 사이의 관계를 재조정해 나갈 것"이라고 강조한다.<에레즈 에이든·장바티스트 미셸 지음/김재중 옮김/사계절 출간/값 2만2000원>




이규성 기자 peace@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

위로가기