Chinese (Simplified) English Italian Japanese Korean Portuguese Spanish
본문 바로가기
달콤과학/일상 과학

당신은 이 글을 어떻게 해석하시나요?(feat. 빅데이터)

by New Tech 2022. 12. 9.
반응형

 

1996년 개념 미술가 캐런 라이머는 <legendary, lexical, loquacious love>라는 작품을 선보였다.

제목을 해석해보면 전설적, 어휘적, 다변적 사랑으로 알 수 있다. 이 작품은 책처럼 되어 있는데, 직접 보면 왜 번역이 되지 않았는지 이해할 수 있다.

캐런라이머 작품 설명
출처 : 구글

 

1장부터 25장까지

이 작품은 알파벳 순서대로 나열되었다. 1장의 제목은 'A'다 1장의 시작은 이렇다.a a a a a a a a a a a a a / 라이머는 한 로맨스 소설을 분해해서 단어를 알파벳순으로 나열한다. 같은 단어가 나오면 나온 만큼 반복한다. 여기서 a는 부정관사 a다. 이 책의 8장에 H에 'His(그의)'라는 단어는 2페이지 반 나오지만, 'Her(그녀의)'는 무려 8페이지나 나온다. 양으로 보면 여성이 주인공이라 생각하기 쉽다. 하지만 로맨스 소설 특성상 주인공이 자신을 지칭하는 경우보다 상대방을 지칭하는 경우가 더 많아서, 이 책은 남성 주인공의 시각에서 여성과의 사랑을 그린 소설일 가능성이 높다.분해된 단어를 보는 누구나 이러한 추리를 해볼 수 있다. 책의 187페이지에는 Murder, Murdered, Murderers, Murdering, Murderous 등 살인과 관련된 단어가 이어지고, 3장에는 Crime(범죄)이라는 단어도 수차례 등장한다. 로맨스 소설에서 흔히 등장하는 단어들은 아니다. 이 소설에서 살인과 관련된 사건이 등장함을 유추할 수 있다.

반응형

이런 추리는 재미있는 놀이지만, 원작 소설을 읽으면 알 수 있는 걸 굳이 일부러 분해해서 알 필요는 없다. 분해를 하면 소설이 어떤 이야기인지, 연인이 어떻게 만나고 어떤 갈등을 겪는지 알 수 없다. 그럼 라이머는 왜, 무엇을 위해 문장을 분해해 단어를 수집했을까? 아마 원작을 봐서는 절대 알 수 없는 내용들을 분해한 상황에서는 알 수 있다고 판단하고, 그 부분을 관객에게 보여주기 위해 이 작품을 만들었을 것이다.이 책은 총 25장으로 구성되어 있다. 마지막 장 Z의 내용은 'Zealous'하나뿐이다. 영어 알파벳은 총 26개인데 25장이 끝인 것은 'X'로 시작하는 단어가 한 번도 등장하지 않기 때문이다. 우리는 이 작품을 통해 단어의 사용 빈도를 파악할 수 있다. 물론 이 작품은 한 명의 작가가 쓴 한 편의 소설일 뿐이지만, 사회 전반적인 언어 사용과 완전히 동떨어져 있진 않을 것이다. 또한 이 소설이 쓰인 시대의 사회문화적인 상황에 ㅇㅊ추해볼 수 있다. 이 작품에는 'Intelligent(똑똑한)'라는 형용사는 딱 한번 나오지만, 'Beautiful(아름다운)'은 29번 등장한다. 이는 작가 개인의 성향이나 스토리의 특성 때문일 수도 있지만, 사회가 강조하는 여성상을 드러내는 것일 가능성이 높다. 이 사회에서 여성은 주체가 아니라 대상화되는 존재인 것이다. 남자의 성적 취향도 알 수 있는데, 'Breasts(가슴)'는 거의 한 페이지 나오지만, 'Buttocks(엉덩이)'는 딱 한 줄 나온다. 이 작품은 어떤 설명도 하지 않고 단지 단어를 나열했을 뿐이지만, 원작을 읽어서는 알 수 없는 인물과 작품의 이면, 그리고 사회의 이면을 바라볼 수 있게 도와준다.

 

 

빅데이터와의 관계

이 작품의 접근 방식은 빅데이터의 핵심과 정확하게 닿아 있다. 빅데이터 분석의 80%는 데이터를 저장하고 정리하는 것이고, 데이터를 해석하는 것은 마지막 과정일 뿐이지만 위의 작품과 마찬가지로 데이터가 많이 쌓이면 빅데이터가 된다. 이미 빅데이터는 사회 모든 분야에서 사용되고 있다. 당신이 쓴 인스타 피드, 트위터, 카톡, 블로그. 블랙박스 영상, CCTV 등 이런 시시콜콜한 것들이 모여서 그 쓸모를 잡아내는 것이 바로 빅데이터의 핵심이다. 만약 특정 시간 특정 지역에서 데이터가 폭발적으로 늘어난다면, 뉴스 속보가 뜨기 전 그곳에 어떤 사건이 발생했는지도 파악할 수도 있다. 실제로 구글은 한 지역에서 감기와 관련된 검색량이 폭증할 경우, 이를 알려주는 구글 플루 트렌드를 서비스하고 있다. 이 서비스는 미국 질병관리본부보다 평균 1주일 빠르게 독감 확산을 예측한다. 포인트 하나만 잡으면 카톡 데이터 하나만으로도 사용할 곳은 무궁무진하다. 요즘 데이터 연결만 해도 이자를 준다는 금융업체들이 있다. 그들이 노리는 것도 하나다. 고객들의 데이터를 모아서 자기들의 빅데이터를 쌓는데 활용하고 있다는 이야기다. 이것이 빅데이터가 지닌 특징 중한다ㅏ. 빅데이터 이전에는 정해진 목적을 위해 데이터를 모았다. 하지만 빅데이터는 일단 데이터를 모은다. 그 데이터가 이후 어떻게 사용될지 저장되는 당시에는 정확히 알지 못하는 경우가 많다. 그러다 어느 순간 전혀 예상하지 못한 곳에서 뽑혀 올라와 정보가 된다. 물론 끝내 사용되지 않을 수도 있다. 그래서 빅데이터는 쉽기도 하고 어렵기도 하다. 데이터가 쌓인다는 건 단순하지만, 그 데이터를 어디에 적용할 수 있을지에 대해서는 다양한 시도가 필요하다. 

 

 

 

 

반응형

댓글