우리가 맞이하는 아침에도 스마트포 느이 인공지능이 건네는 인사말에 잠이 깨고, 배달 앱에 등록된 새벽 배송으로 도시락을 받으며, SNS에 추천된 기사를 읽거나, 인기 있는 노래를 들으며 하루를 보낸다. 이처럼 우리가 살아가는 모든 것과 우리의 행보 그 자체 모두가 정보가 된다. 이번 시간에는 빅 데이터에 대해 조금 더 자세히 다루어 보겠다.
빅 데이터의 다섯가지 특징
빅 데이터는 이른바 '5V'라는 다섯 가지 특징을 가지고 있다. 규모(Volume)와 다양성(Variety), 속도(Velocity), 함께 가치(Value) 마지막으로 정확성(Veracity)이 거론된다. 일단 규모가 크고, 다양한 유형으로 이루어지며, 데이터를 수집하는 속도도 거의 실시간으로 이루어져야 한다. 또한 데이터가 정확하게 현실을 반영해야 하며, 이용할만한 가치가 있어야 한다. 이러한 빅데이터는 주로 기업들의 비즈니스 모델 구축과 마케팅에 이용되고, 한계를 모르고 진화하는 정보화 사회에서 기업 간 경쟁에서 살아남기 위한 필수 불가결한 요소가 되었다. 빅 데이터를 새로운 유전이라고 부르는 것은 고객들의 정보가 넘쳐흐르고 있기 때문이다. 빅 데이터는 단순히 그 크기가 중요한 것이 아니라 모든 유형의 정보를 이용하는 핵심이 되는 것이다. 대표적인 미국의 기업 아마존은 고객들의 소비 성향 데이터를 모아 분석한 후, 각 고객이 다음번에 구매할 것이라 예상되는 상품의 쿠폰을 발급했다. 그것이 자신이 마침 찾던 유용한 것이라면 스팸 취급을 하지 않고 만족한다. 이렇듯 고객들의 성향을 파악하고 알맞은 서비스를 제공함으로써 만족도를 높이는 전략은 이미 많은 기업에 보편화되어 있다. 이는 비단 상품뿐만 아니라 스웨덴의 음악 스트리밍 서비스 스포티파이의 추천 서비스도 해당이 된다. 우선 사용자가 선호하는 아티스트와 장르, 곡에 대한 정보를 취합하여 그에 부합하는 재생목록을 꾸며 제공한다. 이용자는 일일이 새로운 곡을 검색하고 찾을 필요가 없으며, 자동으로 추천된 곡을 들으며 '좋아요'를 누르고 자신의 재생목록에 추가를 한다. 그리고 스포티파이는 이 데이터를 다시 취합하여 활용한다.
빅 데이터의 이면
빅 데이터라는 개념이 등장한 것은 꽤 오래된 일이다. 그만큼 우리가 하루하루 생활 속에서 발산하는 데이터의 양도 점점 더 막대해지고 있다. 관련 보고서에 따르면 전 세계가 생성하는 데이터의 총량은 2025년에 이르러서는 175제타바이트(1,000조 바이트)에 달할 것이라 한다. 이런 빅 데이터는 그 양이 방대하고 유형이 다양하다는 특징 때문에 신뢰성을 획득할 수 있다. 빅 데이터는 고객의 취향뿐 아니라 시민으로서의 생활양식과 심지어는 개인의 신념까지 파악하게 하는 거대한 눈이다. 우리가 자주 보는 유튜브만 봐도 그렇다.
우리가 몇 개의 스트리밍 서비스만 즐겨보게 되면 어느새 추천 영상은 그와 관련된 영상들로 가득 차게 된다. 그렇다면 대표적으로 신념에 대한 예시를 들어 보겠다. 내가 만약에 좌파 우파의 당에 대한 관심이 많다고 해서 나의 신념과 이념 가치가 좌파에 맞다고 생각한다면, 좌파에 대한 영상들로 나의 추천 영상은 가득 차게 돼있다. 즉, 내가 소비하는 시간과 정보는 계속해서 좌파에 대한 정보들로만 차고 넘치게 되는 것이다. 우리가 소비하는 시간의 양은 정해져 있다. 그 습득(소비) 가능한 시간에 우리는 편향적인 이야기만 들을 확률, 즉 이용자가 듣고 싶고, 보고 싶은 것만 보게 되는 세상이 도래한 것이다. 이러한 기업이나 정부가 사람들의 사소한 정보까지 모으는 것에 불편함을 느끼는 시선도 자연스레 생기게 된다. 길거리 곳곳에는 CCTV가 설치되어 우리의 동선이 기록되고, 병원 진료나, 카드 사용내역까지 일일이 열람할 수 있는 시대다. 기업이 보관하는 우리의 개인정보가 탈취되었다는 소식도 심심치 않게 들려온다. 또한 어디에 가입하거나 어떤 프로그램을 이용하면, 그와 비슷한 광고 문자나 전화가 시도 때도 없이 온다. 그러나 이러한 제공정보 동의가 없이 나의 데이터를 사용하는 것에 대한 적절한 보상은 좀처럼 잘 이루어지지 않는다. 우리는 개인정보를 제공함으로써 상품을 편리하게 구매하고, 또 복지혜택을 받을 수 있지만, 얼굴도 모르는 이들에게 우리의 사적인 기록을 내어주게 된다는 뜻이다. 이러한 빅 데이터의 이면에 대한 논쟁은 앞으로도 계속될 것이라 전망된다. 아울러 빅 데이터의 팽창도 더욱 가속화될 것이 분명하다.
빅 데이터의 미래
이러한 빅데이터는 사용자들의 니즈를 파악하는 유용한 자산이다. 누군가에겐 살이되고, 피가 되지만 다른 누군가에겐 막대한 피해 또한 안겨줄 수가 있다. 세상에 어떠한 정보도 공짜가 없다고 한다. 이를 위해서 이득을 취하는 사람이 있으면, 반대편의 누군가는 손해가 있기 마련이다. 정보의 다양성도 있지만, 제한성도 동시에 존재한다. 하지만 이 제한성 안에 특이성과 편향성이 결합하게 된다면
빅데이터의 정보도 어떤 집단의 의도적인 편집과 편향적인 정보로 실제 정보를 폄훼하기 쉽다는 뜻이다. 예를 들어 증권가의 선전지만 해도 그렇다. 당장 네이버의 종목 토론방을 들어가 보아도 좋다. 그곳에는 원하는 정보도 있겠지만, 그것을 통해 이득을 얻으려는 사람도 존재하기 마련이다. 또한 딥 페이크 기술은 어떤가? 기술의 발달로 영상 또한 쉽게 조작하기 쉽다. 우리가 사는 사회에서는 누군가 잘못을 하면 처벌을 하는 경찰이 존재한다. 하지만 데이터에는 처벌에 대한 규정이 되어있긴 하지만 미비하다. 또한 방대한 양에 의해서 또 다른 데이터들은 잘못된 데이터로 오해를 받을 수도 있다. 앞으로 우리의 데이터는 계속해서 커져나간다. 우리 사회는 사회적 약자를 보호하는 제도가 있다. 하지만 오늘도 사회적 약자는 편향적인 데이터로 손해를 보기도 한다. 이렇게 데이터가 커져가는 미래사회에서의 빅 데이터 정의 구현이 필요한 시점이 점점 필요해지고 있다.
'달콤과학 > 일상 과학' 카테고리의 다른 글
해가 뜨는 한 충전은 필요없는 태양광차 어디까지 왔니? (0) | 2022.12.15 |
---|---|
돈을 세기만 해도 진통 효과가 나타난다? (0) | 2022.12.14 |
경구피임약의 역사 (0) | 2022.12.12 |
죽을 때 까지 돌아갈 수 없다? 히스테리시스 현상과 히스테리시스 곡선 (0) | 2022.12.11 |
과학의 전문 용어에 유독 멋진 용어가 많은 이유는? (0) | 2022.12.10 |
댓글