우리의 선택은 과연 우리의 의지에 의한 것인가?
우리는 개인 정보 자체를 돈을 주고 구매하는 방식으로 모든 미국인에 대한 개인 정보를 수집했다. 가능한 모든 업체로부터 미국인들의 재정 상태, 어디에서 물건을 사는지, 얼마를 주고 사는지, 휴가를 어디로 떠나는지, 어떤 것을 읽었는지에 관한 데이터를 사들였다. 우리는 이런 데이터를 그들의 정치적 정보와 맞춰보았다.
위 구절은 이 책의 도입부에 등장하는 미국 대선을 앞두고 선거팀에서 수집된 개인정보를 그들의 선거활동에 활용한 사례입니다. 2016년 트럼프의 대선 승리의 배후로 지목된 영국 데이터 분석 기업 ‘케임브리지 애널리티카(Cambridge Analytica)에서 사업개발 이사로 일했던 저자는 내부고발자로서 개인정보가 어떻게 우리의 판단과 선택을 좌지우지하는지를 폭로하고 있습니다.
현재 저자는"OwnYourData’ 운동의 창시자로 개인의 데이터 권리가 기본 인권이라는 근본적인 믿음을 가지고 개인의 디지털 자산 권리 보호를 위한 법률 개혁 운동을 하고 있는데요, 그가 폭로하는 수집한 개인정보를 활용한 구글과 페이스북의 빅브라더와도 같은 행태는 매우 충격적입니다.
나도 몰래 새나간 개인정보, 선거활동에 활용되다
페이스북 한 곳에서만 우리는 사용자들에 대한 570여 개의 데이터 포인트를 얻어냈다. 그리고 이런 정보를 종합해 우리는 약 2억 4000만 명에 달하는 18세 이상의 모든 미국인에 관한 5000개가량의 데이터 포인트를 보유하게 되었다. ... ‘섹스 나침반Sex Compass’이라는 재미있는 성격 퀴즈를 개발했다. 침대에서 좋아하는 자세 등 성적인 선호도를 파악하는 질문을 통해 개인의 성적 특성을 확인하는 테스트였다. 설문 조사는 단순히 재미있자고 만든 것이 아니었다. 내가 이해하기로 이 설문조사는 데이터 포인트를 수집하기 위한 위장 수단이었다. 응답자가 심리 테스트에 참여하기 위해서는 자신의 개인 정보를 활용하는 데 동의해야 했기 때문이다.
사람들이 페이스북의 ‘캔디 크러시Candy Crush’ 같은 게임을 하려고 접속해 서드파티 앱에 대한 서비스 이용약관에 ‘네’라고 답할 경우, 의도하지 않게 앱 개발자 및 앱 개발자가 정보를 공유하겠다고 하는 모든 사람에게 자신과 친구들의 데이터를 몽땅 무료로 제공하는 것에 동의하게 된다. 페이스북은 모든 곳에서 데이터 법률을 위반하는 악명 높은 그래프 APIGraphs API를 통해 이런 식의 접근이 가능하도록 만들었다.
저자는 우리가 게임을 즐기기 위해 무심고 누르고 넘어가는 서비스 이용약관에서 “쿠키를 허용해야 합니다”라고 요구할 때 그게 정확히 어떤 것에 대한 허용을 의미하는지 궁금해하지 않는 다는점을 강조합니다. 이 쿠키는 사람들이 날마다 일상적으로 수용하는, 사회적으로 받아들일 수 있는 수준의 스파이웨어로 친절한 언어로 포장돼 있지만 컴퓨터나 휴대전화로 당신이 하는 모든 것을 추적하고 있다고 경고합니다.
얼마나 많은 회사들이 당신의 온라인 활동을 추적하는지 알고 싶으면 아래 플러그인을 설치 혹은 사이트에 방문하여 현재 얼마나 나의 개인정보가 유출되고 있는지를 확인할 수 있습니다.
https://addons.mozilla.org/en-US/firefox/addon/lightbeam-3-0/
Lightbeam 3.0 – Get this Extension for 🦊 Firefox (en-US)
Download Lightbeam 3.0 for Firefox. Lightbeam is a browser extension that uses interactive visualizations to show you the relationships between third parties and the sites you visit.
addons.mozilla.org
수집된 개인정보를 통해 파악된 개인 성향의 정확도는 무려 95%
케임브리지 애널리티카는 ‘섹스 나침반’과 ‘음악을 좋아하는 바다코끼리’ 같은 외부 개발자들이 만든 재미있는 심리 테스트 앱을 통해 수집한 페이스북 사용자 데이터를 가져와 개인의 오션OCEAN 점수(행동심리학과 사회심리학에서 발전시킨 것으로, 개인이 어느 정도로 개방적open이고, 성실하고conscientious, 외향적이고extroverted, 남의 의견을 수용하고agreeable, 신경과민적neurotic 성향이 있는지를 측정한 점수)를 매겼는데 케임브리지 애널리티카는 이 점수를 활용해 사람들을 성격 유형에 따라 분류했다고 저자는 말합니다.
이 분류에 그들은 사용자가 이미 관심을 보인 문제들(페이스북의 ‘좋아요’처럼)을 추가해 보완하는 방식으로 각각의 개별 집단을 훨씬 더 세밀하게 분류했다. 그렇게 분류된 대상에게 케임브리지 애널리티카는 그들에게 적합한 최적의 선거 홍보메시지를 보낼 수 있게 되었고 이는 트럼프의 대선 승리의 중요한 요인이 되었음을 폭로합니다.
게다가 그들은 모든 미국인에게 점수를 매겨 개개인이 투표할 확률이나, 특정 정당에 속할 가능성 등의 예측점수를 0점에서 100점 사이로 매길 수 있었으며 심지어는 좋아하는 색깔/정당에 따라 어느 편이 기부할 가능성이 높은지, 환경 정책과 총기 소유권 가운데 어느 것을 더 듣고 싶어 할 가능성이 높은지도 95%의 정확도로 예측할 수 있었다고 하니 놀라지 않을 수 없는 정교함이네요. 이렇게 수집되고 분석된 정보에 의해 케임브리지 애널리티카는 동영상, 오디오, 인쇄 광고에 이르는 모든 콘텐츠를 개인의 성향에 맞춰 제작 전달되어 선거운동에 사용되었습니다. 유권자의 집을 방문하거나 전화를 걸 때 이렇게 정교하게 분석된 유권자의 데이터에 직접 접근할 수 있도록 했다니 정말 놀라울 따름입니다.
2015년 페이스북이 4월 30일부터는 서드파티 앱 개발자들에게 더이상 사용자 데이터를 공유하지 않을 것이라고 발표했을 때, 앞으로는 케임브리지 애널리티카가 데이터를 수집하기가 더 어려워질 것으로 예상했다. 하지만 테일러 박사는 페이스북이 데이터 거래가 불가능하다고 말한 날짜에서 일주일이 지난 2015년 5월 6일에 페이스북으로부터 마지막 데이터를 구매했다. 나는 이상하다고 생각했다. 그래프 API가 이미 폐쇄됐다면 우리는 데이터를 어떻게 얻었을까?
9ㆍ11 테러 공격의 여파로 미국은 경찰국가로 변했고, 시민의 자유가 점점 더 침해당하기 시작했다. 2001년 10월 26일에 애국자법Patriot Act이 별다른 저항 없이 통과됐고, 이로 인해 정부는 동의 없이 국민들에 관한 모든 데이터를 수집할 권리를 갖게 되었다. (2001년 정부 권력을 확대한 이 법이 역설적으로 2010년대에 빅 데이터에 대한 무한 경쟁 시대를 열었다.)
구글에 노출된 검색 결과 통제
구글의 공화당 팀은 사용자들이 구글을 검색했을 때 처음 노출되는 결과를 통제하기 위해 많은 광고비를 지출했다. 사용자들의 ‘첫인상’을 통제하기 위한 전략이었다. 구글 키워드 구매 전략은 효과가 놀라웠다. 사용자가 ‘트럼프’ ‘이라크’ ‘전쟁’을 검색하면 첫 번째 검색 결과에 “거짓말쟁이 힐러리 이라크 전쟁에 찬성 투표, 잘못된 판단”이라는 배너가 있는 슈퍼 팩 링크와 함께 “힐러리 이라크 전쟁에 찬성 투표, 도널드 트럼프는 반대”가 나타났다. 사용자가 ‘힐러리’와 ‘거래’라는 검색어를 입력하면 ‘사기꾼 힐러리lying-crookedhillary.com’ 웹사이트가 최상단에 노출됐다. 우리가 유도한 검색 결과를 클릭해 열어보는 비율도 놀라울 정도로 높았다. 구글은 매일 트럼프 선거 캠프에 키워드 목록을 판매했고 인기 있는 유튜브 채널에 언제 새로운 독점 광고를 게재할 수 있는지 알려주었다. 구글은 트럼프 선거 캠프에 검색어 활용 시스템을 팔아 새로 유입된 지지자들이 무더기로 투표에 나서는 데 톡톡히 기여했다.
스탠퍼드 대학 교수인 미할 코신스키는 사용자 개인이 누른 ‘좋아요’ 68개만 있어도 사람들에 관한 구체적인 정보를 유추할 수 있다고 주장했으며 이런 ‘좋아요’를 가지고 피부색, 성적 취향, 정치 성향, 마약과 술, 개인이 온전한 가정 출신인지 이혼한 가정 출신인지를 예측할 수 있다고 말했습니다. 특히 70개의 ‘좋아요’는 그 사람의 친구들이 알고 있는 것보다 더 많은 것을, 150개의 ‘좋아요’는 부모보다 더 많은 것을, 그리고 300개의 ‘좋아요’는 배우자보다 더 많은 것을 파악할 수 있다고 한 그의 주장은 이제는 꽤나 유명한 발언으로 알려져 있습니다.
문제의 핵심은 빅 데이터다.
저자는 케임브리지 애널리티카 같은 기업들이 수십억 명의 데이터를 수집할 수 있도록 허용한 페이스북이 가장 1차적인 문제이며, 어떻게 돈을 지불하는 모든 기업에게 무차별적으로 데이터를 판매했는지, 데이터를 구매한 기업들이 사용 목적과 방법을 밝히지 않고 이를 어떻게 활용했는지 또한 문제임을 주장합니다. 이 모든 활동들은 우리와 정부가 모르는 사이에 계속 진행되고 있기에 데이터 사용을 통제하는 몇 가지 법도 강제성이 없고 개인과 기업들이 법을 준수하는지 확인하는 데 필요한 추적 기술과 투명성을 담보하는 기술도 없음을 지적합니다.
우리는 평화를 원해야만 한다. 우리 자신의 행동과 다양한 물질적 방식으로 대가를 치를 정도로 평화를 원해야 한다. 우리는 무기력을 극복하고 우리만큼 평화를 원하는 다른 국가의 모든 사람들을 찾아 나설 정도로 평화를 갈망해야 한다. _ 엘리너 루스벨트 (Eleanor Roosevelt, 전 유엔인권이사회 의장)
빅 데이터, 트럼프, 페이스북은 우리의 민주주의를 무너트렸다라는 저자의 충격적인 고백은 읽는 내내 한편의 스릴러를 읽는/보는 기분이었습니다. 이 책을 읽고 나서 제가 행한 가장 첫번째 행동은 페이스북을 삭제하는 것이었습니다. 물론 얼마 가지 않아 (열람용 계정으로) 재설치를 하긴 했지만요. 아무튼 개인의 우리가 무심코 사용하는 SNS나 검색 서비스를 통해 내가 얼마나 타인에게 정확히 파악되고 그에 설득, 아니 유도당할 수 있는지 경각심을 준 책이었습니다.
'책 > IT과학' 카테고리의 다른 글
펜데믹과 엔데믹 차이는? : 인류에게 필요한 11가지 약 이야기 - 정승규 저 (0) | 2022.02.09 |
---|---|
책임있는 과학기술이란 무엇인가? : 서가명강 2 - 크로스 사이언스, 홍성욱 (0) | 2022.01.12 |
AI와 기계에 의한 인간의 소외 : 고립의 시대, 노리나 허츠 part 2. (0) | 2022.01.11 |
코로나가 드러낸 우리 사회의 민낮 : 고립의 시대, 노리나 허츠 part 1. (0) | 2021.12.27 |
바이러스 쇼크, 최강석 : 팩트체크를 통해 돌아본 COVID19 (0) | 2021.09.17 |
댓글