책들의 우주/이론

알고리즘이 지배한다는 착각, 데이비드 섬프터

지하련 2022. 12. 26. 11:00

 

 

알고리즘이 지배한다는 착각
데이비드 섬프터 David Sumpter(지음), 전대호(옮김), 해나무 



우리는 언제나 지독한 편견과 싸운다(안타깝게도 싸우지 않는 사람이 더 많을지도 모르겠다). 세상이 강요하는 편견, 인류 문명이 강요하는 편견, 우리의 생물학적 특성이 강요하는 편견, 우리의 부모나 일가친척, 선생들과 친구들이 강요하는 편견, 그리고 그 편견들 속에서 자라난 우리 스스로에게 강요하는 자신만의 편견. 그렇다면 편견 아닌 것이 어디 있을까? 하지만 우리는 그것이 잘못된 것이라면 정상적인 지성을 가지고 있다면 분명 고치려고 할 것이다. (아! 한국사회는 얼마나 많은 이들이 이 편견을 고집하고 있는지!)

 

이 책은 페이스북이나 구글의 서비스, 그리고 인공지능에 대해 이야기하며, 이러한 서비스나 AI를 가능하게 만드는 알고리즘이 작동하는 방식과 그 위험성을 이야기한다. 위험성이라고 하기엔 아직 갈 길이 멀다는 것이 저자의 의견이지만, 적어도 알고리즘에 대한 이해를 가지고 있어야 대응할 수 있지 않겠느냐고 말한다.

 

책은 뱅크시의 이야기로부터 시작한다.

 

감정적으로 초연한 학자들이 알고리즘을 이용하여 뱅크시가 누구인지 알아내는 것이 나는 싫다. 뱅크시의 매력은 그가 남몰래 밤에 작업하고 그의 작품이 아침 햇빛 속에서 우리 사회의 위선을 폭로하는 것에 있다. 수학이 미술을 파괴하고 있다. 차가운 논리적 통계학이 후드 점퍼를 입고 런던의 뒷골목을 어슬렁거리는 자유의 투사를 추적하고 있다. (15쪽)

 

아직까지 뱅크시가 누구인지 알아내지 못했지만, 알고리즘이 모든 걸 할 수 있다는 식의 접근을 비판하고 있는 셈이다. 이 책 전반에 걸쳐 섬프터는 알고리즘이 할 수 있는 것은 아직 제한적임을 강조한다.

 

성격 맞춤형 광고를 위한 도구나 데이터가 없으면서도 그런 광고를 한다고 자부하는 케임브리지 애널리티가 같은 회사를 SCL 그룹이 창립할 수 있다는 것은 섬뜩한 일이지만, 그것이 당신이 마주한 세계적 자본주의다. 그것을 받아들이든지, 아니면 시스템의 거짓말이나 속임수가 아니라 시스템 자체를 공격해야 한다. (358쪽)   

 

하지만 책 서두에 인용되는 두 권을 통해 알고리즘이 어떻게 악용되고, 악용의 대상이 되는 우리는 정작 그 알고리즘이 어떤 식으로 작동하는지 모른다고 지적한다. <<대량살상 수학무기Weapons of Math Destruction>>에서는 교사평가와 온라인 대학교 광고부터 사채사업과 재범 예측까지 온갖 분야에서 알고리즘들이 악용되는 사례들을 보고하고 있으며, 알고리즘이 흔히 수상쩍은 전제들과 부정확한 데이터에 기초하여 우리에 관한 결정을 자의적으로 내리고 있음을 이야기한다. 그리고 <<블랙박스 사회 The Blackbox Society>>에서는 우리는 그러한 알고리즘들이 어떻게 작동하는지 알아낼 수 없는 처지라고 말한다. (26쪽)

 

우리에게 상품을 팔려고 애쓰는 알고리즘을 이해하고 ISP들이 우리의 권리를 존중하게 만드는 것은 우리의 책임이다. 알고리즘이 우리에 관하여 내리는 결론은 차별적일 수 있다. (31쪽) 



알고리즘의 득세는 유럽과 미국에서 불확실성이 증가하는 상황과 동시에 일어나고 있다. (37쪽) 

 

알고리즘에 기반한 서비스가 늘어날 수록 편리해진다고 생각하겠지만, 실은 그렇지 않다. 음악 스트리밍 서비스에 제공하는 추천 음악 리스트를 즐겨 듣다가 최근에는 아예 듣지 않는데, 매번 거의 비슷한 음악만 나오기 때문이다. 가수 리스트가 거의 비슷하며 음악도 거의 동일하다. 그냥 순서만 바뀌는 듯 하달까. 뭔가 새로움을 느낄 수 없었다. 결국 내 취향을 가두리 양식장에 가두는 느낌이 들었다. 폐쇄적인 추천 리스트였던 셈이다. 전체적으로 추천 알고리즘은 이러한 방식을 취한다.

 

이런 상황은 정치에서 특히 두드러진다.  트위터나 페이스북에서 이루어지는 정치적 격론은 한편으론 참 우습고 한편으론 상당히 위험해 보인다. 나 또한 페이스북에 정치 이야기를 올리지 않으려고 노력하지만, 쉽지 않다. 나 또한 에코 챔버에 갇혀 있는 셈이다.  

 

영국 국민투표에서 유럽연합 탈퇴가 결정된 것과 트럼프가 미국대통령으로 당선된 것은 학계 안에서 곱게 사는 우리 학자들에게 경악스러운 일이었다. 나의 진보 성향 동료들 대다수는 눈 앞에서 벌어지는 일을 이해할 수 없었다. (195쪽)

 

나, 또한 흥미로운 경험이었다. 어떻게 내 주위에는 비슷한 정치적 성향을 가진 이들만 있는 걸까 하는... 

 

눈에 띄는 설명 하나는 알고리즘이 여론을 망쳐놓았다는 것이다. 우선 ‘반향실echo chamber’과 ‘필터버블’이 거론되었다. (196쪽)

 

‘필터링된’ 공간과 ‘반향으로 가득찬’ 공간의 차이는 알고리즘에 의해 창조되느냐, 아니면 사람들에 의해 창조되느냐에 있다. (201쪽)

 

‘필터’ 알고리즘은 버블(거품방울)을 창출한다. 심지어 처음에 편향이 없었던 사용자의 뉴스피드에서는 그러하다. (...) ‘필터’ 알고리즘은 초기의 작은 차이를 포착하고 부풀려 약간 열등했던 한 쪽 진영이 결국 사라지게 만든다. 사용자는 자기 확증적 생각과 소규모 친구들과의 상호작용 안에 갇힌다. (207쪽)

 

결국 온라인과 소셜 미디어를 통해 형성된 여론은 조작된 것이다. 지난 대선 때 형성된 이재명에 대한 무수한 담론들을 더올려 보라. 그리고 지금도 그는 그 담론의 희생양이 되어 있다. 그 기회를 놓치지 않고 그의 정적들은 공격하고 있다. 그것이 진실이든, 거짓이든, 어떤 이야기가 지닌 매력은 이루 말할 수 없다. 

 

음모론은 과학보다 훨씬 더 매혹적이다. (212쪽)

 

대다수의 음모론은 버블의 내부에 머물며, 거기에서 음모론자들은 서로의 생각을 지지한다. (214쪽)

 

‘만델라 효과’란 사람들이 진실이 아닌 무언가를 진실이라고 생각하는 현상을 말한다. (238쪽) 

 

알고리즘이 득세할 수록 우리는 무엇이 진실인지 알지 못한다. 전통적으로 진실을 알기 위해선 비판적 시선을 가진 언론들을 의지해 왔다. 우리가 흔히 이야기할 때 그 '기자정신'이라는 것도 여기에 해당될 것이다. 하지만 한국 사회에서는 몇 명의 기자들을 제외하곤 기자정신은 없어지고 '기레기정신'만 있을 뿐이다. 그러나 실망하지 마라. 비단 한국만 그런 것이 아니다(트럼프가 당선될 때부터 우리는 이를 알고 있어야 했다). 

 

당연히 페이스북은 사용자들이 받는 정보를 조작하고 있다! 그런 조작이야말로 페이스북 사업 방식의 핵심이다. 페이스북 소속의 애덤 모세리가 경제계의 주요 인사들에게 자랑하는 알고리즘이 하는 일은 다름 아니라 뉴스피드 조작이다. 당신이 페이스북을 더 자주 사용하게 만들기 위하여, 그 회사는 당신에게 무엇을 보여줄지에 관한 결정을 끊임없이 조정한다. 페이스북은 이 사실을 전혀 숨기지 않으며, 당신이 스스로 당신의 뉴스피드를 미세 조정하는 것까지 허용한다. (220쪽)

 

페이스북과 그것이 우리의 삶에 미치는 영향을 두고 많은 사람들이 호들갑을 떤다. 그러나 내가 대규모 연구들을 꼼꼼히 재검토하고 관련 연구자들과 대화한 후에 느낀 바는 연구 결과들이 언론에서 거의 항상 왜곡되거나 과장된 형태로 보도된다는 것이었다. (221쪽) 

 

하지만 대다수는 이를 알지 못하며 관심도 없다. 도리어 자신의 생각이 맞다고 여기며 자신의 편견을 강화할 뿐이다. 그래서 소셜미디어가 민주주의를 망치고 있다는 비난을 듣는 것이다. 그리고 실제로도 그렇다.  

 

가짜뉴스는 성장하는 산업이다. (240쪽)  

 

 나는 사람들에게 비판적으로 사실을 받아들이고 정확하고 일관성 있는 판단을 하기 바라지만, 실은 그렇지 못하다. 대다수 그렇게 행동하지 않는다. 특히 한국 사회는 그 경향이 더 두드러지는 듯하다. 당연히 늘 비판적 입장을 가지긴 쉽지 않다. 그러나 그렇게 노력해야 하는 것이 맞는 행동이 아닐까 싶다. 데이비드 섬프터도 자신이 암묵적 인종주의자라는 사실에 참담해 하듯이.

 

나는 그 검사(암묵적 연상 검사implicit association test)에 관한 글을 미리 읽고 검사 방법을 정확히 아는 상태에서 검사를 받았는데도 참담한 결과가 나왔다. “당신의 데이터는 아프리카계 미국인보다 유럽계 미국인들을 자동으로 선호하는 편견이 중간 수준임을 보여줍니다.” 나는 암묵적 인종주의자다. (263쪽)

 

알고리즘에 대해 알고 싶지 않더라도, 최근 주목받고 있는 AI(인공지능)이나 많은 사람들이 이용하는 온라인 서비스나 디지털 서비스에 대한 이해를 구할 수 있다는 점에서 추천할 만한 책이다. 적어도 자신의 편견이나 우리가 이용하는 서비스들이 어떻게 편견을 조장하는지는 알 수 있을 테니. 그리고 혹시라도 가짜뉴스를 보고 휩쓸렸던 자기 자신을 돌이켜볼 수 있다면 더 좋을 일이다. 

 

소설의 가치는 종이에 인쇄된 문구에서 나오는 것이 아니라 독자인 나의 머릿속에서 형성되는 생각에서 나온다. (…) 좋은 소설은 다양한 수준의 의미 층들을 지녔다. 소설 속에서 단어들이 나란히 놓이고, 문장들이 구성된다. 스토리가 존재하고 독자의 내면에서 벌어지는 일이 존재한다. 그리고 가장 중요한 것은 어쩌면 이 마지막 수준, 곧 독자의 내면일 것이다. (287쪽)


데이비드 섬프터은 진짜 소설이 주는 매력이나 감동에 언어 알고리즘이 가려면 아직 갈 길이 한참 남았음을 지적한다. 얼마 전에 인공지능이 그린 그림을 본 적이 있었다. 나는 그 그림을 보며 특별한 감흥을 느끼지 못했는데, 사람들은 상당히 흥분했다. 나에겐 그건 그냥 그림이었기 때문이다. 억지로 시선을 잡아 끌기 위해 그려진 그림들 중 하나였다. 아마 한 세기가 지나기 전에 예술계는 인공지능이 만든 작품을 두고 어떻게 해석해야 할 것인가 논란이 일어날 것지만, 아마 현명한 결론을 내릴 것이다. 그러나 데이비드 섬프터가 말하듯이. 

 

우리는 수학적 모형들의 도움으로 점점 더 똑똑해지고 있고, 모형들은 우리가 발전시키기 때문에 더 좋아지고 있다. 알고리즘은 우리의 문화유산이다. 우리는 알고리즘의 일부고, 알고리즘은 우리의 일부다. (362쪽)