AI 2041
리카이푸, 천 치우판(지음), 이현(옮김), 한빛비즈
짧은 이야기와 이 이야기에 대한 설명으로 이루어진 이 책은 시중에서 구할 수 있는 여러 인공지능 관련 서적들 가운데서 가장 쉽고 빠르게, 그리고 현실성 있게 AI가 만들어갈 미래 세계를 보여주고 있었다. 어떤 독자들은 과연 이런 세상이 될 것인가 의문을 표시할 수도 있겠지만 나는 이것보다 더 진전될 것이라 생각한다. 다만 이 진전이 우리 인류에게 도움이 될 지, 아니면 해악될 지 모르겠지만. 이미 많은 학자들과 지식인들은 AI로 인해 만들어질 디스토피아를 걱정하고 있는 것 또한 사실이다. 그렇다고 AI의 발전을 막을 수 없다는 점에서, 최근 나도 집중적으로 AI 관련 서적과 논문들을 살펴보고 있는 중이다.
미국의 과학자 로이 아마라(Roy Amara)는 '우리는 기술의 단기효과를 과대평가하고 장기 효과는 과소 평가하는 경향이 있다'고 지적한다. (이를 아마라의 법칙이라고 한다) AI에 대한 우리의 태도와 관련해서 아마라의 법칙을 고려해볼 수 있겠다. 지금 과대평가하는지 모르겠지만, 분명한 것은 시간이 조금 지난 뒤, 과소평가할 때의 위험은 눈에 그려지긴 한다.
딥러닝 - 인간의 뇌는 1,000억 개가 넘는 신경세포가 100조개 이상의 시냅스를 통해 병렬적으로 연결된 구조로 되어있다. 딥러닝은 이러한 인간 뇌의 복잡한 신경망을 모방한 인공신경망을 수학적으로 모델링한 것이라 볼 수 있다. 딥러닝은 입력층과 출력층을 포함한 수천 개의 신경망, 즉 소프트웨어 층으로 구성된다. 기존 인공 신경망이 가졌던 한계를 뛰어넘은 딥러닝은 풍부한 학습 데이터와 결합하면서 음식 인식과 객체 인식 등의 분야에서 놀라운 발전을 가져왔다.(46쪽)
2020년 넷플릭스에서 제작한 다큐멘터리 <소셜 딜레마>는 개인 맞춤형 정보와 서비스를 제공하는 인공지능 알고리즘으로 인해 우리가 스스로 의식하지 못하는 사이에 생각과 행동을 조종당하고 있다는 경종을 울린다. 구글의 디자인 윤리학자였던 트리스탄 해리스Tristan Harris는 다큐멘터리에서 이렇게 말한다. "슈퍼컴퓨터가 당신의 뇌를 노리고 있다는 것을 아는가? 당신이 무심코 누르는 수많은 클릭이 슈퍼컴퓨터의 컴퓨팅 성능을 활성화한다. 슈퍼컴퓨터는 20억명의 인간을 속여 끊임없이 다시 클릭하도록 했으며, 그러한 경험을 통해 더 많은 것을 학습했다." 이러한 매커니즘은 당신의 뇌가 원하지 않는 중독 상태에 빠지도록 하는 악순환을 불러온다. 반면 거대 인터넷 기업에는 계속해서 더 많은 수익을 창출하는 선순환을 가져온다. (54쪽)
하지만 어찌되었던, 우리는 가치판단을 해야하고 선택의 기로에 설 것이다. 이 때 선택하기 위해서라도 우리는 AI에 대해서 기본적인 이해 뿐만 아니라 이 기술이 사회적으로 미치게될 영향에 대해서도 깊은 고민을 해야 하는 것이다.
AI는 무엇보다 제약(신약개발), 의료(진단 및 치료) 등에 획기적인 기여를 할 것으로 예상된다. 그 대표적인 기술이 비전 기술이다. 아래는 비전 기술에 대한 설명이다. 우리가 이미지에 대한 레이블링 작업을 하는 것도 일부는 비전 기술과 연관된다고 할 수 있다.
컴퓨터 비전 Computer Vision
- 컴퓨터의 '보는' 능력에 관한 문제를 중점적으로 다루는 인공지능의 하위 분야
- 이미지 포착 및 처리: 실제 세계의 3D 장면을 카메라와 다른 센서들을 이용해 동영상으로 구현한다.각 동영상은 연속적인 이미지들로 구성되며, 각 이미지는 2D로 배열되는 픽셀의 집합체로 만들어진다.
- 대상 감지 및 이미지 세분화: 이미지를 뚜렷한 부분들로 나누고 대상이 어디에 있는지 찾는다.
- 대상 인식: 대상을 인식하고 세부 정보를 이해한다. 가령 대상이 강아지임을 인식하고 그 강아지가 독일산 셰퍼드라는 것까지 이해한다.
- 대상추적: 연속적인 이미지나 동영상에서 움직이는 대상을 추적한다.
- 몸짓과 움직임 인식: 엑스박스Xbox 댄싱 게임에서 캐릭터의 춤추는 동작과 같은 움직임을 인식한다.
- 장면이해: 어떤 장면을 정체적으로 이해한다. 예를 들어, '뼈다귀를 바라보는 배고픈 강아지'처럼 장면 속의 여러 대상이 갖는 미묘한 연관성까지도 함께 파악한다.
이 기술에 사용되는 신경망은 합성곱신경망(Convolutional Neural Network. CNN)으로 인간의 시각작용 원리에 기반한 모델이다.
그리고 이 비전 기술을 활용하여 딥페이크 이미지나 영상을 만들 수 있다. 딥페이크를 생성하는 매커니즘 GAN(생성적대립신경망)으로 GAN은 위조 신경망과 탐지신경망이라는 두 개의 대립적인 딥러닝 신경망으로 만들어진다. 실제처럼 보이는 무언가를 생성하는 위조신경망과 진짜인지 가짜인지 판단하는 탐지신경망을 통해 딥페이크를 만들 수 있다.
NLP(Natural Language Processing - 자연어처리)는 컴퓨터와 같은 기계가 인간의 언어를 분석하고 이해해서 처리하는 방법을 연구하는 인공 지능의 주요 분야 중 하나로 여기에는 지도학습 Supervised learning NLP과 자기지도 학습 Self-supervised learning NLP로 나누어진다. 인공지능이 자연어를 배우도록 지도 학습을 적용하려면 우선 특정 목적에 맞게 분류된 데이터세트가 있어야 한다. 이 때 레이블링이 된 학습데이터를 사용하는 경우, 지도 학습이며, 레이블링이 되어 있지 않은 학습데이터로 학습하는 경우, 자기지도학습이 된다.
자기지도학습 자기지도학습 방식에서는 방대한 데이터 분류작업이 필요하지 않기 때문에 앞서 언급한 문제를 극복할 수 있다. 이 접근법은 '시퀀스-투-시퀀스'라고 불린다. 시퀀스-투-시퀀스는 순환신경망을 사용해 문장을 학습하는 기법으로 인공지능은 시퀀스로 이루어진 대화의 말뭉치를 학습함으로써 선행발화가 후행발화로 변환되는 확률을 계산해 대화를 생성해낸다. (147쪽)
GPT-3의 능력은 매우 다양해서 거대한 신경망에 DSL을 추가 제공하면 재빨리 해당 분야에 맞게 조정해 사용하는 '전이학습transfer learning'도 할 수 있다. 이 때 해당 분야에 대한 소량의 데이터만 추가하면 되는데, 이는 GPT-3가 사전 학습에서 사용했던 거대한 데이터 세트를 활용할 수 있기 때문이다.(150쪽)
지금 우리가 사용하고 있는 Chat 기반의 AI 서비스는 위에서 언급한 기술적 배경을 가지고 있다. 그리고 AI의 발전 속도가 우리의 예상을 뛰어넘고 있어서 이 책에서 언급하는 내용들이 전혀 비현실적이지 않을 정도다. '슈퍼 GPT 모델이 출시된 이후로 스토리 창작의 매커니즘이 달라지고 문학의 정의 자체가 뒤집혔다.'(231쪽) 이제 일자리 뿐만 아니라 우리가 어떤 종류의 일들을 정의하고 처리하는 방식에 대한 접근도 달라질 것으로 예상된다.
운전은 인간이 배우려면 약 45시간이나 걸리는 복잡한 작업이다. 운전이라는 작업에는 지각(주변 환경 관찰과 소리듣기), 내비게이션과 경로 설정(주변 지역을 지도 상의 위치와 연결하고 A지점에서 B지점으로 이동하기), 예측(보행자와 다른 운전자의 의도와 행동 예측하기), 의사결정(도로교통법을 상황에 적용하기), 차량 제어(핸들조직, 브레이크 밟기 등) 등의 여러 하위 작업들을 포함된다.
인간이 아닌 인공지능이 구동하는 자율주행차는 뇌가 아닌 인공신경망을, 손과 발이 아닌 기계 부품을 사용한다. 가령 인공지능의 지각은 카메라 및 라이더와 레이더를 사용해 주변환경을 감지한다. 인공지능의 내비게이션은 도로 위 모든 지점을 고선명 디지털 지도상의 한 지점에 연결해 경로를 설정한다. 또 인공지능을 알고리즘을 사용해 다른 자동차와 보행자의 의도를 예측한다. 인공 지능의 의사결정은 전문가가 정한 규칙이나 통계적 추정에 의존해 내려진다.(307쪽)
이처럼 복잡한 작업을 수행해야 함으로, 인공지능분야에서 완전 자율 주행은 최후의 만찬에서 예수 그리스도가 사용했던 기적의 힘을 지닌 '성배'로 인식되고 있다(306쪽). 미국에서는 완전 자율 주행 단계를 아래와 같이 정의하고 있다.
레벨 0단계(비자동) - 인간이 전적으로 모든 조작을 제어한다. 인공지능은 주변환경과 도로를 모니터하고 관련정보를 운전자에게 알리는 역할을 한다.
레벨 1단계(운전자지원) - 인공지능은 인간 운전자가 LKAS(차선 이탈 자동 복귀 시스템)과 같은 지원 기능의 스위치를 켜놓을 때에 한해서 특정 작업을 수행한다.
레벨 2단계(부분 자동화) - 인공지능이 조향, 제어, 가속 등 여러 작업을 수행할 수 있으나 여전히 인간의 감독이 필요하다
레벨 3단계(조건부 자동화) - 인공지능이 주행의 주체가 되지만 인공지능이 요청할 경우 바로 인간이 조종의 주체가 되어야 한다(갑자기 조종의 주체가 바뀌면 위험이 완화하기보다 오히려 악화할 것으로 생각하는 회의론자들이 있다)
레벨 4단계(고도 자동화) - 인공 지능이 처음부터 끝까지 전적으로 운전을 도맡아 하되, 다만 이는 고선명 지도에 표시된 시내도로와 고속도로와 같이 인공지능이 이해하는 도로와 환경에서만 가능하다.
레벨 5단계(완전 자동화) - 어떤 도로나 환경에서도 인간의 개입이 전혀 필요하지 않다.
- 미국 자동차기술학회 SAE에서 정의하는 완전자율주행 단계 (308쪽)
기술의 발달은 때때로 눈부실 정도로 빨라서 현재 자율주행자동차는 3단계는 구현되었으며, 4단계를 시험 중이다. 그리고 이것으로 투자만 뒷받침된다면, 어느 정도 해결 가능하다. 스마트 도로를 건설하면 된다. 스마트 도로를 달리는 자율주행차는 센서, 소프트웨어, 기계적 제어 기능을 갖춘 '가상의' 철로를 달리는 기차와 같다. (310쪽) 스마트 도로로 제어되는 자율주행차는 상당 부분 트롤리 딜레마(trolly dilemma)로 알려진 여러 윤리적 문제들에 대해서도 대응할 수 있을 것이다.
완전자율주행 자동차처럼 AI 기반의 시스템의 발달은 우리에게 윤리적이고 도덕적인, 일종의 철학적 질문을 던진다.
가장 근본적인 질문은 "우리는 기계가 인간의 생명을 해칠 수 있는 결정을 하도록 허용해야 하는가?"이다. 그 대답이 "아니오"라면 자율주행차의 미래는 없다. (315쪽)
이제 AI에게 우리는 철학과 윤리를 가르쳐야 한다. 그런데 가르칠 수 있을까? 이제 본격적으로 AI 얼라인먼트(Alignment)가 중요해진다. 내가 볼 때 일자리의 상실은 이미 벌어진 일이다.
"인류의 경쟁자는 인공지능이었습니다. 인공지능은 휴식없이 365일 24시간 계속해서 학습하고 개선될 수 있습니다. 인공지능은 불과 한 달 전만해도 인간이 하던 일을 갑자기 가차없이 빼앗았습니다." (386쪽)
나는 <<AI슈퍼파워>>에서 현존하는 직업들 가운데 40% 정도가 2033년까지 인공지능과 자동화기술에 의해 수행될 수 있으리라 예측했다. (417쪽)
대다수 사람에게 일자리를 잃는 것보다 더 큰 문제는 삶의 의미를 상실하는 것이다. (419쪽)
이 책에선 AI가 하지 못할 것으로 예상되는 능력을 제시하고 있으나, 과연 그럴까. 나는 창의력이나 공감 등은 가능할 것이며, 수작업은 로봇 공학의 발달이 뒷받침된다면 충분히 가능한 일이다. 인간의 공감은 때로 허술한 측면이 많아서 대화만으로도 빠져든다. 이미 여러 사례가 있었으며, 며칠 전 뉴욕타임즈에서는 ChatGPT를 이용해 위로를 받는 어느 여성 사용자의 사례를 기사화하기도 했다.
창의력: 인공지능은 무언가를 전략적으로 만들어내거나 개념화할 수 없으며 계획을 세우지도 못한다. 인공지능은 협소한 목표를 위한 최적화는 잘 하지만, 스스로 목표를 정하거나 창의적으로 생각할 수 없다. 인공지능은 서로 다른 영역들을 넘나들며 생각하거나 상식을 적용할 수도 없다.
공감: 인공지능은 공감이나 연민과 같은 감정을 느낄 수도 그런 감정을 바탕으로 상호작용을 할 수도 없다. 인공지능은 다른 사람이 이해받고 있다거나 보살핌을 받는다고 느끼게 할 수 없다. 이와 관련해 인공지능이 아무리 개선된다고 해도 배려와 공감이 요구되는 상황에서 혹은 '휴먼터치 서비스 human-touch service'분야에서 인간이 로봇이 상호작용하며 편안하게 느낄 수 있는 수준에 도달하기란 매우 어렵다.
수작업: 인공지능과 로봇은 인간의 손재주나 정교한 손과 눈의 협업이 요구되는 복잡한 신체적 노동을 할 수 없다. 인공 지능은 알지 못하는 비구조화된 공간, 특이 이전에 관찰한 적이 없는 공간에 대처할 수 없다. (422쪽)
책을 읽으면서 메모한 내용을 바탕으로 간단하게 정리하였으나, 기술의 관점이 아니라 우리 인간(사용자)의 관점에서 AI가 어떤 영향을 끼치고 어떤 미래를 만들어갈 것인가를 이야기와 함께 기술을 설명하고 있어, 상당히 유용한 책이었다. 확실하게 현재 시점에서는 비관론으로나 낙관론으로 빠질 필요는 없으나, 머지 않은 미래에 우리는 분명한 결정을 해야 한다. AI의 가능성이 무궁무진할 정도니, 그 위험성 또한 우리가 예상하는 것 이상으로 크다. 아마 올 한 해 내내 AI에 관심을 기울일 듯 싶다. AI에 관심없는 이들에게도 충분히 추천할 만한 책이며, 이미 알고 있더라도 읽기를 권하는 책이기도 하다.