아마 많은 분들이 딩 리렌이 새로운 세계 체스 챔피언이 되었다는 소식을 들어보셨을 겁니다. 체스 팬인 저도 자연스럽게 경기의 흐름을 따라가면서 Stockfish라는 AI 봇을 이용해 분석해 보았습니다.
Stockfish와 같은 체스 엔진이 어떻게 정확하게 포지션을 분석하고 평가하는지는 알려지지 않았지만, 그 결과는 사람이 이해할 수 있습니다. 긍정적인 평가는 백의 승리, 무승부는 0의 평가, 부정적인 평가는 흑의 승리 등을 의미합니다.
하지만 이 수치는 어디에서 나온 것일까요? 스톡피쉬가 자체적으로 포지션을 평가하고 여러 요소를 고려하여 숫자를 산출한 결과입니다. 이 숫자는 대략 한 쪽이 몇 폰의 우위를 점하고 있는지와 같다고 합니다.
하지만 이는 체스 플레이어가 체스 포지션을 이해하는 데 있어 매우 직관적이지 않은 방식입니다.
이 숫자는 우리에게 답을 줍니다. 그리고 인공지능은 누가 이기고 있고 무엇이 최선의 수인지에 대한 평가에 도달하기 위해 다양한 요소와 향후 가능한 수 등을 고려하기 때문에 대부분의 경우 이 숫자는 객관적으로 정확합니다.
이보다 훨씬 더 중요한 것은 '왜 그 직책에 대한 평가가 그렇게 나오는가'라는 질문입니다. 답을 안다고 해서 그 답이 왜 그런지 알 수 있는 것은 아닙니다.
체스 플레이어 입장에서는 화가 날 수 있습니다. 체스 엔진의 평가에 대한 이유를 찾기 위해 시간을 소비해야 하는데, 종종 이러한 이유를 찾기가 어려울 수 있습니다.
매우 어려운 문제를 내주고 정답은 알려주지만 학생과 함께 추론하거나 힌트를 제공하지 않는 교사를 상상해 보세요. 여러분은 그런 교사가 형편없는 교사라고 당연히 결론을 내릴 것입니다. 하지만 그 답은 거의 틀림없이 정답이며 그럴 만한 이유가 있습니다.
AI 알고리즘이 우리를 혼란스럽게 하는 것은 이번뿐만이 아닙니다. 넷플릭스나 유튜브와 같은 웹사이트에서는 AI 알고리즘을 사용하여 시청할 동영상을 추천하는데, 사이트에 오래 머무를수록 알고리즘이 더 좋아지지만, 이러한 AI 알고리즘의 성공을 측정하는 지표와 이러한 알고리즘이 액세스한 데이터에 대한 언급을 제외하고는 실제로 우리가 알고 있는 것은 거의 없습니다.
그러나 성공의 이유를 이해하면 우리에게 큰 도움이 될 것이며, 이것이 바로 우리가 이해할 수 있는 AI를 만드는 데 있어 AI의 다음 큰 발전이 이루어져야 하는 부분입니다.
객관성과 명료성은 다릅니다.
우리가 이해할 수 있는 인공지능을 만든다는 것은 인공지능의 말을 이해할 수 있다는 뜻이 아니라, 직관적으로 설명할 수 있는 인공지능을 만든다는 뜻입니다.
스톡피쉬의 대항마는 구글의 자회사인 딥마인드에서 개발한 알파제로입니다. 체스의 위치와 수를 평가하여 무작위로 보이는 숫자를 출력하는 대신, 알파제로는 확률로 위치를 측정합니다. 알파제로는 -1에서 1 사이의 숫자를 출력하는 반면, 스톡피쉬는 수백 개에 이르는 숫자를 출력하지만 이 숫자가 정확히 무엇을 의미하는지 알 수 없습니다.
아래 차트는 센티파운으로 표시되는 기존 체스 엔진 평가와 릴라(알파제로의 후속작)의 평가가 어떻게 연관되는지 보여줍니다.
중요한 것은 알파제로와 릴라가 여전히 객관적인 평가를 제공하지만, 이러한 평가가 훨씬 더 직관적으로 느껴진다는 점입니다. 왜 그럴까요? 사용자가 느끼는 정도와 더 잘 일치하는 평가를 제공하기 때문입니다.
포지션이 0에서 +5로 바뀌는 것은 무승부에서 백이 이길 확률이 높은 게임과 상관관계가 있습니다. 하지만 포지션이 +5에서 +10으로 올라가는 것이 정말 큰 차이가 있을까요? 스톡피쉬는 동일한 평가 차이를 제공하지만, 0에서 +5로 변경하는 것은 대략 이길 확률이 전혀 없는 상태에서 이길 확률이 80%로 변경되는 것을 반영하는 반면, +5에서 +10으로 변경하는 것은 이길 확률이 10%만 추가로 증가한다는 것을 반영합니다.
이 지표가 더 나은 이유는 무엇일까요? 이 지표는 포지션이 우리에게 주는 느낌과 훨씬 더 밀접한 관련이 있기 때문입니다. 무승부 0에서 +5의 우세로 바뀌는 것을 보면 백이 상대를 잘 압박하고 있고 상대는 그 압박에 굴복하는 것처럼 느껴집니다. 반면에 +5에서 +10으로 우위가 늘어나는 것은 이미 대부분의 작업이 완료되었기 때문에 크게 느껴지지 않습니다.
이것이 제가 말하는 AI의 이해도를 높인다는 의미의 일부입니다. 이 경우의 AI는 더 이해하기 쉽습니다. 훨씬 더 직관적이고 객관적으로 정확할 뿐만 아니라 우리가 느낄 수 있는 결과물을 제공합니다.
기존의 인공지능은 항상 객관성을 유지해왔지만, 인공지능이 객관성을 지속적으로 개선한다고 해서 인류가 큰 발전을 이루지는 못할 것입니다. 페이팔의 창립자 피터 틸은 이를 '1에서 n으로 가는 것'이라고 표현했습니다. 대신, 우리에게 필요한 것은 '0에서 1로 이동'하여 뭔가 다른 것을 하는 것, 즉 AI를 인간이 더 잘 이해할 수 있도록 만드는 것입니다.
알파제로는 출력을 보다 직관적으로 만들어 인간이 AI를 더 잘 이해할 수 있도록 하는 데 성공했습니다. 하지만 무엇을 더 할 수 있을까요?
인류에 대한 이해
1983년, 일렉트로닉 아츠에서 잡지 광고를 게재했습니다. 이 광고는 컴퓨터가 막 등장하던 시대에 게재되었습니다. 이 광고는 개인용 컴퓨터의 잠재력을 실현할 것을 약속합니다.
중요한 질문과 몇 가지 생각할 거리로 시작합니다:
"컴퓨터가 당신을 울게 할 수 있을까요? 지금은 아무도 모릅니다. 많은 사람들이 이 질문을 경솔한 생각이라고 생각하기 때문입니다. 하지만 이 질문에 성공적으로 답하는 사람은 다른 여러 질문에 먼저 답했을 것이기 때문이기도 합니다.
우리는 왜 울까요? 우리는 왜 웃고, 사랑하고, 미소 짓는 걸까요? 감정의 시금석은 무엇일까요?
지금까지 이러한 질문을 하는 사람들은 소프트웨어 회사를 운영하는 사람들이 아니었습니다. 대신 작가, 영화 제작자, 화가, 음악가들이었습니다. 그들은 전통적인 의미에서 예술가였습니다."
이러한 질문은 컴퓨터가 처음 대중적인 소비재로 자리 잡기 시작한 1983년 당시에는 선견지명이 있는 질문이었습니다. 하지만 오늘날에도 여전히 유효합니다. 지난 수십 년 동안 우리는 계산, 객관성, 개념 이해 능력이 점점 더 뛰어난 AI를 개발해 왔습니다.
하지만 오늘날 이러한 질문은 여전히 중요하지만, 점점 더 답변해야 할 유일한 질문이 아닙니다. AI가 인간이 이해할 수 있는 방식으로 자신을 표현하는 방법, 또는 인간이 AI를 더 잘 이해할 수 있는 방법에 대한 새로운 질문이 제기되어야 합니다.
AI가 산출한 답변에 대해 더 나은 자기 설명을 제공한다면 의사 결정에 무엇이 작용했는지, 왜 그 답변이 옳은지에 대해 훨씬 더 명확하게 알 수 있습니다. 결국 연구자가 연구를 발표할 때는 결론만 중요한 것이 아니라 방법론, 데이터 세트, 질적 추론 등을 포함해야 합니다.
AI로부터 배우려면 인류는 AI를 더 잘 이해해야 하고, AI는 숫자와 신호, 빛뿐만 아니라 말과 그림, 감정을 통해 인류와 더 잘 소통할 수 있어야 합니다. AI가 내릴 수 있는 결정, 수행되는 계산, 이러한 작업의 목적을 설명하는 것은 AI가 더 잘 할 수 있어야 하는 일입니다.
AI의 다음 단계는 컴퓨터의 연산 능력을 높이는 것이 아니라, 인류가 더 잘 이해할 수 있는 방식으로, 프로그래머가 아닌 사람도 이해할 수 있는 방식으로 AI가 스스로를 표현하도록 만드는 데서 이루어질 것입니다.