오는 9일 서울에서 11억원이 걸린 인간과 기계의 승부가 시작된다. 인간 대표는 세계 정상의 프로 바둑기사 이세돌 9단, 기계 대표는 구글의 인공지능 바둑 프로그램 '알파고(AlphaGo)'이다. 인간과 기계의 대결은 이전에도 있었다. 1997년엔 체스, 2011년 퀴즈 대결에서 인간은 인공지능에 무릎을 꿇었다. 기계가 인간을 이기는 데 체스는 30년, 퀴즈는 7년이 걸렸다. 체스보다 훨씬 복잡한 바둑은 향후 50년간 인공지능이 인간을 이길 수 없다는 전망이 지배적이었다. 알파고는 이를 비웃듯 지난해 10월 프로 바둑기사 판후이 2단을 5대0으로 꺾고, 이세돌 9단에게 도전장을 던졌다.
반도체와 쇳덩어리로 만들어진 인공지능은 어떻게 200만년간 진화해 온 인간의 두뇌를 넘보게 된 것일까.
체스·퀴즈 차례로 정복
인공지능과 인간의 첫 대결은 1967년 열렸다. 체스 프로그램 '맥핵'과 철학자 드레퓌스의 대결에서 맥핵이 이겼다. 하지만 드레퓌스가 뛰어난 선수가 아니었던 데다, 맥핵이 다른 사람들에게 계속 패배해, 맥핵이 인간을 이겼다고 볼 수는 없다.
체스는 '말을 움직여 상대의 왕을 잡으면 승리한다'는 명확한 규칙이 있다. 64개의 칸 위에서 6종류의 말을 움직이는 경우의 수는 10의 120제곱이다. 이 경우의 수를 모두 계산할 수 있으면 이길 수 있다.
IBM은 1989년 인공지능 체스 프로그램을 개발하기 시작했다. 그리고 1996년 IBM의 수퍼컴퓨터 '딥블루'가 당시 세계 챔피언 개리 카스파로프에게 도전했지만 패했다. 다음 해 딥블루를 업그레이드한 '디퍼블루'가 다시 카스파로프에게 도전해 승리를 거뒀다. 디퍼블루는 매초 2억개의 수를 분석했고 20수 앞을 내다볼 수 있었다. 인간의 계산 속도보다 7000만배 이상 빠르다. '맥핵'으로부터 따지면 체스에서 기계가 인간을 이기는 데 30년이 걸렸다.
1997년 세계 체스챔피언 이겨
IBM 수퍼컴 디퍼블루
매초 2억개 수 분석, 20수 내다봐
2011년 퀴즈대결서도 완승
사람의 질문을 인식한 뒤
동사·목적어·핵심 단어로 분류…
DB 검색 3초 내에 정답 유추
2011년 IBM의 수퍼컴퓨터 '왓슨'은 퀴즈로 인간에게 도전했다. 미국의 인기 퀴즈쇼 '제퍼디'에 출연했다. 왓슨은 사람의 질문을 인식한 뒤 동사, 목적어, 핵심 단어로 분류한다. 이어 핵심 단어를 방대한 데이터베이스에서 검색한다. 예를 들어 "펨브로크 칼리지와 에마뉘엘 칼리지의 성전을 설계한 건축가는?"이라는 질문이 나오면 왓슨은 우선 '펨브로크 칼리지' '에마뉘엘 칼리지' '건축가'를 검색한다. 검색 결과는 정답 대신 이 단어들이 포함된 문서들만 보여준다.
왓슨은 이 중에서 가장 많이 등장하는 건축가 5명을 추린 뒤, 이 건축가들을 다시 검색한다. 정답인 '크리스토퍼 렌'은 다른 건축가에 비해 검색 결과 안에 '펨브로크 칼리지'와 '에마뉘엘 칼리지'가 포함될 확률이 높다. 이런 방식으로 왓슨은 3초 내에 답을 유추해낸다.
제퍼디에서 왓슨은 7만7147달러를 획득, 인간 챔피언인 켄 제닝스(2만4000달러)와 브래드 루터(2만1600달러)를 압도했다. 사람이 문제를 듣고 생각하는 속도보다, 왓슨이 검색을 마치고 버저를 누르는 속도가 훨씬 빨랐다. 다만 왓슨은 66문제를 맞혔지만, 9문제는 오답을 말했다.
이식 한국과학기술정보연구원 책임연구원은 "왓슨은 핵심 단어를 골라 검색하고 확률을 평가할 뿐, 인간의 언어를 이해하는 것은 아니기 때문에 항상 정확한 답을 내놓지 못하는 것"이라고 말했다. 왓슨 개발은 2004년 시작됐으므로, 퀴즈에서 기계가 인간을 이기는 데는 7년 걸렸다.
판세까지 읽는 알파고
인공지능이 바둑에서 인간을 이기려면 새로운 능력이 필요하다. 돌을 놓는 착점(着點)이 361개인 바둑은 첫 수를 주고받는 경우의 수만 12만9960가지가 된다. 361개 점을 모두 채워가는 경우의 수는 10의 170제곱 가지나 된다. 모든 경우의 수를 계산하려면 수퍼컴퓨터로 수십억년이 걸린다. 여기에다 누가 우세한지 형세 판단도 필요하고, 죽은 돌을 들어낸 자리에 다시 둘 수도 있는 등 규칙도 복잡하다.
이를 해결하기 위해 구글은 알파고가 스스로 학습해 경험을 쌓도록 훈련시켰다. 바둑 기보(棋譜) 3000만개를 입력해 규칙을 가르친 뒤, 하루에 3만번씩 대국을 진행하도록 했다. 수마다 어떤 결과로 이어지는지 모두 저장한다. 또 알파고는 176개의 그래픽 처리장치로 형세를 인식하고 공격적인 바둑을 둘 것인지, 수비적인 바둑을 둘 것인지도 결정할 수 있다.
알파고는 대국이 진행될수록 강해진다. 후반으로 갈수록 계산해야 할 경우의 수가 줄어들기 때문이다. 김석원 소프트웨어정책연구소 실장은 "초반에는 10수 정도 내에서 벌어질 수 있는 경우의 수만 계산하고, 10수 이후는 무작위로 돌을 놓아 바둑판을 다 채우는 시뮬레이션 결과만 본다"면서 "그 시뮬레이션으로 10만 가지 결과를 살펴볼 수 있다"고 말했다.
알파고는 10만 가지 결과 중 이긴 경우가 많은 쪽으로 다음 수를 결정한다. 특히 중반 이후에는 모든 경우의 수를 계산할 수 있다. 이세돌 9단이 초반에 승기를 잡지 못하거나, 중반 이후에 실수하면 패배할 수도 있다는 것이다.
알파고는 판후이 2단과의 승부 이후 400만번 이상의 대국을 진행했다. 이 과정에서 비약적으로 발전했을 가능성이 높다. 이 9단과의 대결 방식이 판후이 2단 때보다 제한시간이 2배라는 점도 알파고에 유리하다.
김석원 실장은 "시간이 늘어날수록 알파고가 계산하고 검토할 수 있는 경우의 수가 늘어난다"면서 "이번에는 몰라도 알파고가 인간을 넘어서는 것은 시간문제"라고 말했다.
조선일보 박건형 기자 편집=김현중 입력 : 2016.03.03