바둑

알파고, 첫수는 대부분 '화점'… 돌 던지는 예법도 안다

해암도 2016. 3. 8. 07:03

내일 이세돌 對 인공지능 대국… 알파고는 어떻게 바둑을 두나

- 수학문제 풀듯 신경망 활용
원리 배운뒤 기보 16만건 입력
다음 착점 알아맞히며 '연습풀이', 가상 대국으로 최선의 수 찾아내
감정이 없어 무리수도 안 둬… 끝내기선 실수 저지르지 않아

이세돌 9단과 구글의 인공지능 바둑 프로그램 '알파고(AlphaGo)'의 대결이 하루 앞으로 다가왔다. 일어날 수 있는 경우의 수가 무한대에 가까운 바둑은 20~30년간은 인공지능이 프로 기사를 이길 수 없다는 전망이 지배적이었다. 하지만 알파고는 지난해 10월 프로 기사 판후이 2단과 대결해 5대0으로 승리하고, 세계 최강인 이세돌 9단에게 도전장을 던졌다. 어떻게 알파고는 최강의 인간까지 넘보게 됐을까.

바둑 실력은 어디에서 나오나

바둑은 흑과 백으로 편을 나누어 가로·세로 각 19줄인 바둑판에서 승패를 겨룬다. 돌과 돌을 연결해 '집'을 많이 확보한 쪽이 승리한다. 바둑을 잘 두려면 수읽기, 직감, 평정심이 조화를 이뤄야 한다.

수읽기는 계산 능력이다. 수를 둘 때마다 앞으로 벌어질 수 있는 여러 시나리오를 머릿속에서 상상으로 진행해 볼 수 있어야 한다. 직감은 추상적 능력이다. 바둑에서는 모든 경우의 수를 계산할 수 없기 때문에 사람은 직감을 우선적으로 활용한다. 프로 기사들은 다음 착수할 곳을 한눈에 두세 곳으로 압축해 수읽기를 진행한다.

평정심은 바둑을 그르치지 않는 데 필요하다. 앞서 두었던 수가 아까워서 작전을 바꾸지 않고 고집하거나, '당했다'는 느낌에 발끈해서 무리한 수를 두면 안 된다. 알파고는 감정이 없어 평정심을 잃지 않는다.

첫수는 화점에 둘 듯

알파고는 판후이 2단과 벌인 공개 대국에서 다섯 번 모두 첫수를 화점(花點·바둑판에 찍힌 9개의 점)에 놓았다. 이는 현대 바둑에서는 화점을 활용할 때 승률이 높다는 통계에 근거한 결정으로 보인다.

알파고의 대국 스타일 정리 표
바둑의 초반 진행인 포석(布石)도 평범하다. 돌이 거의 없는 초반에는 계산할 경우의 수가 너무 많기 때문에 형세 판단 없이 기보 16만건에서 학습한 대로 둘 것이다. 16만건에서 평균적으로 가장 많이 등장하는 형태를 포석에 쓸 가능성이 높다.

사람은 직감으로 다음 수를 둘 후보를 추리지만, 알파고는 직감이 없다. 대신 바둑판 위에 놓인 돌의 전체적 모양을 읽어 직감을 흉내 낸다. 돌과 돌이 연결된 모양을 감안해 '좋은 모양 만들기'를 하는 것이다.

시뮬레이션으로 이길 확률 따져

대국이 중반에 접어들면 알파고는 사람의 뇌 구조를 모방한 신경망(神經網)을 본격 활용한다. 알파고의 신경망에는 지금까지 학습한 결과가 담겨 있다. 바둑의 규칙과 기본 원리를 배운 뒤, 입력된 기보 16만건에서 다음 착점을 알아맞히는 연습 문제 풀이까지 했다.

이어 가상으로 대국을 무수히 진행해 어떻게 두었을 때 더 좋은 결과가 나왔는지 학습했다. 마치 학생들이 수학을 배울 때 몇 가지 공식을 외우고, 연습 문제를 푼 뒤 증명 방법까지 찾아내는 과정과 닮았다.

하지만 이렇게 많이 학습해도 실제 바둑에서 나올 수 있는 모든 경우를 알 수는 없다. 그래서 대략적 시뮬레이션을 돌려서 승률이 높은 쪽을 선택해 착점한다. 돌이 놓인 모양을 읽어 다음 수 후보를 몇 가지 추린 뒤 시뮬레이션(모의실험)을 돌려서 각 수별로 승리할 확률을 따지는 것이다.

끝내기에는 실수가 없다

알파고도 실수를 한다. 판후이 2단과의 두 번째 대국에서 사활(死活) 문제를 실수하면서 잡을 수 있던 돌을 놓쳤다. 다섯 번째 대국에서는 엉뚱한 수로 자신의 돌을 위험에 빠뜨렸다. 이는 국지적인 전투에서도 충분히 계산을 하지 못해 예쁜 모양을 고집하는 알파고의 특징 때문으로 추정된다. 모양을 버리고 실리를 택할 수 있지만, 알파고는 아직 모양과 실리의 균형을 조정할 정도의 능력은 없는 것으로 보인다. 두 수 모두 프로 기사라면 결코 하지 않을 실수였다.

종반 끝내기에서는 실수가 거의 없을 가능성이 높다. 경우의 수가 줄어 정확한 시뮬레이션 결과를 얻을 수 있기 때문이다.

많은 사람은 이세돌 9단이 대국에서 엉뚱한 수를 놓으면 알파고가 오작동을 일으킬 것으로 기대한다. 하지만 가능성이 낮다. 수많은 기보를 학습했고 가상 대국까지 한 알파고의 실력을 감안하면, 엉뚱한 수는 무시하거나 호되게 응징할 것이다.

불계패도 인정할 만큼 예절을 안다

바둑에서 승패가 기울었다고 판단되면 돌을 던지는 것이 예의다. 상대방 실수를 기다리며 판을 끌고 가지 않는다. 알파고도 예절을 안다. 판후이 2단과 벌인 비공식 대결에서 한 번 불계패를 기록했다. 이길 수 없다고 판단, 프로 기사처럼 행동한 것이다.


 조선일보  

  • 한국전자통신연구원 이정원 박사
  • 한국전자통신연구원 손영성 박사
  • 박건형 기자            입력 : 2016.03.08




이세돌 VS 알파고 관전 포인트

기사 이미지

한국기원과 구글 딥마인드가 22일 오후 한국기원 2층 대국장에서 이세돌 9단과 알파고 대국에 관한 프레스 브리핑을 열었다. 이세돌 9단이 영국에 있는 데미스 하사비스 `구글 딥마인드` CEO와 화상연결후 손을 맞잡고 있다. [사진 김현동 기자]


이세돌 9단 VS 알파고, 세기의 대결이 코앞으로 다가왔다. 매일 3만여 대국을 두며 쉬지 않고 바둑을 연마한 알파고의 실력이 드디어 베일을 벗는다. 변칙적인 수를 즐겨두는 이세돌 9단이 알파고에 맞서 얼마나 창의적 기량을 발휘할지도 초미의 관심사다. 이번 대국의 흥미로운 관전 포인트 4가지를 꼽았다.

①알파고 실력 얼마나 늘었나

지난해 10월 판후이 2단과의 대결을 통해 알려진 알파고의 기력은 이세돌 9단과 ‘선(先)’. 즉 한 점 정도 기력 차이다. 알파고는 판후이 2단과의 대국을 위해 약 3000만 개의 아마추어 기보를 소화했다.

이후 이세돌 9단과의 대결을 앞두고 수많은 프로기사의 기보를 습득하고 있는 것으로 알려진다. 이번 대결을 통해 5개월간 성장한 알파고의 기력을 재평가해볼 수 있다. 이를 통해 향후 인공지능의 발전 속도와 가능성도 짐작해 볼 수도 있다. 최대의 관전 포인트다.

②알파고의 신수(新手) 대응력

이세돌 9단은 대표적인 변칙 복서다. 정석에도 없는 기발하고 창의적인 수를 즐겨 둔다. 이번 대결에서도 이 9단은 최대한 변칙적인 수로 판을 크게 흔들 것으로 관측된다. 알파고는 이에 대해 과거의 기보를 토대로 최선의 수를 찾아낼 것이다. 만약 이 9단이 기보에도 없는 수로 공격한다면 알파고가 어떻게 응수할지가 궁금하다.

알파고를 개발한 구글 딥마인드의 데미스 하사비스 최고경영자(CEO)는 7일 “이세돌 9단의 기풍은 매우 창의적이고 흥미롭다. 그와의 대결 차제가 매우 멋진(fantastic) 일"이라고 말했다.

③알파고도 돌을 던지나

바둑에는 이길 가능성이 없을 경우 끝까지 승부를 마치지 않고 중간에 포기하는 룰이 있다. ‘돌을 던진다’고 표현하며 이렇게 이기는 경우를 불계승(不計勝), 지는 경우를 불계패(不計敗)라 한다. 개발자에 따르면 알파고도 승산이 없을 경우 중간에 돌을 던질 수 있다.

데미스 하사비스 최고경영자는 지난달 22일 본지와의 단독 인터뷰에서 “알파고는 판세를 읽고 이길 확률을 계산한다. 이길 확률이 없다고 보면 돌을 던진다”고 했다. 그의 말대로 이번 대국에서 알파고가 수세에 몰릴 경우 실제로 돌을 던지는가를 지켜보는 것도 흥미로운 관전 포인트다.

④이세돌 9단의 심리적 부담

이세돌 9단이 상대할 알파고는 그간 대국을 치러온 프로기사들과는 차원이 다르다. 무한 체력의 소유자인데다 감정 변화가 전혀 없다. 이 점은 이세돌 9단에게 예기치 않은 부담으로 작용할 수 있다. 판후이 2단 역시 “알파고와 대국을 하면서 상대가 전혀 심리 변화가 없다는 게 강하게 느껴졌다. 점점 내 자신을 의심한 게 가장 큰 패배의 원인이었다”고 밝혔다.

이세돌 9단이 대결에 앞서 5일 제17회 농심배 세계바둑최강전 최종국에서 ‘천적’ 커제 9단에게 패한 것도 변수다. 이 9단이 알파고와의 대결 전까지 컨디션을 최상으로 이끌어 올릴 수 있는가 여부도 대결에 영향을 미칠 것으로 보인다.

정아람 기자 aa@joongang.co.kr    [중앙일보] 입력 2016.03.07




이세돌 "조금 긴장…5대 0 승리는 아닐 것 같다"


딸 격려 받는 이세돌 9단
딸 격려 받는 이세돌 9단 (서울=연합뉴스) 홍해인 기자 = 이세돌 9단이 구글이 만든 인공지능 바둑 프로그램 '알파고'와의 맞대결을 하루 앞둔 8일 오전 서울 종로구 포시즌스호텔에서 열린 사전 브리핑에 참석해 딸 혜림 양의 격려를 받고 있다.

(서울=연합뉴스) 최인영 기자 = 인간을 대표해 인공지능 알파고와 반상 대결을 펼칠 이세돌 9단이 "조금 긴장은 해야 할 것 같다"며 자신의 승리 가능성을 조금 낮췄다.


이세돌 9단은 8일 서울 포시즌스호텔에서 열린 구글 딥마인드 챌린지매치 기자간담회에서 "아직도 여전히 자신감은 있다"면서도 "5대 0으로 승리하는 확률까지는 아닌 것 같다"고 말했다.


그는 지난달 22일 열린 기자간담회에서는 "(5번의 대국 중) 3대 2 정도가 아니라 한 판을 지느냐 마냐 정도가 될 것 같다"며 자신감을 숨기지 않았다. 이후에도 5전 전승을 목표로 두겠다며 자신감을 표출했다.

이세돌-알파고 세기의 맞대결 D-1
이세돌-알파고 세기의 맞대결 D-1 (서울=연합뉴스) 홍해인 기자 = 이세돌 9단이 구글이 만든 인공지능 바둑 프로그램 '알파고'와의 맞대결을 하루 앞둔 8일 오전 서울 종로구 포시즌스호텔에서 열린 사전 브리핑에서 취재진의 질문을 경청하고 있다.


이세돌 9단과 알파고는 오는 9일부터 5차례 반상 대결을 펼친다. 승자는 상금 100만 달러를 가져간다.


구글 자회사인 딥마인드가 개발한 알파고는 인공지능 최초로 프로기사와 동등하게 대결해 이겼다. 지난해 10월 유럽챔피언 판후이 2단을 5대 0으로 이긴 것이다. 이번에는 세계 최고의 바둑 기사인 이세돌 9단에게 도전한다.


이날 데미스 하사비스 딥마인드 최고경영자(CEO)는 이날 알파고의 기술과 원리를 설명하는 발표를 했다.


이세돌 9단, '자신 있다!'
이세돌 9단, '자신 있다!' (서울=연합뉴스) 홍해인 기자 = 이세돌 9단(가운데)이 구글이 만든 인공지능 바둑 프로그램 '알파고'와의 맞대결을 하루 앞둔 8일 오전 서울 종로구 포시즌스호텔에서 열린 사전 브리핑에 참석해 구글 딥마인드의 CEO 데미스 하사비스(왼쪽), 에릭 슈미트 구글 회장과 포토 세션을 갖고 있다.

이 설명을 들은 이세돌 9단은 "지난 기자회견에서는 알고리즘을 전혀 이해 못 했는데 지금은 조금이나마 이해할 수 있다"며 "내일 바로 시작이라 긴장감이 있다"고 말했다.


자신의 승률을 조금 낮춘 이유는 알파고의 직관 능력에 대한 평가가 달라졌기 때문이다.


그는 "아무래도 인간의 직관력과 감각을 인공지능이 따라오기는 무리가 아닐까 생각한다"면서도 "이번에 알고리즘 설명을 들으면서 인공지능이 직관을 어느 정도 모방할 수 있겠다는 생각이 들었다"고 밝혔다.



이세돌 9단은 "물론 질 수도 있다. 그러나 바둑의 아름다움, 인간의 아름다움을 컴퓨터가 이해하고 두는 게 아니어서 바둑의 가치는 계속될 것"이라고 강조했다.


그는 "내일 좋은 바둑, 재밌는 바둑, 아름다운 바둑을 두겠다"고 각오를 밝혔다.


abbie@yna.co.kr

연합뉴스  송고시간 | 2016/03/08