이세돌 9단과 싸울 구글 AI '알파고', 이렇게 준비했다.
상태바
이세돌 9단과 싸울 구글 AI '알파고', 이렇게 준비했다.
  • by 정보라
바둑 아마추어가 만든 바둑 프로그램이 이세돌 9단에게 도전장을 던졌다.

구글의 바둑 두는 인공지능 프로그램 ‘알파고’가 유럽의 바둑 고수 '판 후이'를 꺾고 다음 상대로 한국의 '이세돌' 9단을 지목했다. 바둑 세계 랭킹 사이트인 고랭킹닷오아르지에서 확인하면, 판 후이는 633위, 이세돌은 5위다. 이세돌은 스물한 살에 바둑 최고 단인 9단이 된 뒤로 세계 정상의 자리를 지키고 있다. 판 후이와 비교할 상대가 아니다. 알파고가 판 후이와 5일 동안 치뤄진 5경기에서 모두 이겼다고 해도 무모한 도전이다.

이세돌 9단과 대결을 앞둔 알파고의 심경을 1월 28일, 구글코리아에서 들어봤다. 알파고가 인공지능 프로그램인 것을 감안, 알파고의 두 개발자에게 대신 들었다. 두 사람은 영국의 딥마인드의 대표이자 구글 엔지니어링 부사장과 리서치 사이언티스트인 데미스 하사비스와 데이비드 실버다. 기자들과 대화는 구글 행아웃을 이용해 영상으로 했다.


알파고를 개발한 딥마인드의 대표 데미스 하사비스(왼쪽)와 데이비드 실버 리서치 사이언티스트

불과 1,2년 전만 해도 인공지능이 바둑에서 사람을 이기려면 짧게는 십여 년, 길게는 이삼십 년 걸릴 것이라는 예측이 있었다. 알파고는 이 예상을 깨고 유럽 바둑 챔피언인 판 후이를 꺾었다. 경기는 2015년 10월 영국 런던의 딥마인드 사무실에서 열렸는데 딥마인드는 경기 결과를 1월 28일 공개했다. 알파고가 판 후이를 꺾은 비결을 기술한 논문을 같은 날 과학잡지 '네이처'에 게재한 날이었다.

데미스 하사비스 딥마인드 대표는 “게임은 인공지능 알고리즘을 테스트하는 데 중요하다”며 “궁극적으로 이 기법으로 현실 세계의 문제에 적용하고자 한다”며 알파고를 구성하는 기술이 지금은 바둑을 하는 데 쓰이지만, 의료 진단이나 기후 모델링 등에 쓰일 것이라고 말했다.
그는 알파고의 이름을 ‘알파고’라고 지은 까닭에 대해선, “국제적인 느낌이 나고 ‘알파’라는 단어는 최고 또는 리더라는 느낌을 주고, 구글의 모회사 이름이 ‘알파벳’이기 때문에 ‘알파고’라고 지었다”고 말했다. ‘고’는 바둑을 이르는 영어 단어이다.

알파고는 인공지능 프로그램이다. 눈과 손이 달린 로보트가 아니다. 때문에 착수를 직접하지 못한다. 데이비드 실버나 딥마인드의 직원이 착수하고, 컴퓨터에 이를 입력한다. 상대편 선수가 착수하면 그 정보 또한 따로이 입력한다. 알파고는 입력된 정보를 바탕으로 형세를 파악하고, '몬테카를로 트리탐색'이라는 방식으로 다음 수를 예측하여 딥마인드가 사전에 입력한 제한 시간 내에 최상의 수를 찾아낸다. 바둑 게임 가운데 컴퓨터와 대국하기를 선택하면, 간혹 엉뚱한 데에 착수하는 때가 있다. 데이비드 실버는 알파고도 그런 실수를 할 가능성이 있지만, 훈련을 통해 실수할 확률을 낮춘다고 말했다.



2015년 알파고와 판 후이 대국 모습(구글 딥마인드 유튜브)

데미스 하사비스와 데이비드 실버는 알파고가 프로 바둑 기사를 상대로 이긴 첫 인공지능 바둑 프로그램이 된 비결로 경우의 수를 무작정 계산하지 않는 점을 꼽았다. 바둑은 경우의 수가 체스의 구골(10의 100제곱)배 이상 많다. 일일이 세면 우주의 원자 수보다 많다. 독자를 위해 그 수를 여기에 써보겠다.

1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000가지다.
셀 수가 없다. 제 아무리 컴퓨터래도 이만큼의 경우의 수를 다 계산하기가 쉽지 않다. 그래서 인공지능을 연구하는 사람에게 바둑은 도전과제였다. 등반가에게 히말라야 정상이 ‘꼭 한 번 가보고 싶은’ 곳이라면 인공지능 연구자에게 바둑은 히말라야 정상이었다.
 

체스는 바둑보다 수를 예측하기가 쉽다. 경우의 수도 바둑보다 적다. (이미지: 구글 딥마인드 유튜브)

알파고는 앞서 언급한 몬테 카를로 탐색 트리와 심층 신경망을 결합한 시스템이다. 심층 신경망은 가치망과 정책망으로 구성되는데 가치망은 승자를 예측하고, 정책망은 다음 돌을 어디에 놓을지 선택한다. 몬테 카를로 탐색 트리는 무작위로 바둑돌을 두면서 최적의 수를 찾는 방식인데 인공지능뿐 아니라 통계에서도 널리 쓰인다. 지금까지 나온 바둑 두는 인공지능 프로그램은 몬테 카를로 탐색 트리를 무작정 썼다면, 알파고는 불필요한 예측하기를 줄였다. 모든 경우의 수를 탐색하는 게 아니라, 남은 경기를 상상하면서 대국을 하고 상상 속 경기에서 정책망이 좋은 수를 찾고, 가치망이 각 수의 승률을 따진다. 정책망은 좋은 수를 찾을 때 과거에 공부한 내용을 활용하는데 데이비드 실버는 “선생님이 옆에 앉아서 훈수두는 것과 비슷”하다고 설명했다.



알파고는 위와 같은 과정으로 바둑의 수를 예측했다.(이미지: http://mcts.ai) 그걸 반복하면 아래 그림처럼 될 것이다. (이미지: 구글 딥마인드 유튜브)



이미지: Mastering Game of Go with Deep Mind and Tree Search


알파고는 한 수 한 수 둘 때마다 다음 수를 어떻게 둘지 고민하는데 판 후이와 대국할 때 3초만에 결정했다. 대국 시간은 1시간이었다. 판 후이와 대결하기 전 다른 인공지능 바둑 프로그램과 한 대국에서는 다음 수를 검색하는 시간이 5초였다.

지금까지는 알파고가 대국을 어떻게 하는지에 대한 얘기였다. 대국을 앞두고는 사람처럼 훈련을 한다. 이 훈련을 강화학습이라고 한다. 1997년 사람과 체스하여 이긴 '딥블루'나 미국 퀴즈쇼에 출연한 IBM의 '왓슨'은 예상 가능한 모든 경우의 수를 입력받은 뒤 결전에 임했다. 시험으로 치면 족집게 과외를 받은 셈이다. 데미스 하사비스와 데이비드 실버는 알파고가 바둑 경기를 보면서 혼자 공부했다고 말했다. 알파고에 바둑 규칙을 일일이 입력한 적이 없다는 얘기다. 알파고는 스스로 깨우친 인공지능 바둑 프로그램이다.

알파고는 4주 동안 쉬지 않고 바둑을 배웠다. ‘쉬지 않고’를 우리의 삶에 대입하여 상상하지 말자. 알파고는 컴퓨터이다. 구글의 클라우드 플랫폼을 쓰는 컴퓨터다. 그동안 치른 대국만 100만 번이다. 알파고는 사람처럼 매 대국을 하며 실력을 키웠다. 사람 선수(!)가 일 년에 바둑을 천 번 둔다고 치면, (우리는 계산이 불가하다. 데이비드 실버에게 물었다.) 1천 년이 걸릴 것이다.

알파고는 바둑을 독학하고서 선배 기사를 찾았다. 그들은 알파고 이전에 나온 인공지능 바둑 프로그램이다. 젠, 크레이지스톤, 파치, 푸고, Gnu고 등이다.  이들과 대국을 500번 했는데 499번 이겼다. 네 수를 접고 한 경기에서도 알파고는 이겼다.


알파고가 선배 인공지능 바둑 프로그램과 겨룬 내용. 인공지능 바둑 프로그램은 대국 조건을 위와 같이 기록한다.

 
알파고는 대승을 거두고 나서 기세등등한 여파를 몰아서 유럽 바둑 선수권을 세 번 연속 제패한 판 후이를 찾았는데 완승을 거뒀다. 그러고 나서 다음 상대로 이세돌 9단을 지목했다. 오는 3월 알파고는 서울에서 이세돌 구단과 대국을 벌인다. 경기 일자와 경기 방식, 온라인 생중계 등 경기의 일체에 관한 정보는 극비다. 

데미스 하사비스는 “우리는 엔지니어이지 바둑 아마추어”라면서 “아마추어가 만든 알파고의 바둑 스타일에 프로기사가 무어라 평할지 듣고 싶다며 그래서 3월 경기가 기대가 된다”고 말했다. 반드시 이기겠노라고 결연한 의지를 보여도 시원찮을 판에 ‘평가를 듣고 싶다’는 말이라니. 

이세돌 9단은 구글에 이러한 메시지를 남겼다. “결과에 상관 없이 바둑계 역사에 의미 있는 대결이 될 것이다. 구글 딥마인드 인공지능의 실력이 이미 상당하며 지속적으로 향상되고 있다고 들었지만, 적어도 이번에는 내가 이길 자신이 있다.”

한국기원 양재호 사무총장도 이세돌 9단의 승리를 예측했다. “이세돌 9단이 강력한 컴퓨터 AI와 대결해 본 경험이 없다 보니까 AI가 한두 판 정도 이길 수도 있겠습니다만, 컴퓨터가 모든 경기를 이길 수 있을지는 의문이다.”

3월 대국 소식을 듣고 나도 주위의 사람들에게 물었다. “누가 이길 것 같으냐” 다들 “당연히 이세돌 9단이지.(코웃음)”

데미스 하사비스에도 승률을 물었다. 그는 “50대 50이다. 우리는 굉장히 자신이 있지만, 이세돌 9단도 상당히 자신이 있기 때문에 50대 50이라고 본다”며 “지금은 대국의 승패 이후의 계획보다 대국에만 신경을 쓰고 있다”고 말했다.


  [리뷰전문 유튜브 채널 더기어TV]
이 기사를 공유합니다
ABOUT AUTHOR

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
COMMENT 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.