"인간 지식 없이 알파고에게 모든 기술 전수받아"

알파고의 최신 버전 '알파고 제로'가 공개됐다. [ITmedia 웹사이트 캡쳐]

[공감신문] 지난해 '인공지능(AI)'을 최고의 화두로 떠오르게 했던 바둑 인공지능(AI) 프로그램 '알파고(Alpha Go)'가 한층 업그레이드됐다는 소식이 전해졌다. 

최신 버전인 '알파고 제로'는 인간 바둑 고수들은 물론이고 기존 버전의 알파고들을 압도하는 능력을 갖추고 있다. 

주목할만 한 점은 알파고의 기존 버전들은 인간이 입력한 전략, 기보 등을 학습하는 방식으로 바둑을 배워왔는데, 알파고 제로가 교과서나 기보 없이 순수 독학으로 바둑을 익혔다는 것이다. 

연구진은 인간의 한계를 초월하는 '강화학습(Reinforcement learning)' 방식 인공지능 연구의 중요한 이정표가 될 것이라 강조했다. 

알파고 제로는 인간의 사전지식이 전혀 없는 상태에서 독학만으로 스스로 실력을 쌓았다. [Deep Mind]

구글 딥마인드의 창업자 데미스 허사비스 CEO를 비롯한 회사 소속 연구원들은 19일 이 같은 내용을 담은 '인간 지식 없이 바둑 마스터하기(Mastering the Game of Go Without Human Knowledge)'라는 논문을 과학 학술지 '네이처'에 발표했다. 

알파고 제로는 바둑 규칙 외 아무런 사전 지식 없는 상태의 신경망에서 '셀프 바둑'을 두면서 스스로 바둑의 이치를 터득했다. 자체적으로 데이터를 쌓으면서 승률을 높이는 좋은 수를 고민하고, 바둑을 이해하는 수준을 점점 높인다. 

알파고 제로는 한동안 '어이없는' 수를 두는 등 기존 버전들에 비해 약했으나, 강화학습을 시작하고 며칠 후에는 오히려 훨씬 강해졌다. 강화학습 방식으로 바둑을 깨우친 알파고 제로는 지금까지 나온 버전들 중 가장 강력한 것으로 알려졌다. 

특히 똑같은 알파고 제로끼리 비교를 해도 하루쯤 후에는 강화학습만으로 스스로 공부한 쪽이 인간으로부터 '지도 학습'을 받은 경우보다 뛰어나는 등 실력차가 나타났다. 

또 작년 3월 '구글 딥마인드 챌린지'에서 이세돌 9단을 5전 4승 1패로 이긴 버전의 알파고('알파고 리'로 지칭)와 비교했을 때, 알파고 제로는 36시간의 독학 끝에 이 버전의 실력을 뛰어넘었다.

알파고 제로가 스스로 깨우친 정석. [네이쳐 제공]

이밖에 알파고 제로가 72시간의 독학을 한 후 작년 이세돌 9단과 알파고 리의 대국 당시와 동일한 조건(제한시간 2시간씩)에서 알파고 리와 대결해도 100전 100승의 무패를 기록했다. 

알파고 제로가 한 수에 0.4초가 걸리는 '초속기' 바둑으로 490만판의 '셀프 바둑'을 통해 스스로 공부한 결과다. 

알파고 제로가 40일에 걸쳐 2900만 판을 독학한 이후에는 지난 5월에 있었던 세계랭킹 1위 커제 9단을 3대 0으로 꺾은 '알파고 마스터' 버전의 실력마저 압도했다. 알파고 제로는 알파고 마스터에 100전 89승 11패를 거뒀다. 

한편, 알파고 제로는 독학 과정에서 인간이 알고 있는 정석을 스스로 꺠우쳤을 뿐 아니라 자신만의 독특한 정석을 개발하기도 했다. 

데미스 허사비스와 논문 공동 제1저자 3명 중 한 명인 데이비드 실버는 알파고 제로가 기존 버전보다 강한 이유에 대해 "인간 지식의 한계에 더 이상 속박되지 않기 때문"이라 설명했다. 

딥마인드의 허사비스 CEO는 알파고 제로가 인간 지식의 한계에 속박되지 않은 점이 강점이라고 설명했다. [Deep Mind]

기존의 알파고 버전들은 일부 정석 등을 인간으로부터 배웠고, 인간이 둔 기보도 공부했다. 그러나 알파고 제로는 인간의 지식이 전혀 없는 상태에서 학습을 시작했기에 인간의 선입견이나 한계에 매여있지 않다는 얘기다. 

이는 인간의 직관이 전혀 통하지 않았던 분야에 AI를 적용하면 인간을 초월하는 성과를 낼 수 있음을 시사하는 바이기에 더더욱 주목되는 부분이다. 

허사비스 CEO는 "우리 프로그램 중 가장 강력한 버전인 알파고 제로는 사람이 만든 데이터를 입력하지 않아도 될 뿐아니라 컴퓨팅 파워도 덜 든다"고 설명하면서 "불과 2년만에 알파고가 얼마나 멀리 왓는지를 보면 놀라울 따름"이라 소감을 밝혔다.

저작권자 © 공감신문 무단전재 및 재배포 금지