Photo Image
이창율 NHN엔터테인먼트 게임AI팀장이 한돌을 설명하고 있다

한국판 인공지능(AI) 바둑기사 한돌이 알파고에 도전장을 내밀었다.

NHN엔터테인먼트는 23일 '한게임 바둑' AI '한돌'이 이세돌과 겨뤘던 알파고 수준을 뛰어 넘었다고 밝혔다. 이창율 NHN엔터테인먼트 게임AI팀장은 이날 성남시 플레이뮤지엄에서 “현재 이세돌과 겨뤘던 알파고 리와 인간 9단 수준을 넘어서는 기력”이라며 “알파고 최신 버전 제로와는 겨뤄볼 기회가 없어 아직 우위를 말하기 어렵다”고 말했다. 한돌과 알파고 제로 대국을 간접적으로 신청한 셈이다.

NHN엔터테인먼트는 한돌 실력이 성장한 근거로 ELO 수치를 제시했다. 인간 9단은 3500, 알파고 리는 3700정도다. 한돌 최신버전 ELO는 4000이 넘는다. ELO가 400정도 차이나면 90% 승률을 보장한다. 실제로 한돌은 국내 프로기사 랭킹 2~5위와 대결에서 전승을 거뒀다.

바둑 AI핵심은 다음 수 예측이다. 개발 초기 한돌은 한게임 바둑 데이터 등 사람이 둔 기보를 학습해 다음 수를 예측하는 '정책망'을 사용했다. 정책망으로 후보 수를 선택한 후 자가 대국 기보로 학습한 '가치망'과 패턴으로 빠르게 둔 '롤아웃'으로 다음 수에 대한 승리 확률을 얻었다. 선택하고 얻은 수에 대한 승리 확률에 MCTS라는 수읽기 알고리즘을 사용해 다음 수를 예측했다.

버전 2.0에 들어선 한돌은 무작위·자가대국으로 만든 기보로부터 학습한다. 정책망과 가치망을 사용해 롤아웃 없이 MCTS를 통해 다음 수를 예측한다. 자가 대국을 통해 생성한 기보를 학습하는 과정을 반복해 성능을 개선한다.

NHN엔터테인먼트는 한돌로 서비스 고도화를 꾀한다. AI 레벨링 시스템을 바탕으로 맞춤형 게임서비스를 제공할 예정이다. 기력이 높은 AI뿐만 아니라 바둑을 배우고 싶고 바둑을 즐기는 모든 이용자에게 도움을 줄 수 있는 AI를 만들어 보다 더 재미있는 서비스를 만든다. 대국 중 승률이 높은 최적 다음 수를 2~5개를 제공하는 '한돌 찬스'도 제공할 계획이다.

향후 이창호풍 '한돌', 이세돌풍 '한돌' 등 기풍 변경을 통한 대국 고도화, 바둑 입문자와 청소년을 위한 교육 콘텐츠 등 지속 새로운 서비스를 추가할 예정이다.

바둑AI에 활용한 기술은 무한대에 가까운 검색공간을 가진 문제에서 정답에 가까운 솔루션을 찾는 방법이다. 많은 연구와 인력이 필요한 기존 방법과 비교하면 기본적인 규칙만 가르쳐 주면 컴퓨터 스스로 강화학습을 통해 답을 찾아낸다. 기존 해결하기 어려운 문제나 많은 노력이 필요한 문제를 보다 빨리 해결할 수 있다.

박근한 NHN엔터테인먼트 기술연구센터장은 “바둑으로 기술 개발을 시작했지만 다양한 분야에 확대 적용 가능성이 크다”며 “응용할 수 있는 다양한 분야를 찾는 게 센터 목표”라고 말했다.


현재 바둑 AI는 구글 딥마인드 '알파고(팬, 리, 마스터, 제로)', 페이스북 '엘프고', 일본 '딥젠고', 텐센트 '파인아트', 한국고등과학원 '바둑이', 카카오브레인 '오지고' 등이 존재한다. 국내 게임업계 중 자체개발해 일반인이 상시 대국 가능한 바둑AI는 한돌이 유일하다.


이현수기자 hsool@etnews.com