‘스타2’ 프로게이머 꺾은 구글, AI 경쟁 또 앞서나가(종합)

난도 높은 스타2도 정복 수순
조종 영역 인간 수준으로 제한하자 프로게이머에 패배
AI끼리 일주일 대전하며 학습
인간 기준 200년에 달하는 시간
텐센트·오픈AI 등도 전략게임 AI 개발 중

'알파스타'의 의사결정 과정(사진=딥마인드 유튜브 캡처).

[아시아경제 조한울 기자] 구글의 인공지능(AI) ‘알파스타’가 스타크래프트2 격전에서 인간 프로게이머를 꺾었다. 알파고가 바둑에서 지성(知性)의 향연을 펼친 데 이어 게임에서 인간의 사고(思考)를 또 다시 능가한 것이다. 스타크래프트2는 바둑에 비해 전략적이고 창의적인 판단이 필요하다는 점에서 알파스트가 알파고를 거치면서 학습능력이 더욱 빠르게 진화한 것으로 풀이된다.

구글의 자회사인 딥마인드는 25일 오전 알파스타가 인간 프로게이머를 꺾는 모습을 인터넷으로 중계했다. 지난달 유럽 정상급 프로게이머를 딥마인드의 영국 본사에 초청해 10경기를 치렀고, 이날 알파스타의 능력을 제한한 채로 추가로 한 경기를 추가한 것이다. 알파스타는 이 중 마지막 경기를 뺀 모든 경기에서 승리했다. 상대 프로게이머들은 지난해 말 열린 스타크래프트2 세계 대회에서 13위와 44위를 기록한 실력자들이었다.

수십분간 넓은 전장에서 수백개의 유닛을 조종해야 하는 전략게임 스타크래프트는 경우의 수가 너무 많아 AI가 정복하기 어려운 영역으로 알려져 있었다. 딥마인드는 세계 최초 비디오게임인 아타리를 플레이하는 AI 이후 바둑을 두는 . 이들 종목에 비해 스타크래프트2는 훨씬 방대한 전장을 가지고 있으며, AI가 습득하는 정보도 불완전하다. 상대가 어떤 행동을 하는지 오로지 정찰을 통해서만 알 수 있기 때문이다. 상대의 전술을 맞받아칠 전술도 필요하다. 프로게이머는 이 점을 파고들어 ‘카운터’ 공격을 날렸지만 알파스타는 압도적인 분산 조종 능력으로 승리를 거머쥐었다.

'알파스타'의 플레이 화면(사진=딥마인드 유튜브 캡처).

딥마인드가 공개한 알파스타의 훈련법은 알파고가 바둑을 배운 방법과 비슷하다. 개발 초기에 알파스타는 이미 공개된 인간 선수들의 경기 내용을 보고 인간의 전략을 흉내냈다. 딥마인드는 이 알파스타를 여러 버전으로 나눈 후 서로 일주일간 대전하며 학습하게 했다. 스타크래프트 스페인 대회 우승자 출신인 오리올 비냘스 딥마인드 연구원에 따르면 알파스타가 일주일간 연습한 양은 인간 기준으로 200년에 해당한다. 이 훈련 후 딥마인드는 최상위 알파스타 다섯개를 뽑아 두 선수와 대결하게 했다. 각각의 알파스타는 서로 다른 전략을 구사했다. 인간이 사용하지 않을 전략을 쓴 알파스타가 있는 반면, 인간과 유사하게 게임을 진행한 알파스타도 있었다.

딥마인드 뿐 아니라 다른 기업들도 AI의 가능성을 게임에서 타진하고 있다. 중국 텐센트는 스타크래프트2를 플레이하는 AI를 개발하고 있다. 텐센트가 지난해 9월 발표한 논문에 따르면 이 AI는 상위 30~50% 구간의 일반인들과 20번 겨뤄 4번 승리했다. 테슬라 창업자인 앨런 머스크 등 미국 실리콘밸리 거물들이 설립한 오픈AI는 팀 단위로 맞붙는 전략게임인 를 개발하고 있다. 이창율 NHN엔터테인먼트 게임AI팀장은 “스타크래프트는 바둑에 비해 고려해야 할 요소가 훨씬 많다는 점에서 이번 승리가 대단하다”라면서 “막대한 예산과 고급인력들을 투입해야 AI를 개발할 수 있다는 점에서 우리에게 시사하는 바가 크다”고 말했다.

조한울 기자 hanul0023@asiae.co.kr<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

4차산업부 조한울 기자 hanul0023@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스