인공지능 슈퍼-가위바위보 소개
2017년 11월 4일
서강대학교에서 ‘인간 vs 인공지능’ 가위바위보 대회가 개최되었다. 대회는 인간부문 참가자 100명, 각자의 나름의 방법으로 알고리즘을 설계한 인공지능 부문 참가자 19팀이 참여하였다. 천만 원의 상금이 걸린 이 대결의 최종 승자는 인간 이였다. 7전 4선승 대결에서, 처음 3게임을 인공지능에게 내어준 인간은 이후 3대3 동점까지 만든 후, 마지막 극적인 승리로 역전에 성공하였다고 한다. 당시 대회의 참가자들의 인공지능 알고리즘이 어떻게 설계되었는지 알 수 없으나, 7번의 짧은 대결이었음을 미루어 짐작하면 ‘가위바위보에 대한 인간의 심리적인 성향’까지 고려한 것으로 보인다.
인공지능 슈퍼-가위바위보
수학생각(MATHOUGHT)에서 개발한 인공지능 ‘슈퍼-가위바위보’를 소개한다. 이것의 알고리즘 설계는 다음과 같다.
① 인간의 심리적인 성향은 고려하지 않는다.
① 따라서 처음 몇 게임 동안 인공지능은 임의로 가위, 바위, 보를 낸다.
② 게임의 횟수가 어느 정도 진행되면,
② 인공지능은 상대방의 패턴을 수학·통계적인 방법으로 분석하여
② 다음 게임에서 상대방이 가위, 바위, 보를 낼 확률을 각각 계산한다.
③ 이중 인간이 낼 확률이 가장 높은 것을 결정하고,
③ 인공지능은 그것을 이길 수 있는 가위, 바위, 보를 선택한다.
인공지능(슈퍼-가위바위보)은 인간의 규칙을 인식하는가?
아래의 테스트로 인공지능이 인간의 규칙을 인식하고 있음을 확인해보자!
게임1. 인간은 ‘가위➪바위➪보’를 반복해본다.
게임의 과정을 표로 정리해 보면 다음과 같다.
인공지능(AI)과의 대결 결과는 ‘3승 9패’ 이다. 그나마 처음 규칙에 대한 노출이 없는 앞의 7게임에서 3승 3무 1패로 선전하였으나, 이후 2번의 반복이 노출되자 인공지능(AI)에게 전패를 당하였다.
게임2. 위 상황에서 인간은 ‘보➪바위➪가위’로 패턴을 변경, 반복해본다.
앞에서 인간이 ‘가위➪바위➪보’ 패턴으로 내다가 ‘보➪바위➪가위’와 같이 패턴을 바꾸자 인공지능(AI)은 게임 초반에 어려움을 겪는다. 새로운 패턴으로 대응하는 인간의 규칙을 아직 찾아내지 못하였기 때문이다. 하지만 새로운 패턴이 몇 차례 반복된 후, 인공지능은 다시 승리를 되찾아 간다. 이번 게임 인간의 전적은 ‘3승 7패’ 현재까지의 총 전적은 ‘6승 16패’다.
게임3. 위 상황에서 인간은 ‘보➪가위➪보➪가위’로 패턴을 변경, 반복해본다.
이번에도 역시 앞에서 인간이 ‘보➪바위➪가위’ 패턴으로 내다가 ‘가위➪보➪가위➪보’와 같이 패턴을 바꾸자 인공지능(AI)은 게임 초반 승률이 떨어진다. 하지만 이번에는 인간의 새로운 패턴이 앞에서 보다 단조로움에 좀 더 빨리 규칙을 찾고 전승을 이어간다. 이번 게임 인간의 전적은 ‘3승 14패’ 현재까지의 총 전적은 ‘9승 30패’다.