시시각각 베팅 대응, 페이스북 포커AI 개발 성공

체스와 바둑에 이어, 포커 인공지능(AI) '챔피온' 등장
페이스북 개발 완료, 부정 방지 위해 개발코드 비공개
전작, 美 카네기멜론 '리브라투스' 포커AI 보다 고성능

체스와 바둑(이상 완전 정보 게임)에 이어 포커 게임을 점령한 인공지능(AI)이 등장했다.

벤처비트는 28일(현지 시간) 순간 베팅(판돈 걸기)변화 등 변화무쌍한 '불완전 정보' 게임 전략을 구사하는 포커(Poker)인공지능을 페이스북 연구팀이 개발했다고 보도했다.

페이스북은 이를 '신념기반 회귀학습 알고리즘, ReBeL(Recursive Belief-based Learning)'이라 이름지었다. ReBeL은 강화 학습과 검색으로 훈련된 인공지능 모델이다. 강화 학습은 여러 선택지 중 보상을 최대치로 받을 수 있는 순으로 행동하는 것. 검색은 시작에서 목표 상태까지 이동하는 과정을 뜻한다.

포커AI는 오직 주어진 정보만으로 달라지는 미래 상황에 대한 최적 전략을 인공지능이 찾아낸다는 의미를 가진다. 즉, 시시각각 변하는 베팅 등 변수를 대응하므로, 사전에 정해진 규칙에 따르는 바둑 등 '완전 정보 게임'보다 전략 구사가 까다롭다.

페이스북 연구팀은 "ReBeL은 불완전 정보 게임의 해결책"이라며 "자기 강화 학습을 통해 두 AI 모델인 가치 네트워크와 정책 네트워크를 훈련해 인간을 상대할 수 있는유연한 알고리즘이 탄생했다"고 밝혔다.

연구팀은 또 "기존 포커AI는 게임 할 때 생기는 변수를 다시 학습했지만 ReBeL은 게임 중 배팅 크기 등 변경 사항이 있어도 실시간으로 바로 학습한다"면서 "악용 방지 위해 ReBeL 코드는 공개하지 않는다"고 말했다.

ReBeL은 불완정한 정보를 바탕으로 대응해야하는 상황, 즉, 경매ㆍ협상ㆍ사이버 보안ㆍ자율 주행 등 다양한 분야에 활용될 것으로 전망된다.

ReBeL은 2015년 미국 카네기멜론대에서 개발한 리브라투스(Libratus)와 비교해 플레이어 당 16만 5000점을 기록했다. 리브라투스 14만 7000점 달성에 비해 높은 수치다.

[Life & 교육] 카카오톡 챗봇 유료화, "요금 비싸다" 논란

[Life & 교육] GPT3, 전세계에 강펀치! 구글ㆍ네이버 검색량 최고치

[AI & Tech] "GPT3 너는 대체?" 전문가도 놀라는 AI능력

2021년 유망 AI·데이터 사이언스 대학원 베스트 10

GPT-3 활용 사례 BEST 5

AI로 '트롤 게시물' 추적한다...美프린스턴대, ML 시스템 개발

이윤정 기자 elin@aitimes.com

다른기사 보기

상단영역

본문영역

SNS 기사보내기