시시각각 베팅 대응, 페이스북 포커AI 개발 성공
상태바
시시각각 베팅 대응, 페이스북 포커AI 개발 성공
  • 입력 2020-07-29 15:42
  • 댓글 0
이 기사를 공유합니다

체스와 바둑에 이어, 포커 인공지능(AI) '챔피온' 등장
페이스북 개발 완료, 부정 방지 위해 개발코드 비공개
전작, 美 카네기멜론 '리브라투스' 포커AI 보다 고성능

체스와 바둑(이상 완전 정보 게임)에 이어 포커 게임을 점령한 인공지능(AI)이 등장했다.

벤처비트는 28일(현지 시간) 순간 베팅(판돈 걸기)변화 등 변화무쌍한 '불완전 정보' 게임 전략을 구사하는 포커(Poker)인공지능을 페이스북 연구팀이 개발했다고 보도했다.

페이스북은 이를 '신념기반 회귀학습 알고리즘, ReBeL(Recursive Belief-based Learning)'이라 이름지었다. ReBeL은 강화 학습과 검색으로 훈련된 인공지능 모델이다. 강화 학습은 여러 선택지 중 보상을 최대치로 받을 수 있는 순으로 행동하는 것. 검색은 시작에서 목표 상태까지 이동하는 과정을 뜻한다.

포커AI는 오직 주어진 정보만으로 달라지는 미래 상황에 대한 최적 전략을 인공지능이 찾아낸다는 의미를 가진다. 즉, 시시각각 변하는 베팅 등 변수를 대응하므로, 사전에 정해진 규칙에 따르는 바둑 등 '완전 정보 게임'보다 전략 구사가 까다롭다. 

페이스북 연구팀은 "ReBeL은 불완전 정보 게임의 해결책"이라며 "자기 강화 학습을 통해 두 AI 모델인 가치 네트워크와 정책 네트워크를 훈련해 인간을 상대할 수 있는유연한 알고리즘이 탄생했다"고 밝혔다.

연구팀은 또 "기존 포커AI는 게임 할 때 생기는 변수를 다시 학습했지만 ReBeL은 게임 중 배팅 크기 등 변경 사항이 있어도 실시간으로 바로 학습한다"면서 "악용 방지 위해 ReBeL 코드는 공개하지 않는다"고 말했다.

ReBeL은 불완정한 정보를 바탕으로 대응해야하는 상황, 즉, 경매ㆍ협상ㆍ사이버 보안ㆍ자율 주행 등 다양한 분야에 활용될 것으로 전망된다.

ReBeL은 2015년 미국 카네기멜론대에서 개발한 리브라투스(Libratus)와 비교해 플레이어 당 16만 5000점을 기록했다. 리브라투스 14만 7000점 달성에 비해 높은 수치다. 

[Life & 교육] 카카오톡 챗봇 유료화, "요금 비싸다" 논란

[Life & 교육] GPT3, 전세계에 강펀치! 구글ㆍ네이버 검색량 최고치

[AI & Tech] "GPT3 너는 대체?" 전문가도 놀라는 AI능력

기자 프로필


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
유용한 리스티클
  • 영국의 5대 AI 기업
  • 개발자가 가장 많이 사용하는 오픈소스는 '제이쿼리'
  • 네이버는 줄이고, 카카오는 늘리고...양사 계열사 현황
  • 신제품 개발을 개선하는 10가지 방법
  • AI 접목 패션업계, 사용자 수 증가 효과