(사진=셔터스톡)
(사진=셔터스톡)

구글의 최신 모델 '제미나이 2.5 프로'가 29년 전 출시된 고전 비디오 게임 '포켓몬 블루(Pokémon Blue)'를 클리어하는 데 성공했다. AI의 게임 수행 능력, 즉 에이전트 능력이 한단계 진화했다는 것을 보여줬다는 의미다.

순다르 피차이 구글 CEO는 4일(현지시간) X(트위터)를 통해 “정말 멋진 마무리였다. 제미나이 2.5 프로가 포켓몬 블루를 완주했다”라는 자축의 글을 올렸다.

이번 실험은 구글의 공식 프로젝트가 아니다. 조엘 Z라는 닉네임을 사용하는 소프트웨어 엔지니어가 진행한 것이다. 그는 “구글과 무관한 개인 개발자”라고 밝혔으나, 구글은 그를 응원해 왔다.

앞서 지난달에는 로건 킬패트릭 구글 AI 스튜디오 제품 책임자도 “제미나이가 포켓몬을 점점 잘 플레이하고 있다”라며 “다섯번째 배지를 획득했다. 여러번 시도 중 가장 좋은 성과”라고 밝혔다. 

이에 대해 피차이 CEO는 “우리는 이제 API, 즉 '인공 포켓몬 지능(Artificial Pokémon Intelligence)'를 만드는 중”이라며 농담을 던지기도 했다.

AI 에이전트 능력을 테스트하기 위해 게임, 특히 포켓몬을 도입한 것은 지난 2월 앤트로픽이 처음이었다.  

앤트로픽은 '클로드'가 '포켓몬 레드'라는 게임을 플레이하며 뛰어난 문제 해결 능력을 입증했다고 강조했다. 당시 앤트로픽은 클로드의 게임 플레이 영상을 트위치 채널을 통해 중계했는데, 조엘 Z라는 개발자도 여기에서 영감을 얻었다고 밝혔다.

하지만 이번 결과를 통해 제미나이와 클로드의 성능을 비교하는 것은 큰 의미가 없다고 강조했다. 조엘 Z는 “이 프로젝트를 포켓몬 플레이 능력을 평가하는 벤치마크로 보지 말아달라”라며 “제미나이와 클로드는 사용하는 도구와 받는 정보가 다르기 때문에 비교하는 것은 의미가 없다”라고 설명했다.

실제로 두 모델 모두 AI가 직접 게임을 조작하는 것이 아니라, '에이전트 하니스(agent harness)'라는 시스템을 통해 게임 화면과 추가 정보를 받아 판단을 내리고 이에 따라 버튼 입력을 실행하는 구조다.

또 이번 제미나이의 플레이에 일부 개입했지만, 이는 부정행위가 아니라고 설명했다. 그는 “특정 상황에 대한 직접적인 힌트나 공략 정보를 제공하지 않는다”라며 “제미나이가 더 나은 판단과 추론을 하도록 돕는 방식”이라고 말했다.

예외적으로, 게임에서 발생한 버그 문제를 해결하기 위해 해결법을 직접 알려준 사례도 있었다고 밝혔다. 또 이후 버그가 수정되며 이마저도 필요 없어졌다고 설명했다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지