오픈AI의 '소라'가 게임 콘텐츠를 학습한 것 같다는 주장이 나왔다. 전날 마르케스 브라운리의 유튜브 동영상 학습 의혹에 이어 본격적으로 저작권 문제가 불거지고 있다.
테크크런치는 11일(현지시간) 소라가 기존 게임 이미지와 매우 흡사한 결과물을 출력했다며 법률 전문가를 인용, 문제가 될 수 있다고 보도했다.
오픈AI는 소라 훈련에 어떤 데이터를 사용했는지 정확하게 밝힌 바 없다. 그러나 일부 데이터는 게임 동영상이나 트위치 등 스트리밍 영상에서 나왔을 가능성이 높다는 것이다.
그 예로 닌텐도의 '슈퍼 마리오'처럼 보이는 비디오를 생성할 수 있다고 소개했다. 또 '콜 오브 듀티'나 '카운터 스트라이크'처럼 보이는 1인칭 슈팅 게임 영상, 1990년대 유행한 닌자 거북이 영상도 제작했다고 전했다.
특히 트위치 스타일의 스트리머 영상에서는 인기 스트리머의 모습이 그대로 담겼다고 전했다. 문신까지 같은 인물의 것이 출력됐다는 설명이다.
물론 소라는 일부 IP에 대해서는 출력을 거부한 것으로 알려졌다. '모탈 컴뱃'을 그 예로 들었다.
오픈AI는 소라 학습 데이터에 대해 "공개적으로 사용 가능한 데이터"를 사용했다고 밝혔다. 하지만 상기한 게임들은 공개적으로 사용할 수 있는 콘텐츠가 아니다.
전문가들은 이에 대해 법적인 문제가 발생할 소지가 크다고 전했다.
조쉬아 와인젠스버그 프라이어리 캐시맨 IP 담당 변호사는 "생성 AI 모델을 훈련하는 데 게임을 플레이하는 영상이 포함됐다면 저작권 문제가 발생할 가능성이 매우 높다"라고 밝혔다.
또 에반 에버리스트 도르시 앤드 휘트니 저작권 전문 변호사는 "게임 플레이 영상은 게임 제작사뿐 아니라 게임을 플레이하고 영상을 올린 스트리머, 또 게임 맵을 만든 제작자 등 3계층에서 저작권 문제가 생길 수 있다"라고 지적했다.
게임 업계에서는 저작권에 관한 소송이 잦은 편이다. 슈퍼 마리오의 닌텐도도 IP에 대한 강력한 보호 정책을 펴고 있다.
테크크런치는 오픈AI가 처음에는 논평 요청에 응답하지 않았으나, 이후 "팀에 확인하겠다"라고 전한 것으로 알려졌다. 또 에픽이나 마이크로소프트, 유비소프트, 닌텐도, 로블록스 등도 응답이 없었다고 밝혔다.
한편, 유튜버 마르케스 브라운리는 소라 리뷰 중 자신의 영상을 학습한 증거를 찾아낸 것 같다고 밝혀 눈길을 끌었다. 이는 트위치 스트리머와 거의 흡사한 내용으로, 그의 영상 중 등장하는 일부 세트가 그대로 복제됐다는 내용이다.
임대준 기자 ydj@aitimes.com
