미국 작가 3명이 앤트로픽의 챗봇 '클로드'가 저작권 데이터를 무단으로 학습했다며 소송을 제기했다. 앤트로픽은 지난해 10월 유니버셜뮤직 등 음반사로부터 저작권이 있는 노래 가사 도용 혐의로 소송을 당했는데, 작가들로부터의 소송은 처음이다. 이제부터 줄소송이 이어질 것으로 보인다.
로이터는 20일(현지시간) 미국의 작가 그룹이 앤트로픽을 상대로 샌프란시스코 연방법원에 집단 소송을 제기했다고 보도했다.
이에 따르면 소송을 제기한 작가는 안드레아 바츠, 찰스 그레이버, 커크 윌리스 존슨 등 3명이다. 이들은 앤트로픽이 클로드를 훈련시키는 과정에서 저작권이 있는 책들의 불법 복제본을 사용했다고 주장했다. 이는 '더 파일(The Pile)'이라는 불법 유통된 복제본인 것으로 알려졌다.
원고들은 앤트로픽이 AI 제품을 구축하기 위해 불법 유통된 저작물 저장소를 활용함으로써 자신들의 목표를 웃음거리로 만들었다고 주장했다. 소장에는 “앤트로픽의 모델이 각 저작물 뒤에 있는 인간의 표현과 독창성을 착취해 이익을 얻으려한다고 말하는 것은 과장이 아니다”라고 적시했다.
또 “인간은 책을 보기 위해 합법적인 복사본을 구매하거나 도서관에서 빌리며, 이는 최소한 저자와 창작자에게 어느 정도의 보상을 제공한다”라고 지적했다.
앤트로픽이 해당 데이터셋에 저작권이 있는 콘텐츠로 포함됐다는 것을 알면서도, 이를 활용했다고 주장했다. 작가들은 앤트로픽이 손해 배상금을 지급하고 저작권이 있는 자료를 사용하지 못하도록 요구하고 있다.
앤트로픽은 논평 요청에 즉각 응하지 않았다.
하지만, 앤트로픽과 다른 기업들은 AI 모델 훈련이 미국 법률의 ‘공정 사용’ 원칙에 부합한다고 주장해왔다. 이 원칙은 교육, 연구 또는 저작권이 있는 작품을 다른 것으로 변형하는 등 제한된 용도로 저작권 자료를 사용할 수 있도록 허용한다.
한편 최근 조사에 따르면 앤트로픽뿐만 아니라 애플 등 일부 빅테크가 더 파일에서 스크랩한 수천개의 유튜브 동영상 자막을 이용해 자사 AI 모델을 훈련시킨 것으로 밝혀졌다.
또 이번 사례는 앤트로픽이 본격적인 저작권 소송에 휘말릴 것을 예고하고 있다.
오픈AI의 경우 20여건이 넘는 저작권 소송에 휘말려 있는데, 상당수가 작가들로부터 제기된 것이다. 또 앤트로픽은 '클로드 3' 출시 이후 주가가 높아지며 대규모 자금 유치에 성공하는 등 이제는 소송을 걸만한 상대로 성장했다.
박찬 기자 cpark@aitimes.com
