스테이블 디퓨전의 데이터셋에 포함된 '고흐' 풍 작품들. haveibeentrained.com에서 '고흐'로 검색한 결과다.(사진=haveibeentrained.com)
스테이블 디퓨전의 데이터셋에 포함된 '고흐' 풍 작품들. haveibeentrained.com에서 '고흐'로 검색한 결과다.(사진=haveibeentrained.com)

'달리'와 '스테이블 디퓨전' 같은 이미지 생성 인공지능(AI) 모델 보급이 늘면서 화가들이 자신의 저작권을 보호하기 위해 움직이기 시작했다.

이미지 생성 AI는 웹이나 소셜네트워크서비스(SNS) 등에서 무작위로 데이터를 수집해 학습하기 때문에 부지불식간에 자신의 작품이 이용된다는 사실을 확인한 때문이다.

AI 훈련 데이터에 자신의 작품이 포함됐는지 여부를 파악할 수 있는 프로그램도 개발했다. 하지만 아직은 무작위로 검색한 데이터에 자신의 작품이 포함된 사실을 확인하더라도 저작권을 침해했다고 주장하기가 모호한 상황이라 근본적인 해법 마련을 위한 교통정리가 필요하다는 지적이다. 

저작권 보호를 위해서는 웹이나 SNS 등에 공개하는 작품에는 '워터마크'를 삽입하는 방안도 고려할만 하다. 차후 저작권료를 받을 수 있는 근거자료로 활용하거나 무작위 검색에 포함되지 않도록 하는 데 유용할 것으로 보인다.

오픈소스로 공개한 '스테이블 디퓨전'이 훈련 데이터셋을 공개한 것이 발단이 됐다. 이를 토대로 데이터셋에 자신의 작품이 이용됐는지를 파악할 수 있는 프로그램도 개발할 수 있었다.

이 프로그램에 대해서는 CNN이 최근 집중 보도했다. 독일 아티스트인 매튜 드라이허스트와 홀리 헤른돈은 예술가 저작권을 보호한다는 취지로 지난달 데이터셋 검색 엔진을 개발, '해브아이빈트레인드 닷 컴(https://haveibeentrained.com/)'이라는 사이트에 올려 누구나 이용할 수 있도록 했다는 내용이다.

이 사이트에 특정 작가 이름이나 작품 이미지를 입력하면 '스테이블 디퓨전'의 학습 데이터셋에 특정 작가의 작품이 포함됐는지를 검색할 수 있다. 

실제로 한 미국 화가가 스테이블 디퓨전의 훈련 데이터 가운데 1200만개를 검색한 결과 3854개 이미지에서 작품이 사용된 사실을 찾아냈다. 

그는 자신의 동의 없이 훈련 데이터로 사용한 것에 불만을 토로하며, 저작권 있는 이미지로 훈련한 AI 시스템을 누군가 이용해 다른 이미지를 생성한 뒤 돈을 받고 팔았다면 원작자에게 보상해야 한다고 주장했다.

해브아이빈트레인드닷컴 사이트에서는 원작자에게 사전에 작품 사용을 동의하는 '옵트인'과 쓰지 못하게 거부하는 '옵트아웃' 가운데 하나를 선택해 입장을 공표하도록 하고 있다. '합의된 데이터 수집'이라야 모든 사람에게 이익이 된다는 사실을 분명히 하겠다는 의도다.

이마드 모스타크 스태빌리티AI CEO
이마드 모스타크 스태빌리티AI CEO

이에 대해서는 이마드 모스타크 스태빌리티AI CEO도 대체로 수긍한다는 반응을 보였다. 데이터베이스에 있는 콘텐츠를 관련 커뮤니티가 더 많이 통제할 수 있도록 하는 방법을 모색하고 있다는 것이다. 옵트아웃 방식의 데이터셋 통제에 대해서도 "열려 있다"는 입장을 밝혔다.

이미지 생성AI의 결과물에 대한 예술가들의 저작권 주장이 현실적으로는 효과가 없을 수 있다. 자르 사이드 워싱턴 대학교 법학교수는 "AI 생성 이미지가 반드시 예술가의 저작권을 침해한다고 하기 어렵다"면서 "만약 그렇게 한다면 본질적으로 기계학습은 불가능하다"고 지적했다.

이에 유명 화가인 타라 맥퍼슨은 CNN과의 인터뷰에서 "이미지 생성AI 때문에 직업을 잃게 될 가능성을 우려해 온라인에 작품을 게시할 때 워터마크를 넣는 방안에 대해 고심했다"면서 그러나 "동료들이 예술을 망치고 사람들이 작품을 보며 영감을 얻는 즐거움을 망친다"며 반대했다고 전했다.

한편 스태빌리티AI CEO는 "창작자가 보상을 받을 수 있는 방법을 찾고 있으며 곧 실용적인 방안을 내놓고 전문가들의 의견을 수렴할 것"이라고 밝혔다.

또 사진과 이미지 판매 사이트인 셔터스톡은 오픈AI의 '달리'로 만든 이미지를 판매하기로 하면서 AI 생성물이나 훈련데이터에 포함된 원작의 제작자들에게 모두 보상을 할 방침이라고 발표한 바 있다.

결국 이미지 생성 AI와 관련한 저작권 문제는 원작자들이 데이터 통제권을 확보하거나 작품 사용에 대한 보상을 받는 방향으로 풀려 나갈 공산이 크다.

다만 이 과정에서 저작권의 예외가 인정되는 '공정 이용' 개념과 '적절한 보상 수준'에 대해서는 충분한 컨센서스가 형성되기까지는 여전히 많은 논란과 진통이 불가피할 것으로 보인다.

정병일 위원 jbi@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지