7월 2주

(영상제작=AI타임스)

‘챗GPT’처럼 명령 글로 글이나 그림, 영상 그리고 프로그래밍 코드를 만들어 내는 생성 인공지능(AI) 도구들이 큰 암초를 만났습니다. 바로 저작권 문제입니다.

생성 AI 도구들을 훈련하는 데에는 방대한 데이터가 필요합니다. 개발자들은 이 데이터를 인터넷에서 구합니다. 웹상에 공개된 글과 이미지, 영상, 코드를 자동으로 긁어모은 다음 품질이 괜찮은 콘텐츠들을 훈련에 쓰는 건데요.

이와 관련해서 작가와 화가, 프로그래머 등 콘텐츠의 원작자들이 저작권 침해라면서 집단소송을 최근 잇달아 제기하고 있습니다. 생성 AI 도구를 만든 기업들을 상대로 본인 동의 없이 저작물을 가져다 써서 권리를 침해하고 생계를 위협하고 있다는 주장을 펴고 있습니다

언어모델과 관련해서는 오픈AI와 구글의 모기업 알파벳, 메타에 대해 최근 2주간 4건의 집단 저작권 소송이 제기됐습니다. 

이미지 생성 모델의 경우 올해초부터 ‘스테이블 디퓨전’을 개발한 스테빌리티AI를 상대로 미국 화가들이 저작권 위반 소송을 제기했고 게티이미지도 별도로 소송을 걸었습니다. 

앞서 지난해 11월에는 코드생성 AI 도구인 ‘깃허브 코파일럿’과 관련해 개발자들이 생성 AI의 훈련 데이터에 대한 첫번째 집단 소송을 제기했습니다. “오픈소스 코드를 가져다 쓰면서 라이선스를 지키지 않았고 이는 소프트웨어의 대량 도용행위”라면서 깃허브와 이를 소유한 마이크로소프트(MS), 기초 기술을 제공한 오픈AI를 상대로 소송을 제기했습니다. 

(사진=셔터스톡)
(사진=셔터스톡)

이처럼 저작권 소송이 본격화되는 추세는 예견된 것이었습니다. 훈련 데이터가 필요한 생성 AI의 속성 때문에 데이터 확보 과정에서 저작권 문제는 필연적으로 불거질 수밖에 없었습니다.

여기다 소송뿐만 아니라 규제 측면에서도 저작권 문제는 기업들 입장에서 발등에 떨어진 불이 되고 있습니다. 유럽연합이 ‘AI법(AIA)’의 초안에 생성 AI의 훈련데이터에 대해서는 저작권을 낱낱이 밝히도록 의무화하는 조항을 넣었기 때문입니다.

이 법은 실제 집행까지 아직 2년 이상이 남아 있지만 유럽연합 측이 이르면 내년부터 행정지침이나 모범규준 형태로 사실상 규제에 나서겠다는 의지를 강력하게 밝히고 있습니다.

기업들은 딱히 대책이 없다고 호소합니다. 엄청난 양의 훈련데이터에 대해 저작권을 일일이 파악하기가 기술적으로 어려워서 난감하다는 겁니다. 

그렇지만 저작권 소송을 낸 작가들은 출판물 불법 유통 사이트를 통해 흘러나온 저서들을 생성 AI 기업이 도용한 흔적을 찾아냈다는 반대되는 주장을 하고 있습니다. 화가들도 이미지 훈련 데이터에 본인 그림이 사용된 흔적을 알고리즘을 통해 확인했다고 주장합니다. 

이런 상황에서 기업들은 어렵다는 핑계로 저작권 문제를 피해 갈 수는 없어 보입니다. 결국은 저작권자들에게 보상하는 방향으로 새 기준과 관행을 마련해야 문제가 풀릴 것으로 전망됩니다, 

이와 관련해 오픈AI가 최근 셔터스톡과 6년간 데이터를 교육에 쓰는 계약을 체결하고 뉴스기업인 AP통신과도 2년간의 콘텐츠 사용계약을 맺는 등 저작권 문제의 근본적인 해결에 나서고 있어서 주목됩니다. 

이어서 기술 동향 전해드립니다.

기술 동향

2진법-3진법 전환 동작이 가능한 논리회로 원리 (그림=KAIST)
2진법-3진법 전환 동작이 가능한 논리회로 원리 (그림=KAIST)

■ 우리나라 과학자들이 높은 데이터 처리 효율성과 집적도를 제공하는 신개념 디지털 논리 회로 구현에 성공했습니다. 한국과학기술원(KAIST)과 가천대 연구팀이 협업해 이룬 성과입니다. 

논리 소자 안에 메모리 기능을 접목해서 필요에 따라 2진법과 3진법 연산이 자유자재로 전환 가능한 혁신적인 반도체 소자를 개발했습니다. 기존 메모리와 비메모리 칩 사이즈를 획기적으로 감소시키는 유망한 기술이 될 것으로 기대됩니다. 

■ 메타의 새 SNS ‘'스레드'가 출시 5일 만에 가입자를 1억명 이상 확보했습니다. 챗GPT의 경우 이용자가 1억명에 도달하는 데 두 달이 걸린데 비하면 엄청나게 빠른 속도입니다. 

스레드는 메타가 트위터와 경쟁하기 위해 내놓은 SNS로 인터페이스가 흡사합니다. 인스타그램과 연동, 이용자 확보가 그만큼 빠른 것으로 풀이됩니다. 트위터의 3억5000만명을 넘어설 가능성이 있다는 관측이 나옵니다.

(사진=셔터스톡)
(사진=셔터스톡)

■ 일론 머스크 테슬라 CEO가 AI 연구조직인 ‘엑스AI(xAI)’를 출범시켰습니다. 그는 그동안 오픈AI가 MS와 손잡으며 변질했다고 비난하면서 이에 맞설 새 연구소를 설립하겠다고 말해왔습니다.

구글 딥마인드와 오픈AI, MS 등에서 일한 전문가들로 연구팀을 꾸렸습니다. ‘우주의 본질적인 이해’라는 다소 막연한 목표를 내세웠지만, 챗GPT에 대항할 언어모델을 먼저 개발할 것으로 전망됩니다.

■ 중국 개발자 4000명이 데스크톱 운영체제(OS)인 '오픈 기린(Openkylin)'을 함께 개발해 오픈소스로 공개했습니다. ‘리눅스’ 기반으로 중국식 운영체제를 만들었습니다.

중국 측은 이로써 데스크톱 시스템의 핵심 기술을 확보해 미국에 의존해 온 상황을 벗어날 수 있을 것으로 기대하고 있습니다.

이어서 업계 주요 소식 전해드립니다.

업계 동향

(사진=셔터스톡)
(사진=셔터스톡)

■ 챗GPT 등 생성 AI의 토대가 되는 인공신경망 '트랜스포머'를 개발한 실력자들이 구글을 모두 떠나게 됐습니다. 구글은 지난 2017년에 '어텐션 이스 올 유 니드(Attention is all you need)'라는 논문을 내놓으면서 트랜스포머의 탄생을 알렸는데요, 

이 논문의 저자 중 한 사람인 일리언 존스가 이달말 구글 재팬을 사직할 예정입니다. 이로써 당시의 연구원 8명이 모두 창업 등을 이유로 퇴사하게 됐습니다. 먼저 나간 연구원들은 코히어나 캐릭터닷에이아이 등 주목받는 스타트업들에 참여하고 있습니다.

■ '독서 전용'인 가상현실(VR) 안경이 등장했습니다. 미국 스타트업 솔(Sol)이 만든 '솔 리더‘라는 제품인데요, 블루투스로 휴대폰에 연결해 전자책은 물론 인터넷 기사나 웹툰 등을 볼 수 있는 장치입니다.

확실한 사용 목적을 갖추고 거추장스러운 기능은 뺐다는 설명이지만, 가격이 45만원대로 만만치 않습니다.

(사진=셔터스톡)
(사진=셔터스톡)

■ 오픈AI가 'GPT-4'의 API, 즉 애플리케이션 프로그래밍 인터페이스를 출시했습니다. 개발자들은 API를 통해 GPT-4 모델을 애플리케이션에 통합할 수 있게 됐습니다. 

오픈 AI의 기존 유료 API 고객은 무료로 쓸 수 있답니다. 텍스트 생성 모델인 ‘GPT-3.5-터보’와 이미지 생성 모델 ‘달리(DALL-E)’, 음성인식 모델 ‘위스퍼(Whisper)’의 API도 곧 출시할 계획입니다.

■ LG유플러스와 패션 전문기업 에이션패션, 패션테크 전문 지이모션이 함께 패션 메타버스 시장에 진출합니다. LGU+의 직장인 특화 가상 오피스 서비스인 ‘메타슬랩’을 활용할 계획입니다.

이들 3사는 국내 메타버스 시장의 잠재력이 높다고 판단하고 아바타를 위한 의상 및 아이템을 제작하거나 메타버스 내 패션 의류 팝업 스토어를 운영하는 등 협업을 통해 가능성을 검증하겠다는 방침입니다.

정병일 기자 jbi@aitimes.com

키워드 관련기사
  • 'AI 신약 개발' 붐...커절리, 760억 투자 유치
  • 中, 친기업적 생성 AI 규제안 발표
  • 모든 생성 AI 모델이 EU 인공지능법 저촉돼