(사진=셔터스톡)
(사진=셔터스톡)

미국의 최대 온라인 커뮤니티 레딧의 사용자 게시글이 오픈AI의 인공지능(AI) 학습 데이터로 사용될 예정이다. 올초 구글에 이은 두번째 판매 사례로, 커뮤니티의 사용자 게시글은 AI 학습 데이터로 인기를 얻고 있다. 

블룸버그는 16일(현지시간) 오픈AI와 레딧이 데이터 라이선싱 계약을 체결했다고 보도했다. 계약 조건은 알려지지 않았다.

이에 따라 레딧은 사이트의 게시물을 '챗GPT'와 오픈AI 신제품 학습에 제공한다.

오픈AI는 레딧 사용자들을 위한 AI 기능 제공과 광고를 지원한다. 또 레딧의 데이터 API에 액세스, 레딧의 콘텐츠를 실시간으로 이용할 수 있게 됐다.

스티브 허프먼 레딧 CEO는 "레딧은 거대한 온라인 데이터 보관소"라며 "우리 데이터를 활용해 챗GPT와 같은 AI 도구를 훈련하면 더 정확하고 최신 정보를 얻을 수 있게 된다"라고 말했다.

레딧은 8270만명이 넘는 일일 활성사용자를 보유한 최대 온라인 커뮤니티다.

하지만 2005년 설립 이후 한번도 흑자를 내지는 못했다. 수익 대부분이 광고 사업에서 발생했는데, 최근 AI 데이터 부족 문제가 강조되며 데이터 라이선스 사업에 주력하고 있다. 지난 3월 기업공개(IPO)를 앞두고 데이터 판매로 새로운 수익 창출 기회를 찾겠다고 강조했다. 

지난주 분기 실적 발표에서 허프먼 CEO는 "데이터 라이선스 사업은 아직 초기 단계이며, 계속 성장하고 있다"라고 밝혔다.

레딧이 지금까지 체결한 데이터 라이선싱 계약 규모는 총 2억3000만달러(약 3000억원)다. 레딧은 앞서 구글 및 씨전과도 파트너십을 발표했다. 구글과의 계약은 연간 6000만달러(약 800억원)에 달한다. 

오픈AI와 계약 소식에 이날 5% 이상 하락했던 레딧 주가는 시간외 장에서 11% 이상 올랐다.

한편 최근 AI 학습 데이터를 둘러싼 저작권 문제가 불거지며, 관련 데이터 시장이 급속하게 커지고 있다. 

특히 커뮤니티나 SNS는 실시간 정보를 확보할 수 있는 가장 좋은 수단으로 평가된다. 뉴스나 스포츠 등 실시간 이슈가 중심으로, 다양한 뉴스 내용이 게시된다. 따라서 단일 뉴스 사이트와 콘텐츠 학습 계약을 하는 것보다 학습 데이터 확보에 효과적일 수 있다.

실제로 일론 머스크의 챗봇 '그록'은 X(트위터) 데이터로 학습, 다른 챗봇에 비해 실시간성이 강하다는 평가다. 메타도 페이스북과 인스타그램 데이터로 '메타 AI'를 학습한 것으로 알려졌다. 마이크로소프트(MS)도 지난 2월 뉴스 전문 세마포와 데이터 학습 계약을 맺었다.

이처럼 기존 뉴스나 출판에 집중됐던 AI 학습 데이터 계약이 소셜 플랫폼으로 확대되는 추세다.

사용자들의 불만도 불거지고 있다, 특히 미국 연방거래위원회(FTC)는 커뮤니티의 사용자 데이터 판매에 문제가 있는지 조사할 뜻을 밝히기도 했다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지