검색 결과에 포함되는 모든 웹사이트의 데이터를 인공지능(AI) 학습에 사용하겠다고 버티던 구글이 결국 뉴스 매체와 저작권 협상에 나선 것으로 확인됐다. 법적인 부담을 넘어, 앞으로는 기술적으로 웹사이트 무단 접근이 쉽지 않기 때문이라는 분석이 나왔다.
블룸버그는 22일(현지시간) 익명의 소식통을 인용, 구글이 20여개의 뉴스 매체와 저작권 시범 프로젝트를 시작할 계획이라고 보도했다. 자세한 내용은 밝혀지지 않았으나, 뉴스 매체에 비용을 지불한다는 내용이다.
구글 대변인은 성명을 통해 "우리는 새로운 유형의 파트너십과 제품 경험을 모색하고 실험하고 있다"라며 "현재로서는 구체적인 계획이나 대화에 대한 자세한 내용을 공유하지 않을 것"이라고 밝혔다.
구글은 그동안 오픈AI와 달리, 저작권 비용 지불에 무관심한 태도를 보여 왔다. 이는 현재에도 주요 뉴스 사이트들과는 뉴스 사용 및 광고 배분 계약 등으로 묶여 있기 때문이다. 또, AI 학습을 거부하는 사이트는 구글 검색 결과에서 제외하겠다고도 밝혔다.
그러나 지난해부터 검색에 'AI 개요'와 'AI 모드'를 차례로 도입하며, 콘텐츠를 제공하는 업체들의 불만이 커졌다. AI 요약으로 인해 웹 사이트 방문자가 줄었다는 말도 나왔다.
여기에 미국 법원의 검색 독점 판결이 나고, 오픈AI나 퍼플렉시티 등의 AI 검색 추격이 가시화되는 등 안팎으로 도전을 받는 상황이다.
출판사와 광고주를 위한 회사인 디스트리뷰티드 미디어 랩의 데이비드 게링 CEO는 "구글을 비롯한 플랫폼들은 공공 정책 때문이 아니라 기술적인 이유로 플랫폼의 무제한 웹 데이터 접근이 곧 종료될 것임을 알고 있다"라며 "따라서 라이선스 계약을 체결해야 한다. 그렇지 않으면 AI에게 줄 데이터를 구하지 못할 것"이라고 말했다.
기술적인 이유가 무엇인지는 설명하지 않았다. 하지만, 전 세계 웹사이트의 20%를 호스팅하는 클라우드플레어는 AI 기업의 웹 크롤러를 차단하는 시스템을 도입했다. 이에 따라 데이터를 가져가려면 요금을 지불해야 한다.
한편, 구글은 AI 학습 데이터 확보를 위해 세계 최대의 커뮤니티 사이트인 레딧과 AP 통신 두곳과 계약한 상태다. 반면, 오픈AI는 최근 몇년간 수십곳에 달하는 주요 매체와 파트너십을 맺어 왔다.
임대준 기자 ydj@aitimes.com
