오픈AI가 미국 정부 관계자들과 중국 딥시크의 기술 도용에 대해 논의한 것으로 알려졌다. 위선적이라는 일부 지적에 대해서는 '웹 크롤링'과 '증류'는 차원이 다르다고 설명했다.
크리스 리한 오픈AI 최고 글로벌 업무 책임자는 10일(현지시간) 블룸버그 TV와의 인터뷰에서 딥시크의 오픈AI 기술 도용에 대해 "우리는 일부 증거를 확인했으며, 계속해서 검토하고 있다. 정부 관계자들과 이 문제에 대해 논의했다"라고 말했다.
딥시크는 지난달 저비용으로 고성능 AI 모델을 출시하며 기술 업계를 놀라게 했다.
그러나 마이크로소프트(MS)의 보안 연구원들은 딥시크가 오픈AI의 API를 통해 데이터를 부적절하게 추출하고 있다는 사실을 처음으로 오픈AI에 알렸다. 이에 오픈AI는 딥시크가 증류 방식으로 자신들의 모델에서 부적절하게 얻은 데이터로 모델을 훈련시켰다는 징후를 파악하고 검토 중이라고 밝혔다.
그러나 일부에서는 오픈AI의 이런 대응을 위선적이라 비판하고 있다. 저작권이 있는 콘텐츠를 무단으로 수집해 AI 모델 훈련에 사용한 오픈AI가 자사의 AI 모델 출력물을 훈련에 사용했다는 이유로 딥시크를 겨냥한다는 지적이다.
하지만 리한 책임자는 이에 대해 분명한 차이가 있다고 주장했다. 그는 오픈AI의 훈련 방법을 "도서관에서 책을 대출하는 것"에 비유했다.
하지만 딥시크는 "도서관 책을 가져와 표지와 저자를 바꿔서 판매하는 것에 가깝다"고 설명했다.
이어 "이것이 복제이며, 우리가 우려하는 바"라며 "좋은 칼로리와 나쁜 칼로리가 있는 것처럼, 증류도 좋은 경우와 문제가 있는 경우가 있다"라고 강조했다.
실제로 오픈AI는 모델 약관을 통해 데이터를 복제하는 것을 규칙 위반이라고 명시했다.
하지만 이 문제가 법정으로 갈 경우, 오픈 AI가 이기기는 어렵다는 것이 전문가들의 평이다. 오픈AI가 다른 소송에서 주장한 '공정 사용'이 자신의 발목도 붙잡을 가능성이 있다는 분석이다.
박찬 기자 cpark@aitimes.com
