(사진=셔터스톡)
(사진=셔터스톡)

딥시크로 인해 엔비디아 주가가 바닥을 쳤다는 소식은 잘 알려졌습니다. 그리고 마이크로소프트나 구글 등 관련 기업도 적지 않은 영향을 받았습니다. 딥시크가 적은 컴퓨팅 리소스만으로 뛰어난 모델을 개발했다는 것이 강조되며, 과거와같이 많은 GPU가 필요하지 않을 것이라는 성급한 예상 때문이었습니다.

하지만 엔비디아 주가 폭락 열흘을 넘어가며 이 문제는 정리되는 분위기입니다. GPU는 모델 개발만이 아니라 서비스에도 필요하며, 많은 사람이 AI를 사용할수록 GPU는 더 필요하다는 논리입니다. 이 때문에 '제번스의 역설'이 강조됐습니다.

그런데 딥시크의 등장으로 예상치 못한 기업이 영향을 받을 수 있다는 소식이 전해졌습니다. 미국의 대표적인 데이터 라벨링 기업 스케일 AI가 주인공입니다. 디 인포메이션은 5일 '딥시크-R1' 때문에 스케일 AI와 같은 데이터 라벨링 기업에 변화가 올지도 모른다고 소개했습니다. 

스케일 AI는 미국 비상장 기업 중 기업 가치가 다섯손가락 안에 들어가는 곳으로, 투자자들의 비상한 관심을 받고 있습니다. AI 붐으로 인해 주력 사업인 데이터 라벨링 수요가 폭발하며 급성장을 기록 중입니다. 

딥시크와 스케일 AI의 연관성은 언뜻 떠올리기 쉽지 않습니다. 하지만, 딥시크가 'o1'이나 다른 첨단 모델로부터 합성 데이터를 만들어내고, '증류'라는 방식을 통해 모델 정확도를 높였다는 점을 떠올리면 답이 나옵니다.
  
스케일 AI는 모델 학습을 위한 데이터셋을 구축해 줍니다. 이는 인간 라벨러가 데이터에 주석을 달아주는 방식입니다. 특히, 최근에는 고급 지식이나 전문 도메인 데이터의 검증이 필요하자, 박사 학위 소지자나 의사, 변호사 등이 최대 시급 200달러(약 29만원)를 받고 라벨링에 참여한다는 소식이 전해졌습니다. 이를 '모델 트레이너'나 'AI  콘텐츠 조정자'로 부른다는 것도 소개해 드린 바 있습니다.

그런데 딥시크처럼 기존 첨단 모델의 데이터 복제 방식이 유행이 되면 자연히 인간 라벨러들은 수요가 줄어든다는 지적입니다.

특히 지난해 추론 모델이 등장한 뒤부터 출시된 대부분 AI 모델은 '수학 문제를 잘 풀고 코딩 능력이 뛰어나다'라는 것을 강조하고 있습니다.

그런데 수학이나 코딩은 AI가 합성데이터를 만들 수 있는 좋은 분야이며, 실제로 딥시크가 이를 잘 활용했다는 분석입니다. 라벨링 전문 라벨박스의 마누 샤르마 CEO는 "딥시크는 혁신을 통해 AI가 스스로 더 간단한 코딩 및 수학 문제를 생성하고 확인할 수 있게 했으며, AI 개발자가 직접 그 과정을 처리할 수 있다"라고 주장했습니다.

물론, 딥시크는 데이터 생성이나 큐레이션 프로세스에 대한 것을 상세하게 공개하지 않았습니다. 그러나, 전문가들은 딥시크가 훈련 데이터 생성 프로세스의 일부를 자동화하는 새로운 기술을 고안한 것으로 보고 있습니다. 즉, 합성데이터를 만들어낸 것도 딥시크의 숨겨진 노하우라는 말입니다.

누구나 딥시크처럼 합성데이터를 효과적으로 만들어낼 수 있는 것은 아닙니다. 또 AI 학습용으로 정제되지 않은 데이터는 아직 무궁무진합니다. 인터넷 데이터가 고갈됐다는 것을 넘어, 산업 현장이나 병원은 물론 일반 기업에도 AI 학습용으로 정제되지 않은 비정형 데이터는 많습니다. 이런 도메인별 데이터에 대한 라벨링 수요는 계속 늘어나고 있습니다.

알렉산더 왕 스케일 AI CEO도 최근 X(트위터)를 통해 딥시크가 데이터 생성 프로세스를 자동화했다고 가정하는 것은 "게으른 견해"라며, R1은 인간이 생성한 엄청난 양의 데이터로 학습했다는 장문의 글을 올렸습니다.

그의 반박에도 불구하고 업계는 합성데이터에 관해 딥시크가 무언가 방법을 만들었다는 것을 인정하는 분위기입니다.

한편, 이제까지 흐름을 참고하면 딥시크 돌풍도 그리 오래갈 것으로 보이지는 않습니다. 벌써 딥시크를 능가한다는 모델이 등장하기 시작했고, 가격 경쟁력도 떨어지고 있습니다.

그러나 오픈AI나 구글, 앤트로픽 등 일부 미국 기업만의 프론티어 모델 경쟁 속에서 등장한 딥시크는 전 세계 AI 연구자들에게 새로운 계기가 된 것이 분명합니다. 이런 면에서 딥시크는 혁신이라고 부를 수 있습니다.

이어 5일 주요 뉴스입니다.

구글 CEO "올해는 검색 혁신 일어날 것...AI로 영역 대폭 확장" 

피차이 구글 CEO가 실적 발표를 통해 AI로 인해 검색이 올해 큰 변화를 맞을 것이라고 강조했습니다. 검색으로 세계 최고 기업 중 하나가 된 구글이 이런 말을 했다는 것은 분명히 그만한 이유와 자신이 있기 때문일 것입니다. 

(사진=셔터스톡)
(사진=셔터스톡)

MS, AI 에이전트 개발 위해 딥마인드 핵심 인원 영입

구글에서 '프로젝트 아스트라'를 개발하던 핵심 인원들이 MS로 넘어갔습니다. 술레이먼 CEO도 밝혔듯 MS도 AI 음성 비서를 출시할 것이 확실해 보입니다. 

바이트댄스, 사진 한장으로 전신 영상 생성하는 도구 공개

사진 한장만으로 자연스럽게 말하고 노래하고 움직이는 동영상 생성 도구가 등장했습니다. 바이트댄스는 딥페이크 악용 위험이 크기 때문에, 일반에 공개하지 않는다고 밝혔습니다.

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지