딥시크 사태로 인해 하루 만에 시가 총액 5890억달러를 날린 젠슨 황 엔비디아 CEO가 드디어 이 문제에 대해 입을 열었습니다.

그는 파트너사인 DDN이 20일(현지시간) 공개한 인터뷰에 출연, 처음으로 딥시크에 대한 입장을 밝혔습니다. 결론은 투자사들의 잘못된 해석에서 오해가 비롯됐다는 것입니다.

투자사들은 딥시크의 등장으로 사전 훈련에 들어가는 비용이 크게 낮아지고 추론 비용도 획기적으로 줄어들며, GPU가 이전처럼 많이 필요하지 않다는 식으로 해석했다는 것입니다.

황 CEO는 이를 "모델은 사전 훈련됐고, AI에 질문하면 즉시 답변을 내놓는다는 '사전 훈련 패러다임'이 투자자들의 견해"라며 "이는 분명히 틀렸다"라고 지적했습니다.   

이어 AI 훈련에서 가장 중요한 부분은 '딥시크-R1'이 보여줬듯 사후 훈련이라고 강조했습니다. 여기에는 강화학습(RL)이나 인간 피드백을 통한 강화 학습(RLHF) 등이 포함되며, 이 또한 엄청나게 집중적인 컴퓨팅이 필요하다고 설명했습니다. 

그런데 이 기술은 지난 5년 동안 크게 발전하고 사전 훈련에 관심이 집중되며, 사람들은 사후 훈련이 컴퓨팅 집약적이라는 사실을 잊었다는 것입니다. 황 CEO는 이를 '두번째 스케일링 법칙'이라고 불렀습니다. 즉, 사후 훈련에도 많은 컴퓨팅이 들어갈수록 높은 성능을 달성할 수 있다는 것입니다.

마지막으로 세번째 스케일링 법칙이 적용되는 부분을 '추론'이라고 설명했습니다. 사람들의 질문에 더 정확한 답을 하려면 추론이 필요하고, 이는 알려진 대로 생각하는 시간을 늘리면 즉, 컴퓨팅을 더 많이 사용하면 답을 개선된다는 것입니다. "추론은 상당히 컴퓨팅 집약적인 작업"이라고 강조했습니다.

이처럼 단순히 사전 훈련 비용이 줄어들고 추론을 저렴한 비용에 딥시크가 제공한다고 해서, 실제 GPU가 덜 사용되는 것은 아니라는 말입니다.    

따라서 그는 "시장이 R1에 대해 '오, 세상에 AI가 끝났어요, 모델이 하늘에서 떨어졌어요, 우리는 더 이상 컴퓨팅을 할 필요가 없어요'라고 말하는 것은 사실과는 반대"라고 지적했습니다. 

특히 "완전히 반대"라고 거듭 강조한 뒤 "딥시크가 한 일은 모델이 생각했던 것보다 훨씬 효율적일 수 있다는 것을 모두에게 알린 것이며, 그래서 AI는 확장되고 있으며 채택이 가속화될 수 있다는 것"이라고 설명했습니다.

(사진=셔터스톡)
(사진=셔터스톡)

이번 황 CEO의 발언은 그동안 등장했던 기술 전문가의 분석과 '제번스의 역설' 등을 종합한 것입니다.

즉, 효율성이 좋은 모델이 등장했다고 하루아침에 GPU 수요가 줄어들 일은 없으며, 반대로 칩 사용이 늘어날 것이라는 말입니다.

딥시크 사태로 인해 황 CEO도 자산의 20% 이상을 날린 것으로 알려졌습니다. 딥시크 사태 전후 거의 한달 동안 도널드 트럼프 대통령과의 면담을 제외하면 공식적인 움직임도 거의 없었습니다.

사실 그에게는 이런 논리적인 문제보다 마이크로소프트나 구글, 아마존, 메타 등 빅테크가 AI 투자를 확대하겠다고 밝힌 것이 더 기뻤을 것입니다. 특히, 이제 GPU는 기존 소수 기업 외에도 '소버린 AI'라는 이름으로 세계 각국 정부의 구입 대상이 됐습니다. 국내에서도 내년 상반기까지 GPU 1만8000장을 구입한다고 합니다.

엔비디아가 진짜 위기를 맞으려면 현재 GPU에 의존해 모델을 학습하고 서비스를 제공하는 구조를 뛰어넘는 무언가가 필요합니다. 

현재로서는 '트랜스포머' 아키텍처의 효율성을 획기적으로 능가하는 새로운 AI가 등장하든지, 아니면 GPU가 필요 없는 양자 컴퓨터가 상용화되든지 둘 중 하나입니다.

이어 20일 주요 뉴스입니다.

정부 "글로벌 톱 수준 LLM 개발 위해 국가대표팀 구성"

정부가 국가대표 개발진을 모아 글로벌 수준의 한국어 파운데이션 모델을 연내 개발할 예정으로 알려졌습니다. 아직 구체적인 내용은 없지만, 이는 한동안 상당한 화제가 될 것으로 보입니다.

(사진=MS)
(사진=MS)

MS, 첫 양자 칩 공개..."몇년 내 양자 컴퓨터 상용화"

MS가 첫 양자 칩을 공개하며, 구글보다 성능이 앞섰다고 강조했습니다. 특히, 이 칩으로 인해 앞으로 몇년 안에 양자 컴퓨터의 상용화가 가능할 것이라고 선언했습니다.

구글, 과학 연구 돕는 에이전트 'AI 코사이언티스트' 개발

구글이 과학자들의 연구를 돕는 AI 에이전트를 출시했습니다. 딥 리서치 기능처럼 관련 문서를 찾아주고 고급 보고서를 작성해 주는 기능입니다. 테스트 도중 큰 도움을 얻었다는 과학자 반응도 등장했습니다

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지