이번 주 미국 인공지능(AI) 업계에서 가장 뜨거운 이슈는 대형언어모델(LLM)의 '성능 향상 한계' 문제였습니다. 

오픈AI가 '오라이온' 개발 중 사전 훈련(pre-training)으로 인한 모델 성능 향상이 예전만큼 대단치 않았다는 것을 발견했고, 이를 보완하기 위해 추론과 인간 피드백을 통한 강화학습(RLHF)에 집중한다는 디 인포메이션의 지난 9일(현지시간) 보도가 시작이었습니다.

이어 11일에는 구글과 앤트로픽도 같은 문제에 시달린다는 소식이 흘러 나왔습니다. 이틀 뒤인 13일에는 더 구체적인 내용이 나왔습니다. 구글이 이를 보완하기 위해 ‘하이퍼파라미터(hyperparameters)’ 조정 등 방안을 강구한다는 내용입니다.

이제는 블룸버그나 다른 주요 기술 매체들도 모두 집중 조명하는 양상입니다.

반박도 등장했습니다. 다리오 아모데이 앤트로픽 CEO에 이어 샘 알트먼 오픈AI CEO도 모델 성능 향상이 아직 한계를 맞지 않았다고 강조했습니다.

이 문제에 대한 경고가 여름부터 흘러나왔다는 것도 확인됐습니다. 케빈 스콧 마이크로소프트(MS) CTO는 이미 7월에 "아직은 확장 한계를 맞지 않았다"라고 밝혔으며, 지난달 노암 브라운 오픈AI 연구 과학자가 TED 컨퍼런스에서 "업스케일링 시대는 갔다"라고 선언한 것 등이 대표적입니다. 일리아 수츠케버 SSI 창립자가 "스케일링 법칙을 넘는 모델을 만들겠다"라고 선언한 것도 일맥상통합니다.

당시에는 이 문제가 부각되지 않았기 때문에, 이들의 발언은 일반적인 것으로 치부됐습니다. 그러다 이달 초 유명 벤처 캐피털리스트 벤 호로비츠가 "AI 훈련에 사용되는 GPU의 수를 계속 늘리고 있지만, 이제는 과거만큼의 지능적인 개선을 전혀 얻지 못하고 있다"라고 지적하며, 성능 문제가 본격화됐습니다.

LLM 성능 향상이 한계에 도달했는지 결론 내리기는 아직 이릅니다. 하지만 확실한 것은 더 많은 데이터와 컴퓨팅 인프라를 투입하면 모델 성능이 향상된다는 스케일링 법칙은 한계에 달한 것으로 보입니다. 즉, 사전 훈련(pre-trainig)만으로는 큰 발전이 어려운 것으로 보입니다.

따라서 추론을 비롯해 사후 훈련(post-trainig)과 강화학습의 중요성이 더 커졌습니다. 

(사진=셔터스톡)
(사진=셔터스톡)

지금까지 알려진 바로 오픈AI나 구글은 ▲사전 훈련 중 모델이 데이터를 어떻게 학습하는지 결정하는 설정인 하이퍼파라미터 튜닝을 비롯해 ▲미세조정 데이터를 더 정교하게 라벨링하고 인간 피드백을 강화하거나 ▲기존 첨단 모델을 활용해 고품질의 합성 데이터를 추가하거나 ▲모델에 같은 질문을 수십, 수백번 한 다음 가장 좋은 답을 선택하는 샘플링(sampling)을 활용하거나 ▲추론 강화 등을 총동원하고 있습니다.

특히 추론의 핵심인 '테스트-타임 컴퓨트'에 대해서는 이번 주 MIT 연구원들이 최신 논문을 공개했으며, 이에 대해 노암 브라운 연구원이 큰 관심을 보인 것으로 알려졌습니다.

어쨌거나 챗GPT 등장 후 2년 동안 인공일반지능(AGI)을 눈앞에 둔 것처럼 빠르게 성장하던 LLM은 이제 다른 차원으로 접어들었다고 볼 수 있습니다. 이제까지는 GPU만 충분하다면 누구나 프론티어급 모델을 만들어 냈고, 그 결과 올해 중순부터는 모두가 GPT-4 성능을 따라잡았다고 선언했습니다. 

그러나 이제부터는 그 이상이 필요할 것으로 보입니다. 세부 기술도 쏟아져 나올 것으로 보입니다.

알트먼이나 아모데이 CEO가 아직 AI는 한계를 맞지 않았으며, 2~3년 안에 AGI가 등장할 것이라고 주장하는 것도 그런 자신감을 반영한 것으로 보입니다. 올해 등장한 추론 모델 'o1'이 새로운 차원을 연 것처럼, 앞으로도 획기적인 기술이 등장할 것을 예상해 봅니다.

이어 지난 주 주요 이슈입니다. 

오픈AI, AI 에이전트 '오퍼레이터' 내년 1월 출시

오픈AI가 최근 사내 시연까지 마친 AI 에이전트를 내년 1월 출시할 것이라는 소식입니다. AI 에이전트는 아직 체감할 만큼 큰 성공 사례가 등장하지는 않았는데, 과연 '오퍼레이터'가 본격적인 붐을 일으킬지 주목됩니다.

(사진=언바벨)
(사진=언바벨)

AI 번역 언바벨 "3년 내 인간 번역 없어질 것"

3년 안으로 번역에서 인간의 역할이 필요 없을 것이라는 예측이 등장했습니다. 이는 언바벨이라는 회사가 AI 번역 프로그램을 직접 개발하면서 체감한 사실이라는 설명입니다. 그래서 이번 제품부터는 인간 검수 과정도 생략했다고 합니다.

엑소, GPU 대신 맥북 여러대로 분산 컴퓨팅 제공하는 도구 공개

애플이 최근 출시한 'M4' 칩을 탑재한 맥 미니나 맥북 등을 연결, GPU 대안으로 사용하는 기술이 등장했습니다. 개인용 '분산 컴퓨팅' 개념입니다. 특히 비용은 GPU의 5분의 1 수준에 불과하다고 합니다. 

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지