오픈AI가 새로운 모델 'o3'가 'o1' 출시 3개월 만에 나왔다는 점을 강조했다. 새로운 추론 기술로 인해 모델의 업그레이드 주기가 대폭 줄어들었다는 것이다. '테스트-타임 컴퓨트'를 기반으로 한 추론이 기존 사전 훈련보다 훨씬 효과적인 업스케일링 방법이라는 점을 강조했다.
노암 브라운 오픈AI 연구 과학자는 21일 (현지시간) X(트위터)를 통해 "우리는 불과 3개월 전에 o1을 발표했으며, 오늘 o3를 발표했다"라며 "이런 궤적이 계속될 것이라고 믿을 만한 충분한 이유가 있다"라고 밝혔다.
이어 제이슨 웨이 오픈AI 연구원도 "o3는 성능이 매우 뛰어나지만, 그슬프다보다 더 중요한 것은 o1에서 o3로 발전하는 데 3개월밖에 걸리지 않았다는 점"이라고 전했다.
이어 "이는 생각의 사슬에서 추론 계산을 확장하는 강화학습(RL)의 새로운 패러다임에서 얼마나 빨리 진전될지 보여준다"라며 " 기존 1~2년 걸리던 모델의 사전 훈련 패러다임보다 훨씬 빠르다"라고 강조했다.
오픈AI는 지난 9월12일 'o1-프리뷰'와 'o-1 미니'를 출시했으며, 지난 5일 십마스(Shipms) 첫날 'o1' 풀 버전과 'o1-프로'를 공개했다. o3는 마지막 날인 20일 공개했다.
o3 출시 당시에는 인공일반지능(AGI)에 근접한 성능이라는 점에 주목, 출시 간격에는 초점이 맞춰지지 않았다. 그러자 개발에 참여했던 스태프가 직접 이를 강조하고 나선 것이다.
이는 '오라이온'으로 알려진 GPT-5가 두차례의 사전훈련에도 불구, 큰 성능 발전을 보이지 못했다는 것과 대조된다. 오픈AI는 현재 18개월째 GPT-5를 개발 중으로 알려졌다.
반면 추론 모델은 불과 3개월 만에 비약적인 성능 향상을 보인 셈이다. 모델의 구체적인 사양은 밝히지 않았지만, 벤치마크에서는 확실한 성능 발전을 이룬 것으로 나타났다.
따라서 추론 모델이 시전 훈련을 대체할 '새로운 스케일링 법칙'이라는 것을 입증한 셈이다. 이는 일리야 수츠케버 SSI 창립자와 사티아 나텔라 마이크로소프트 CEO, 젠슨 황 엔비디아 CEO, 요수아 벤지오 몬트리오데학교 교수 등이 모두 예고했던 내용이다.
또 브라운 연구원이 말한 "궤적이 계속될 것"이라는 말은 내년 초 새로운 모델이 등장할 수 있다는 것을 의미한다는 분석이다. 'o4'가 오라이언일 수 있다는 추측도 제기됐다.
한편, 존 홀먼 오픈AI 연구원도 이날 강력한 멘트를 남겼다. "샘과 우리 연구원들이 AGI가 온다고 말하는 것은 2000달러짜리 구독권을 판매하거나 투자자를 현혹하려고 하는 말이 아니다"라며 "(AGI가) 실제로 오고 있다"라고 강조했다.
이처럼 이달 들어 두번이나 오픈AI 직원의 입에서 AGI가 언급됐다. 지난 7일에는 바히트 카제미 오픈AI 기술 스태프가 처음으로 "우리는 이미 AGI를 달성했고, o1을 통해 더욱 분명해졌다"라는 글을 X에 게시했다.
o3는 아직 일반에게 공개되지 않았으며, 제한된 인원 대상으로 다음 달부터 레드팀 테스트를 시작한다. 따라서 o3를 통해 AGI 급 성능을 체감했다는 사례가 등장하려면 시간이 더 걸릴 것으로 보인다.
임대준 기자 ydj@aitimes.com
- 오픈AI 직원 "AGI 이미 달성" 주장..."사람들이 알아차리기 어려울 것"
- "o3는 AGI에 도달한 첫번째 모델"...오픈AI, 최첨단 추론 모델 공개
- 오픈AI, 추론으로 탈옥 시도 막는 '신중한 정렬' 방법 공개
- 'o3' AGI 논쟁 점화..."프로그램 합성 vs 단순 강화 학습 결과"
- 'o3'가 AI를 바꿔 놓은 5가지 혁신과 하나의 숙제
- 구글 AI 책임자 "ASI 달성 가능성 매달 높아져...수츠케버가 옳았다"
- 오픈AI "o3-미니, 안전 테스트 마치고 2주 내 정식 출시"
- 오픈AI “테스트-타임 컴퓨트 늘어나면 적대적 공격 대처에도 효과적”
- 'o1' 개발한 오픈AI 연구원 "추론은 20년 전에 등장했을 수도"
- "추론 모델 성장도 1년 뒤 한계 부딪힐 수 있어...컴퓨팅 3~5개월마다 10배 증가"
