(사진=오픈AI)
(사진=오픈AI)

오픈AI가 14일(현지시간) 출시한 'GPT-4.1'이 조용하지만 빠르게 반응을 얻고 있습니다. 이 모델은 개발자를 위한 코딩 특화 모델로 API로만 제공 중이라, 일반 사용자들은 체감이 없을 수 있습니다. 

하지만 미국 업계에서는 이 모델의 출시가 오픈AI의 전략적 변화를 보여주는 것으로 평가고 있습니다. 앤트로픽 등에 떨어졌던 코딩 분야에서 반격을 위해 가격 경쟁에 나섰다는 것입니다. 벤처비트는 이 모델에 대해 "코스트코 가격으로 코딩 성능을 대폭 업그레이드했다"라고 표현했습니다.

우선 GPT-4.1은 오픈AI 모델 중 가장 코딩 성능이 뛰어납니다. 코딩 실력을 측정하는 'SWE-벤치 베리파이'에서 54.6%를 기록했는데, 이는 'GPT‑4o'보다 21.4%, 'GPT‑4.5'보다 26.6% 향상된 것은 물론, 추론 모델인 'o1(41%)'과 'o3-미니(49%)'보다도 높은 수치입니다.

최근 코딩 능력을 강조하며 출시된 '제미나이 2.5 프로(63.8%)'나 이 분야의 전통 강자인 '클로드 3.7 소네트(62.3%)'보다는 8~9% 낮습니다. 

하지만 AI 코딩 에이전트로 유명한 코디엄(qodo)이 실시한 200개의 풀 리퀘스트 벤치마크에서는 54.% 대 45.1%로 클로드 3.7 소네트에 앞선 승률을 보였습니다. 코드 제안 기능에서도 GPT-4.1은 10점 만점에 6.81점으로, 6.66점을 받은 클로드를 이겼습니다. 충분한 경쟁력을 가졌다는 말입니다.

(사진=코도)
(사진=코도)

가장 중요한 것은 가격입니다.

GPT-4.1은 100만 토큰 입력당 2달러, 출력당 8달러의 API 가격이 책정됐습니다. GPT-4o의 입력 3.75달러, 출력 15달러를 절반 정도로 낮춘 것입니다. 현재 컴퓨팅 부족에 시달리는 오픈AI의 현실을 감안하면, 일부 손실까지 감수했다는 평입니다. 

또 ▲클로드 3.7 소네트의 3달러/15달러 ▲제미나이 2.5 프로의 1.25달러/10달러 ▲'그록-3'의 3달러/15달러 등 첨단 모델 중 가장 가격이 저렴합니다. 전반적인 성능은 타사 첨단 모델에 못 미치겠지만, 코딩 용도로 모델을 사용하는 사람들에게는 매력적입니다.

가격의 비밀은 추론 기능을 뺀 것입니다. 이에 따라 더 적은 컴퓨팅 리소스만 사용하고도 타사의 추론 모델에 조금 떨어지거나 또는 더 나은 성적을 기록한 것입니다. 

게다가 컨텍스트 창이 100만토큰이라는 점도 주목할 만합니다. 기존 컨텍스트 창이 12만8000토큰이라는 점을 감안하면, 엄청난 확장입니다. 제미나이 2.5 프로가 자랑하는 100만토큰을 단번에 따라잡았습니다.

결국 GPT-4.1은 오픈AI가 코딩 성능 향상에 얼마나 집중했는지를 보여주는 결과입니다. 이 때문에 모델의 기술적인 부분은 아무것도 공개하지 않았습니다. 기업 비밀로 보입니다.

반응도 나쁘지 않은 것으로 알려졌습니다.. 

에이단 맥러플린 오픈AI 엔지니어는 "일부 스타트업 엔지니어들은 이전에는 비용이 많이 들었던 모든 부분에 4.1 미니/나노를 연결한 뒤 멍하니 바라보며 몇시간씩 일했다고 말했다"라는 글을 올렸습니다. 클라이브 찬 엔지니어도 "나도 o3-미니를 GPT-4.1로 전면 교체했다"라며 "심지어 가장 작은 'GPT-4.1 나노'도 GPT-4o보다 2배나 뛰어나다"라고 강조했습니다.

물론, 단순한 퍼주기 일리는 없습니다. 개발자들이 GPT-4.1의 기능과 비용 절감 효과를 직접 경험하고 나면, 더 비싸거나 성능이 고만고만한 모델로 돌아가는 것은 어려울 것이라는 전략적 선택입니다.

이처럼 기업용 코딩 시장 경쟁은 점차 치열해지고 있습니다. 이번 오픈AI의 도전에 따라 앤트로픽이나 구글도 가격 경쟁으로 맞불을 놓을지 주목됩니다.

또 챗GPT는 사용자 8억명을 돌파한 것으로 알려졌습니다. 이제 오픈AI는 이전보다 좀더 자유롭게 가격 정책을 펴는 것도 가능할 것으로 보입니다. 만약 앞으로도 저렴한 가격을 앞세운다면, 전체 AI 시장에는 큰 변화가 일어날 수 있습니다.

이어 15일 주요 뉴스입니다.

(사진=셔터스톡)
(사진=셔터스톡)

"오픈AI, X와 경쟁할 소셜 미디어 개발 중...이미지 생성 공유에 초점"

오픈AI가 내부에서 소셜 미디어를 구축 중이라는 소식입니다. 챗GPT로 생성한 지브리 이미지를 X(트위터)에 공유, 일론 머스크 좋은 일 시키는 게 마음에 들지 않았나 봅니다. 사용자 8억명이면 따로 SNS를 만들고도 충분합니다. 

"출시 임박한 o3·o4-미니는 과학 연구 위한 독보적 모델"

이번 주 출시될 것으로 보이는 오픈AI의 추론 모델은 과학 지식에 특화된 모델이라고 합니다. 특히 인간 과학자들과는 달리, 여러 분야에 정통하다는 것이 장점입니다. 이런 조수라면 거금을 내고도 영입할 만하다는 것입니다.  

애플, 아이폰 사용자 데이터로 기기에서 AI 학습 시작…”데이터 유출 없이 AI 성능 개선”

애플이 아이폰 데이터로 사용자 분석을 시작한다고 발표했습니다. 애플이 가장 자랑했던 기능인데, 무려 발표 10개월이 지난 뒤에 시작하는 것입니다. 또 개인정보 보호를 위해 복잡한 '합성 데이터 비교' 방식을 도입했습니다. 

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지