오픈AI가 14일(현지시간) 출시한 'GPT-4.1'이 조용하지만 빠르게 반응을 얻고 있습니다. 이 모델은 개발자를 위한 코딩 특화 모델로 API로만 제공 중이라, 일반 사용자들은 체감이 없을 수 있습니다.
하지만 미국 업계에서는 이 모델의 출시가 오픈AI의 전략적 변화를 보여주는 것으로 평가고 있습니다. 앤트로픽 등에 떨어졌던 코딩 분야에서 반격을 위해 가격 경쟁에 나섰다는 것입니다. 벤처비트는 이 모델에 대해 "코스트코 가격으로 코딩 성능을 대폭 업그레이드했다"라고 표현했습니다.
우선 GPT-4.1은 오픈AI 모델 중 가장 코딩 성능이 뛰어납니다. 코딩 실력을 측정하는 'SWE-벤치 베리파이'에서 54.6%를 기록했는데, 이는 'GPT‑4o'보다 21.4%, 'GPT‑4.5'보다 26.6% 향상된 것은 물론, 추론 모델인 'o1(41%)'과 'o3-미니(49%)'보다도 높은 수치입니다.
최근 코딩 능력을 강조하며 출시된 '제미나이 2.5 프로(63.8%)'나 이 분야의 전통 강자인 '클로드 3.7 소네트(62.3%)'보다는 8~9% 낮습니다.
하지만 AI 코딩 에이전트로 유명한 코디엄(qodo)이 실시한 200개의 풀 리퀘스트 벤치마크에서는 54.% 대 45.1%로 클로드 3.7 소네트에 앞선 승률을 보였습니다. 코드 제안 기능에서도 GPT-4.1은 10점 만점에 6.81점으로, 6.66점을 받은 클로드를 이겼습니다. 충분한 경쟁력을 가졌다는 말입니다.
가장 중요한 것은 가격입니다.
GPT-4.1은 100만 토큰 입력당 2달러, 출력당 8달러의 API 가격이 책정됐습니다. GPT-4o의 입력 3.75달러, 출력 15달러를 절반 정도로 낮춘 것입니다. 현재 컴퓨팅 부족에 시달리는 오픈AI의 현실을 감안하면, 일부 손실까지 감수했다는 평입니다.
또 ▲클로드 3.7 소네트의 3달러/15달러 ▲제미나이 2.5 프로의 1.25달러/10달러 ▲'그록-3'의 3달러/15달러 등 첨단 모델 중 가장 가격이 저렴합니다. 전반적인 성능은 타사 첨단 모델에 못 미치겠지만, 코딩 용도로 모델을 사용하는 사람들에게는 매력적입니다.
가격의 비밀은 추론 기능을 뺀 것입니다. 이에 따라 더 적은 컴퓨팅 리소스만 사용하고도 타사의 추론 모델에 조금 떨어지거나 또는 더 나은 성적을 기록한 것입니다.
게다가 컨텍스트 창이 100만토큰이라는 점도 주목할 만합니다. 기존 컨텍스트 창이 12만8000토큰이라는 점을 감안하면, 엄청난 확장입니다. 제미나이 2.5 프로가 자랑하는 100만토큰을 단번에 따라잡았습니다.
결국 GPT-4.1은 오픈AI가 코딩 성능 향상에 얼마나 집중했는지를 보여주는 결과입니다. 이 때문에 모델의 기술적인 부분은 아무것도 공개하지 않았습니다. 기업 비밀로 보입니다.
반응도 나쁘지 않은 것으로 알려졌습니다..
에이단 맥러플린 오픈AI 엔지니어는 "일부 스타트업 엔지니어들은 이전에는 비용이 많이 들었던 모든 부분에 4.1 미니/나노를 연결한 뒤 멍하니 바라보며 몇시간씩 일했다고 말했다"라는 글을 올렸습니다. 클라이브 찬 엔지니어도 "나도 o3-미니를 GPT-4.1로 전면 교체했다"라며 "심지어 가장 작은 'GPT-4.1 나노'도 GPT-4o보다 2배나 뛰어나다"라고 강조했습니다.
물론, 단순한 퍼주기 일리는 없습니다. 개발자들이 GPT-4.1의 기능과 비용 절감 효과를 직접 경험하고 나면, 더 비싸거나 성능이 고만고만한 모델로 돌아가는 것은 어려울 것이라는 전략적 선택입니다.
이처럼 기업용 코딩 시장 경쟁은 점차 치열해지고 있습니다. 이번 오픈AI의 도전에 따라 앤트로픽이나 구글도 가격 경쟁으로 맞불을 놓을지 주목됩니다.
또 챗GPT는 사용자 8억명을 돌파한 것으로 알려졌습니다. 이제 오픈AI는 이전보다 좀더 자유롭게 가격 정책을 펴는 것도 가능할 것으로 보입니다. 만약 앞으로도 저렴한 가격을 앞세운다면, 전체 AI 시장에는 큰 변화가 일어날 수 있습니다.
이어 15일 주요 뉴스입니다.
■ "오픈AI, X와 경쟁할 소셜 미디어 개발 중...이미지 생성 공유에 초점"
오픈AI가 내부에서 소셜 미디어를 구축 중이라는 소식입니다. 챗GPT로 생성한 지브리 이미지를 X(트위터)에 공유, 일론 머스크 좋은 일 시키는 게 마음에 들지 않았나 봅니다. 사용자 8억명이면 따로 SNS를 만들고도 충분합니다.
■ "출시 임박한 o3·o4-미니는 과학 연구 위한 독보적 모델"
이번 주 출시될 것으로 보이는 오픈AI의 추론 모델은 과학 지식에 특화된 모델이라고 합니다. 특히 인간 과학자들과는 달리, 여러 분야에 정통하다는 것이 장점입니다. 이런 조수라면 거금을 내고도 영입할 만하다는 것입니다.
■ 애플, 아이폰 사용자 데이터로 기기에서 AI 학습 시작…”데이터 유출 없이 AI 성능 개선”
애플이 아이폰 데이터로 사용자 분석을 시작한다고 발표했습니다. 애플이 가장 자랑했던 기능인데, 무려 발표 10개월이 지난 뒤에 시작하는 것입니다. 또 개인정보 보호를 위해 복잡한 '합성 데이터 비교' 방식을 도입했습니다.
AI타임스 news@aitimes.com
