(사진=오픈AI)
(사진=오픈AI)

오픈AI가 코딩용 에이전트에 최적화된 ‘GPT‑5‑코덱스(GPT‑5-Codex)’을 선보였다. 이 모델은 개발자와의 실시간 협업뿐 아니라 장기적이고 복잡한 코딩 작업도 독립적으로 수행할 수 있어, 코드 리뷰와 에이전트형 개발 업무에 최적화된 성능을 제공한다는 설명이다.

오픈AI는 15일(현지시간) ‘코덱스’ 환경에서 에이전트형 코딩에 최적화된 GPT-5-코덱스를 출시했다.

GPT-5를 소프트웨어 엔지니어링 작업에 최적화된 버전으로, 단순한 코드 자동완성 수준을 넘어 버그 수정과 코드 리뷰, 리팩터링, 신규 기능 구현까지 독립적으로 수행할 수 있도록 설계됐다.

가장 큰 특징은 적응형 사고(adaptive thinking)다. 기존 모델이 작업 시작 시점에 연산 자원을 미리 배분했다면, GPT-5-코덱스는 실시간으로 사고 시간을 조정한다. 이에 따라 단순 버그 수정에는 몇초 만에 답변할 수 있지만, 복잡한 리팩토링 작업에는 최대 7시간 이상 독립적으로 실행되며 계획을 수정하고 결과를 내놓는다.

'SWE-벤치 베리파이드' 등 에이전트 코딩 벤치마크와 대규모 리팩토링 테스트에서도 GPT-5에 비해 우수한 성능을 보였다.

알렉산더 엠비리코스 오픈AI 코덱스 총괄은 “라우터 기반의 GPT-5는 초기에 연산량을 고정하지만, GPT-5-코덱스는 라우터가 없으며 필요 시 작업 중간에도 사고 시간을 늘린다”라며 “덕분에 복잡한 프로젝트에서도 일관된 성능을 유지한다”라고 설명했다.

(사진=오픈AI)
(사진=오픈AI)

모델이 생성한 토큰 수 기준으로, GPT‑5-코덱스는 가장 작은 10% 작업에서는 GPT‑5보다 93.7% 적은 토큰을 사용한다. 반대로, 가장 복잡한 상위 10% 작업에서는 코드 편집과 테스트, 반복 작업에 두배의 시간을 투자하는 등 더 오래 생각한다.

특히, 코드 리뷰와 결함 탐지에 최적화됐다고 강조했다. 코드베이스를 탐색하고, 의존성을 분석하며, 코드를 실행하고 테스트하여 정확성을 검증할 수 있다.

오픈 소스 저장소의 커밋을 대상으로 성능을 평가한 결과, GPT‑5-코덱스가 제공한 리뷰 코멘트는 잘못되거나 중요하지 않은 코멘트가 적고 중요 문제에 주의를 집중시키는 데 효과적이었다.

프론트엔드 작업에서도 믿을 만한 파트너라고 소개했다. 데스크톱 앱뿐 아니라 모바일 웹사이트 제작에서도 인간 선호도 평가에서 크게 개선됐다. 클라우드 환경에서는 평균 완료 시간이 90% 단축됐고 입력한 이미지나 스크린샷을 시각적으로 검토하고 작업 진행 상황을 표시할 수 있다.

이번 업데이트로 GPT-5-코덱스는 코덱스가 포함된 모든 제품군에 기본 적용된다. 개발자는 터미널, IDE(통합개발환경), 깃허브, 챗GPT 앱 등에서 동일한 모델을 사용할 수 있으며, 코덱스 CLI(명령줄 인터페이스)와 IDE 확장 기능도 강화됐다. 특히 CLI는 작업 진행 상황 추적, 스크린샷 첨부, 자동 의존성 설치를 지원하며 오픈소스로 공개돼 외부 개발자들이 확장할 수 있다.

현재 챗GPT 플러스, 프로, 비즈니스, 에듀, 엔터프라이즈 요금제 사용자에게 배포됐으며, API로도 제공될 예정이다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지