(사진=앤트로픽)
(사진=앤트로픽)

앤트로픽이 ‘클로드 소네트 4(Claude Sonnet 4)’의 컨텍스트 창을 5배 확대한 100만 토큰으로 대폭 늘렸다. 이를 통해 개발자들이 많이 요청했던 대규모 코드베이스 처리를 한번에 가능하게 다.

앤트로픽은 12일(현지시간) 클로드 소네트 4가 프롬프트 한번으로 최대 100만 토큰의 문맥을 처리할 수 있게 됐다고 발표했다.

이는 기존 20만 토큰 대비 5배 확대한 수치로, 약 7만5000줄 이상의 코드나 수십 편의 연구 논문을 한번에 분석할 수 있는 수준이다.

이번 확장은 현재 퍼블릭 베타로 앤트로픽 API와 아마존 베드록(Bedrock)에서 제공되며, 구글 클라우드 ‘버텍스 AI(Virtex AI)’ 연동도 예정돼 있다.

앤트로픽은 가장 먼저 대규모 코드 분석에 따라 전체 시스템 설계를 고려한 개선 사항을 제안할 수 있다고 강조했다.

소스 파일, 테스트, 문서를 포함한 전체 코드베이스를 로드, 프로젝트 아키텍처를 이해하고 파일 간 종속성을 파악할 수 있다는 것이다.

또 용량 확장에 그치지 않고 정확성 면에서도 강점이 있다고 밝혔다.

내부에서 실시한 ‘건초더미 속 바늘 찾기’ 테스트에서 100% 성능을 기록했다. 이 때문에 대규모 코드 저장소 전체를 분석하거나 수백개 문서의 관계성을 유지하며 종합하는 작업, 수백차례 도구 호출이 필요한 복잡한 워크플로우를 유지하는 AI 에이전트 활용 등에서 활용도가 높을 것으로 기대했다.

이전까지 개발자들은 대규모 프로젝트를 AI로 처리하려면 코드나 데이터를 작은 조각으로 나눠야 했고, 이 과정에서 중요한 맥락이 손실되는 문제가 있었다.

션 워드 아이젠트 AI CEO는 “100만 토큰 문맥은 소프트웨어 엔지니어링 에이전트를 실질적인 생산 환경 수준으로 끌어올렸다”라고 평했다.

다만, 장문 처리에는 더 많은 연산이 필요하기 때문에 가격도 조정됐다. 20만 토큰 이하 요청은 기존 요금을 유지하지만, 이를 초과하는 대규모 요청은 입력 토큰 100만개당 6달러, 출력 토큰 100만개당 22.5달러가 부과된다.

초기에는 API 상위 등급과 맞춤 요금제 고객에 한해 제공되며, 앞으로 확대될 예정이다. 이는 오픈AI의 GPT-5보다 높은 가격이지만, 앤트로픽은 프롬프트 캐싱 등 최적화를 통해 장문 처리가 전통적인 검색 증강 생성(RAG) 방식과 비교해도 비용 경쟁력을 갖출 수 있다고 설명했다.

100만 토큰 컨텍스트 창은 이미 경쟁사들에서는 흔하다. 메타의 ‘라마 4 스카우트’와 구글의 ‘제미나이 1.5 프로’, 오픈AI의 ‘GPT-4.1’ 등이 100만 토큰을 지원하며, ‘제미나이 2.5 프로’는 무려 200만 토큰에 달한다.

하지만 앤트로픽은 코드 작성과 추론 정확도 측면에서 우위에 있다고 주장했다.

이번 업데이트는 경쟁사들, 특히 오픈AI가 'GPT-5'의 코딩 실력을 강조하며 추격에 나선 과정에 등장한 것이다.

앤트로픽은 “큰 맥락을 볼 수 있는 AI가 종종 더 나은 답을 낸다”라며 “이번 확장은 대규모 엔터프라이즈 개발 환경에서 중요한 전환점이 될 것”이라고 밝혔다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지