앤트로픽이 속도와 비용 효율을 크게 개선한 초소형 AI 모델 ‘클로드 하이쿠 4.5(Claude Haiku 4.5)’를 공개했다. 

앤트로픽은 15일(현지시간) 클로드 하이쿠 4.5를 출시하며, 지난 5월 출시된 ‘클로드 소네트 4’와 비슷한 성능을 제공하면서 속도는 2배 이상 빠르고 비용은 3분의 1 수준으로 낮췄다고 전했다.

코딩과 에이전트 등 기업 환경에 맞춰진 하이쿠 4.5는 지연 시간이 중요한 실시간 서비스와 개발 환경에 최적화됐다. 특히, 코드 생성 도구 ‘클로드 코드’에서 활용하면 반응 속도가 크게 향상, 실시간 협업과 신속한 프로토타이핑이 쉬워진다는 설명이다.

또, 기업이 상위 모델인 소네트 4.5와 동시에 사용하면 큰 효과를 볼 수 있다고 강조했다. 소네트 4.5가 복잡한 계획을 수립하고, 여러 개의 하이쿠 4.5가 세부 작업을 병렬 처리하는 멀티에이전트 아키텍처 구현이 가능하다고 전했다.

마이크 크리거 앤트로픽 최고 제품책임자(CPO)는 “소네트가 전략을 세우고, 하이쿠 기반 하위 에이전트들이 이를 빠르게 실행하는 구조를 통해 완전한 AI 에이전트 툴박스를 제공한다”라며 “AI를 실제 서비스 환경에 적용할 수 있는 완전히 새로운 범주를 열었다”라고 말했다.

벤치마크 결과 (사진=앤트로픽)
벤치마크 결과 (사진=앤트로픽)

벤치마크 성능도 주목할 만하다.

'SWE-벤치 베리파이드'에서 73%, '터미널-벤치'에서 41%를 기록, 소네트 4.5보다는 다소 낮지만 '소네트 4' 'GPT-5' '제미나이 2.5'와 비슷한 수준을 보였다. 특히 컴퓨터 활용 관련 작업에서는 50.7%를 기록해 소네트 4를 능가했다.

안전성 측면에서도 우수한 성과를 보였다. 자동 정렬(Alignment) 테스트에서 소네트 4.5와 오퍼스 4.1보다 비정렬 행동 비율이 낮아, 현재까지 앤트로픽 모델 중 가장 안전한 모델로 평가됐다. 또 화학·생물·방사능·핵(CBRN) 관련 위험도도 낮아 AI 안전등급(ASL) 2단계로 분류됐다. 이는 소네트 4.5·오퍼스 4.1보다 한 단계 낮은 위험 수준이다.

앤트로픽은 이번 모델을 클로드 무료 사용자 전원에게 서비스한다고 밝혔다. 이를 통해 “수개월 전까지는 프리미엄 모델에서만 가능했던 ‘준프론티어급 지능’을 누구나 무료로 활용할 수 있게 됐다”라고 강조했다.

하이쿠 4.5는 API, 아마존 베드록(Bedrock), 구글 클라우드 버텍스 AI(Vertex AI) 등 주요 플랫폼에서도 바로 사용할 수 있다.

API 가격도 기존보다 크게 낮췄다. 입력 토큰 100만개당 1달러, 출력 토큰 100만개당 5달러다. 이는 소네트 4의 약 3분의 1, 오퍼스 4.1의 5분의 1 수준이다.

클로드는 우수한 코딩 성능으로 인기를 얻었지만, 다른 모델에 비해 가격이 비싸다는 지적을 받았다. 따라서 이번 모델은 기존과 비슷한 성능을 유지하며, 가격 경쟁력까지 갖추려는 시도다. 특히, 최근 AI 코딩 시장에서는 오픈AI의 'GPT-5-코덱스'가 추격을 펼치고 있다.

한편, 클로드 4.5 시리즈 중 가장 큰 규모의 플래그십 모델 '오퍼스' 출시도 임박한 것으로 밝혀졌다.

크리거 CPO는 CNBC와의 인터뷰에서 “올해 말이나 내년 초에 클로드 오퍼스 4.5를 공개할 계획”이라고 말했다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지