(사진=앤트로픽)
(사진=앤트로픽)

앤트로픽이 소프트웨어 코딩과 복잡한 다단계 작업 처리 능력에서 최첨단 성능을 갖춘 프론티어 모델 '클로드 4.5(Claude 4.5)'를 선보였다. 이를 통해 기업용 인공지능(AI) 시장 점유율을 강화한다는 목표다. 

앤트로픽은 29일(현지시간) ‘클로드 소네트 4.5(Claude Sonnet 4.5)’를 공개하며, 코딩 작업 지속 시간이 최대 30시간으로 크게 늘어났다고 발표했다.

이는 기존 '오퍼스 4'의 최대 7시간을 4배 이상 연장한 것으로, 기업이 복잡한 프로젝트를 장시간 자동화하는 데 활용할 수 있다.

또 소네트 4.5는 사이버보안과 금융 서비스 등 B2B 영역에서 탁월한 성능을 보이며, 실질적인 비즈니스 업무에 적합하도록 설계됐다고 밝혔다. 사용자의 컴퓨터를 활용해 다양한 작업을 자동으로 수행하는 에이전트 기능도 크게 개선됐다.

코드 실행과 스프레드시트·슬라이드·문서 생성 등 기능을 클로드 챗봇 앱에서 직접 처리할 수 있으며, VS 코드 연동과 컨텍스트 편집, 장기 작업 메모리 기능 등도 새롭게 추가됐다.

벤치마크 결과 (사진=앤트로픽)
벤치마크 결과 (사진=앤트로픽)

코딩 성능은 역시 최고를 기록했다. 'SWE-벤치 베리파이드' 평가에서 77.2%로, 소프트웨어 엔지니어링 분야 최첨단(SOTA) 성능을 입증했다.

또 'OS월드 벤치마크'에서는 61.4%를 기록, 기존 소네트 4의 42.2% 대비 크게 향상된 컴퓨터 활용 능력을 보여주었다.

이번 모델에 자체 'AI 안전 등급 3(ASL-3)'로 구분, 화학·생물·방사능·핵무기 관련 위험 입력과 출력 감지를 위한 필터를 적용했다. 또 모델의 아첨·기만·권력 추구 행동을 줄이고, 프롬프트 인젝션 대응 능력도 강화했다고 밝혔다.

앤트로픽은 이날 '클로드 에이전트 SDK'도 공개했다. 이 SDK는 '클로드 코드'의 기반 인프라를 개발자에게 제공해, 코딩뿐 아니라 다양한 업무용 에이전트를 구축할 수 있도록 지원한다.

또 ‘이매진 위드 클로드(Imagine with Claude)’라는 연구용 미리보기 버전도 제공된다. 사용자가 요청하는 대로 실시간으로 코드를 생성하며, 사전 작성된 기능 없이 동적으로 소프트웨어를 제작하는 과정을 체험할 수 있다.

하지만, 타사에 비해 최대 7배까지 비싼 API 사용료는 낮추지 않았다. 소네트 4와 동일하게 입력 100만 토큰당 3달러, 출력 100만 토큰당 15달러로 책정됐다. "향상된 성능을 동일한 비용으로 이용할 수 있다"라는 설명이다.

앤트로픽은 지난달 출시된 오픈AI 'GPT-5'와 기업 시장에서 경쟁을 벌이고 있다. GPT-5는 성능뿐 아니라, 공격적인 가격 전략으로 추격을 펼치고 있다. 코드 생성 시장에서 42%의 점유율로 오픈AI(21%)를 앞서고 있다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지