앤트로픽이 컴퓨터 작업들을 사람처럼 자율적으로 수행하는 인공지능(AI) 에이전트 기능을 선보였다. 최근 생성 AI 시장에서 급부상하고 있는 AI 에이전트 경쟁에서 오픈AI에 한발 앞서 제품을 공개했다.
앤트로픽은 22일(현지시간) 홈페이지를 통해 ▲AI 에이전트 기능인 '컴퓨터 유즈(Computer Use)' ▲'클로드 3.5 소네트' 업그레이드 버전 ▲'클로드 3.5 하이쿠' 등을 출시했다고 발표했다.
이중 컴퓨터 유즈는 클로드 3.5 소네트의 API를 통해 서비스된다. 이를 통해 모델은 사람의 개입 없이 자율적으로 웹사이트를 개발하고 스프레드시트 등을 편집할 수 있다.
용어 그대로 컴퓨터를 사람처럼 사용한다. 화면에서 사용자 인터페이스(UI)를 인식해 버튼을 클릭하고 텍스트를 입력하며 웹사이트를 탐색하거나 다른 소프트웨어를 실행시킬 수 있다는 설명이다.
이를 위해 앤트로픽은 컴퓨터 인터페이스를 인식하고 상호작용할 수 있는 API를 구축했다. 개발자들은 이 API를 통합해 모델이 명령을 컴퓨터 명령으로 변환할 수 있도록 할 수 있다
예를 들어 "컴퓨터와 온라인 데이터를 사용해 특정 양식을 작성하라"는 명령을 받으면, AI는 스프레드시트를 확인하고 웹 브라우저를 열기 위해 커서를 이동해 관련 웹 페이지로 이동한다. 이어 웹페이지의 데이터를 사용해 양식을 작성하는 등의 일련의 컴퓨터 작업을 수행하는 식이다.
인간의 컴퓨터 사용 방식을 측정하는 것과 흡사한 멀티모달 에이전트 벤치마크 'OS월드(OSWorld)'에서 클로드 3.5 소네트는 스크린샷만으로 작업을 수행하는 카테고리에서 14.9%의 점수를 기록했다. 이는 2위인 7.8%보다 크게 높은 점수다. 더 많은 단계가 허용되었을 때 클로드는 22.0%의 점수를 기록했다.
자레드 카플란 앤트로픽 최고 과학자는 "기본적으로 컴퓨터 유즈는 컴퓨터를 사람과 같은 방식으로 사용한다"라며 "10개 또는 수백개 단계들로 이뤄진 작업들도 수행할 수 있다"라고 말했다.
컴퓨터 유즈 (영상=앤트로픽)
하지만 아직 이 기능은 테스트 단계에 불과하며 작업 성공률도 기대에는 못 미친다고 밝혔다. 항공편 예약 수정과 같은 업무를 도울 수 있는 능력을 테스트하기 위해 설계된 평가에서 클로드 3.5 소네트는 작업 성공률이 절반도 안 됐다.
앤트로픽은 컴퓨터 유즈를 피드백을 위해 우선 개발자들을 대상으로 퍼블릭 베타로 공개했다. 이용 과정에서 오류가 발생할 가능성이 있다고 덧붙였다.
또 아마존을 비롯해 아사나, 캔바, 노션 등에서는 이미 베타 테스트를 실시 중이라고 밝혔다. 개인 사용자들과 기업 고객들에는 몇개월 내로 오픈할 예정이다.
개발자는 현재 앤트로픽의 API와 아마존 '베드록', 구글 클라우드의 '버텍스 AI' 플랫폼을 통해 컴퓨터 유즈를 시도해 볼 수 있다.
이처럼 최근 생성 AI 시장은 AI 에이전트가 화두다. 마이크로소프트(MS)나 세일즈포스 같은 기업용 소프트웨어 회사들은 물론 오픈AI, 앤트로픽 같은 파운데이션 모델 개발사들도 자율 AI 에이전트 개발에 속도를 내고 있다. 최근 오픈AI의 추론 모델 'o1'에 눌려 있던 앤트로픽은 모처럼 반격에 나선 셈이다.
이날에는 업그레이드된 클로드 3.5 소네트와 새로운 클로드 3.5 하이쿠도 공개했다.
클로드 3.5 소네트는 더 강력하고 견고한 모델로, 'SWE-벤치 벤치마크'에서 오픈AI의 대표 모델 o1보다도 코딩 작업을 더 잘 수행할 수 있다고 주장했다. 따로 훈련받지 않았음에도 불구하고, 업그레이드된 클로드 3.5 소네트는 장애물을 만날 때 스스로 수정하고 작업을 다시 시도하며 수십 또는 수백 단계가 필요한 목표를 향해 작업할 수 있다고 주장했다.
클로드 3.5 하이쿠는 시리즈 중 가장 경량 버전으로, 특정 벤치마크에서 한때 앤트로픽의 최첨단 모델이었던 '클로드 3 오퍼스'의 맞먹는 성능을 보였다.
업그레이드된 클로드 3.5 소네트는 현재 모든 사용자에게 배포됐으며, 새로운 클로드 3.5 하이쿠는 이번 달 말 출시 예정이다.
그리고 플래그십 모델이자 오픈AI와 본격 성능 대결을 펼칠 '클로드 3.5 오퍼스'에 대해서는 "연내 출시 예정"이라고 밝혔다.
박찬 기자 cpark@aitimes.com
- 앤트로픽, 고성능 AI 시스템 안전 정책 업데이트..."4단계로 구분"
- 앤트로픽, 오픈AI 대응해 데이터 일괄 처리용 API 가격 50% 할인
- 앤트로픽, 최대 53조 가치로 자금 모집...오픈AI 4분의 1 수준
- "오픈AI, AI 에이전트 이미 개발...내부 시연도 진행"
- 앤트로픽, 자바스크립트로 시각화 도구 강화..."더 유용한 그래프 생성"
- 딥마인드, '시스템 2 사고' 강화한 AI 에이전트 프레임워크 ‘토커-리즈너’ 공개
- 구글, AI 에이전트 '자비스' 12월 공개 예정..."제미나이 기반 웹브라우저 전용"
- "앤트로픽의 AI 에이전트, AI 판도 뒤바꿀 대단한 기술"
- 링크드인, 채용 담당 'AI 에이전트' 출시..."채용 업무 80% 자동화"
- 앤트로픽, 데스크톱용 클로드 앱·받아쓰기 기능 출시..."편의성 향상"
- 프랑스 스타트업 H, AI 에이전트 '러너 H' 공개..."앤트로픽보다 성능 뛰어나"
- 앤트로픽의 AI 에이전트 테스트 결과 공개..."유용하지만 아직 기업 배포는 일러"
- MS도 브라우저 에이전트 '컴퓨터 유즈' 출시
