(사진=셔터스톡)
(사진=셔터스톡)

오픈AI가 인공지능(AI) 에이전트 성능 고도화를 위한 우선순위로 '추론'과 '도구사용' 능력 강화를 꼽았다. 또 최근 출시한 리얼타임 API와 챗GPT 서치는 AI 에이전트 개발을 위한 필수 과정이었다고 설명했다.

올리비에 고드먼트 오픈AI 플랫폼 제품 책임자는 5일(현지시간) MIT 테크놀로지 인터뷰와의 인터뷰에서 현재 개발 중인 AI 에이전트에 관한 내용을 소개했다.

우선 고드먼트 책임자는 최근 출시한 리얼타임 API와 챗GPT 검색이 결국 AI 에이전트 기능을 위한 것이라고 강조했다.

그는 "몇년이 지나면 지구상의 모든 사람과 모든 기업에는 맞춤형 에이전트가 있을 것"이라며 "에이전트는 당신을 매우 잘 알고 있을 것"이라고 말했다. 에이전트는 사용자를 대신해 이메일과 앱, 캘린더 등에 접근할 수 있고, 각 도구와 상호 작용하고 특정 주제에 대한 논문을 쓰는 것과 같은 장기적인 문제를 해결하는 등 '총괄 매니저'처럼 행동할 것이라고 설명했다. 

오픈AI의 전략은 에이전트를 직접 구축하는 것은 물론, 개발자가 자체 에이전트를 구축할 수 있도록 돕는 것이라고 전했다. 이를 위해 오픈AI 기술로 개발자들이 챗봇을 구축할 수 있도록 지원하는 리얼타임 API가 중요하다는 것이다.

리얼타임 API를 통해 지원하는 고급음성모드(AVM)는 에이전트의 느낌을 강화하는 것은 물론 사용성에서도 중요한 역할을 할 것으로 봤다. "현재 대부분의 앱은 채팅 기반이지만, 모든 사용 사례에 적합한 것은 아니다"라며 "타이핑을 하지 못하거나 화면을 볼 수 없는 사용 사례를 위해 음성은 필수적"이라고 말했다. 

그러나 고드먼트 책임자는 에이전트가 실제로 존재하기 위해서는 극복해야 할 두가지 큰 장애물이 있다고 지적했다. 

첫번째는 추론이다. AI 에이전트가 복잡한 작업을 완료하고 올바르게 일을 처리할 수 있으려면 믿을만한 성능을 내야 한다는 것이다.

그래서 오픈AI도 o1 모델을 개발한 이후에 에이전트 기능을 강화할 수 있었다고 전했다. o1은 답변을 생성할 시간을 더 주면 실수를 인식하고 수정하고, 문제를 더 작은 문제로 나누고, 질문에 답하는 다양한 접근 방식을 시도할 수 있다. 

물론 o1이 추론 능력에 대해서는 회의적인 시선도 있다. 애플 연구진은 지난달 "AI는 본질적으로 추론이라는 작업을 할 수 없으며, 패턴 매칭 능력이 향상된 것일 뿐"이라는 연구 결과를 내놓았다.

고드먼트 책임자도 아직 할 일이 많다고 인정했다. 단기적으로는 o1과 같은 추론 모델을 더 안정적이고 빠르고 저렴하게 만드는 것이다. 장기적으로는 현재 수학이나 과학, 코딩에 집중된 추론 기능을 법률이나 회계, 경제 등 다양한 분야로 확장하는 것이다. 

두번째는 다양한 도구를 연결하는 기능이다. 대표적인 것이 검색 기능으로, 기존 훈련 데이터에만 의존해야 하면 에이전트의 기능은 제한될 수밖에 없다는 것이다.

검색은 물론 현실 세계에서 조치를 취할 수 있어야 한다. 앤트로픽의 '컴퓨터 유즈'처럼 인터페이스와 상호작용, 컴퓨터를 실제로 작동하는 능력을 말한다.

"o1은 어느 정도 도구를 사용할 수는 있지만, 아직 고도화할 여지가 많다"라고 밝혔다.   

관련 기술의 발전으로 내년에는 AI 에이전트가 많이 등장할 것으로 봤다. 하지만 사람들이 이 기술을 어떻게 도입하고 사용할지는 예측하기 어렵다고 전했다.

그는 "솔직히 말해서, 매년 돌이켜보면 예상치 못한 사용 사례가 등장해서 놀라는 경우가 많았다"라며 "아무도 예상하지 못했던 놀라운 일들이 꽤 있을 것으로 예상한다"라고 말했다.

한편, 디 인포메이션의 지난달 22일 보도에 따르면 오픈AI는 내부에서 범용 AI 에이전트를 선보이고 데모까지 진행했다. 고드먼트 책임자의 인터뷰는 이를 시인한 셈이다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지