(사진=오픈AI)
(사진=오픈AI)

현재 오픈AI 서비스 중 다른 곳에 비해 가장 성능이 뛰어나다고 알려진 것은 무엇일까요. '챗GPT'의 주축 모델인 'GPT-4o'나 추론 모델 'o1-프로' 및 'o3-미니-하이' 등을 꼽을 수 있겠습니다만, 벤치마크에서 가장 크게 다른 모델을 앞서는 것은 '딥 리서치'입니다.

이는 '인류의 마지막 시험(HLE)'이라는 가장 어려운 벤치마크에서 26.6%의 정확도를 기록, '딥시크-R1'이나 o3-미니 등을 두배 이상 앞서고 있습니다. 일론 머스크 CEO는 '그록-3'를 출시하며 갖가지 벤치마크로 자신의 모델이 1위를 차지했다고 홍보했지만, HLE 점수만큼은 공개하지 않았습니다. 이는 그록-3가 아직 딥 리서치를 능가하지는 못한다는 것을 의미합니다.

이 서비스는 기존 대형언어모델( LLM)과는 다릅니다. 최첨단 추론 모델인 'o3'가 기반이지만, 단지 사전 학습한 내용을 출력하는 것이 아닙니다. 사람처럼 인터넷을 찾아보며 획득한 사실로 기존 지식을 보강하는 에이전트입니다. 인간이 몇달 걸릴 작업도 딥 리서치는 몇시간 만에 처리, 결과적으로 인간 전문가 이상의 수준으로 답변을 생성할 수 있습니다.

사실 이 기능을 처음 선보인 곳은 구글입니다. 지난해 12월11일(현지시간) '제미나이 2.0'을 출시하며 이를 대표적인 기능이라고 소개했습니다. 그러나 늘 그렇듯 한꺼번에 많은 내용을 발표하다 보니, 당시에는 AI 음성 비서인 '프로젝트 아스트라'에 묻혔습니다.

그리고 오픈AI가 2월3일 이를 출시하며, 본격적으로 부각되기 시작했습니다. 웹 사이트를 AI가 뒤지며 지식을 보강하는 방식이라 환각이 적고, 이 때문에 금융이나 과학 연구, 의료처럼 민감한 분야에 적합하다는 것을 강조했습니다. 그리고 바로 다음 날부터 이에 대한 극찬이 등장했습니다.  

그러자 허깅페이스가 다음날 딥리서의 오픈 소스 버전을 공개했고, 퍼플렉시티도 14일 똑같은 이름의 딥 리서치를 출시했습니다. 이들은 각각 오픈 소스라는 점과 오픈AI보다 낮은 가격을 장점으로 내세웠습니다. 물론 성능은 오픈AI가 여전히 앞서고 있습니다.

결국, 일론 머스크의 xAI도 17일 그록-3를 출시하며 딥 리서치와 흡사한 '딥서치'를 공개했습니다. 특히 이를 사용할 수 있는 월 300달러(약 43만2450원) 프리미엄 요금제까지 만들었습니다.

이제는 모바일에서도 사용할 수 있습니다. 구글은 18일 유료 사용자를 대상으로 제미나이 모바일 앱에 이 기능을 추가했다고 발표했습니다. 작업이 좀 시간이 걸리는 만큼, 이동 중에도 결과를 확인할 수 있다는 것입니다.

특히, 순다르 피차이 CEO는 "2025년에 검색 사상 가장 큰 변화가 일어날 것"이라고 밝히며, 그 예 중 하나로 딥 리서치를 들었습니다.

(사진=구글)
(사진=구글)

물론, 맛집처럼 간단한 지식을 묻는 일반적인 검색에는 이 기능이 필요하지 않습니다. 하지만 많은 시간 동안 관련 문서를 검색하는 연구 분야에서는 인간 전문가 몇명의 역할을 할 수 있는 것이 사실입니다. 

샘 알트먼 오픈AI CEO가 "2025년에 최초의 AI 에이전트가 인력에 합류, 회사의 결과를 실질적으로 바꿀 수 있을 것"이라고 예고한 것도, 오픈AI가 월 2000달러(약 288만원)짜리 요금제를 검토 중이라는 말이 등장한 것도 이 때문으로 볼 수 있습니다. 전문 연구자 한명을 월 300만원 정도에 고용하는 것은 싼 편이라는 논리입니다.

이처럼 딥리서치는 어느새 AI 기업의 대세가 됐습니다. 그리고 이는 딥시크와 같은 오픈 소스에서는 아직 따라오기 어려운 분야입니다. 이 서비스에는 모델뿐만 아니라 검색과 추론 등 다양한 기술을 결합해야 하고, 또 컴퓨팅 인프라를 많이 소비하기 때문입니다.

딥시크 등장 몇주 만에 이처럼 AI 업계의 분위기는 또 바뀌고 있습니다. 이제는 벤치마크에서 딥시크를 넘었다는 사실도 별로 강조되지 않습니다. 

또 앞으로 등장할 메타의 '라마 4'나 앤트로픽의 첨단 모델에 딥 리서치가 추가될 것은 뻔합니다. 이는 단순한 모델이 아니라, AI의 활용도를 극대화하는 AI 에이전트 서비스이자, 이제까지 등장한 서비스 중 가장 고부가 가치이기 때문입니다. 이를 내놓지 않겠다는 것은 유료화를 포기하겠다는 것을 의미합니다.

이어 18일  주요 뉴스입니다.

LG AI연구원, 데이터셋 저작권 문제 파악하는 에이전트 '넥서스' 출시

LG AI 연구원이 사람이 일일이 뒤지기 어려운 AI 학습 데이터를 분석하고 저작권 문제가 있는지를 체크해주는 모델을 출시했습니다. 날로 저작권의 중요성이 강화되는 가운데, LG AI연구원이 이 분야 선두로 나설지 주목됩니다. 

(사진=LG AI연구ㅜ원)
(사진=LG AI연구ㅜ원)

알트먼 "GPT-4.5 테스트 중 AGI 느꼈다는 평 많아"

알트먼 CEO가 GPT-4.5에 대한 홍보 글을 남겼습니다. 그런데 정작 내부에서는 성능 향상이 시원치 않다며 주력 모델 출시를 포기했다는 것이 아이러니합니다

검색 대기업 바이두, 시진핑 면담서 제외된 뒤 주가 폭락

검색에 이어 AI에서도 중국 선두를 자처하던 바이두가 불과 1년 만에 2류로 전락했습니다. 특히 딥시크도 참석한 시진핑 주석의 기술 기업 면담에 초청되지 못하자, 주가는 9%가량 하락했습니다.

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지