"오픈AI, 인간 추론 능력에 근접...코드명 '스트로베리' 출시 임박" < 산업일반 < AI산업 < 기사본문

오픈AI가 인간처럼 추론할 수 있는 기술인 '스트로베리(Strawberry)'의 출시에 근접한 것으로 알려졌다. 이는 지난해 말 샘 알트먼 CEO가 인공일반지능(AGI)에 도달할 유력한 단서로 꼽은 '큐스타(Q*)'의 이름을 바꾼 것으로, 오픈AI가 전날 자신들의 AGI 5단계 중 2단계에 근접했다고 밝힌 것은 이 때문으로 드러났다.

로이터는 12일(현지시간) 오픈AI의 내부 문서를 입수하고 정통한 관계자들을 인용, 오픈AI가 스트로베리라는 코드명으로 인공지능(AI) 모델에 대한 새로운 접근 방식을 개발 중이라고 보도했다.

이 문서를 입수한 것은 지난 5월로, 프로젝트 진행 상황이나 출시 시기 등은 확인할 수 없었다고 밝혔다. 하지만 소식통들은 최근 몇 달 동안 오픈AI가 외부에 상당히 진보된 추론 기술을 출시할 시점에 도달했다는 신호를 비공개적으로 보내고 있다고 전했다.

스트로베리는 AI의 추론 능력을 인간 수준으로 끌어올리는 것이 핵심이다. 로이터 역시 이름을 바꾸기 전인 올해 초에는 큐스타 데모라는 것을 문서 두곳에서 확인했는데, 여기에는 현재 AI 모델의 가장 큰 문제점인 수학 문제 해결법이 담겼다고 전했다.

이는 지난해 말 알트먼 CEO가 언급한 큐스타의 내용 그대로다. 문서대로라면 이 프로젝트는 이름을 바꾼 뒤 올해도 계속 진행되고 있으며, 특히 이번 주 오픈AI 직원들에게 내부 시연을 펼칠 정도로 고도화된 것으로 보인다.

그리고 이를 근거로 오픈AI는 자신들이 AGI 5단계 중, 두번째 단계에 근접했다고 밝혔다. 2단계는 1단계인 단순 챗봇을 넘어, 2단계는 박사 수준 교육을 받은 사람처럼 고도의 추론이 가능한 '추론자(Reasoners)'다.

문서에는 스트로베리로 무엇을 할 수 있는지는 나와 있지만, 어떻게 할 수 있는지는 나와 있지 않았다고 전했다. 또 오픈AI 내부에서도 작동 원리는 철저히 비밀로 유지된다는 소식통의 증언이다.

12명 이상의 AI 연구자들에게 이 문제에 대한 의견을 구한 결과, 문서에 적힌 스트로베리의 능력은 지금까지 AI 모델에 해결하지 못한 문제라는 답을 얻었다고 전했다. 현재 대형언어모델(LLM)은 학습 데이터에 따라 패턴을 출력하는 것에 불과하며, 진짜 사람처럼 생각하는 것은 아니기 때문이다.

이 때문에 얀 르쿤 메타 AI 수석과학자는 LLM이 인간처럼 추론하는 것은 불가능하다고 주장하고 있다. 따라서 올해부터는 대안으로 현실 세계를 이해하는 '공간 지능' 연구도 활발해지고 있다.

하지만 AGI 도달 방법 중 추론, 특히 수학 문제 해결은 중요한 잣대로 꼽힌다. 해석에 따라 달라질 수 있는 언어 문제와 달리, 수학은 정답이 하나이기 때문에 정확한 추론을 필요로 한다. 큐스타도 초등학생 수준의 수학 문제를 정확하게 풀어내며 추론 능력을 인정받은 것으로 알려졌다.

또 소식통들은 스트로베리가 모델 재학습을 통해 모델 성능을 끌어 올리는 방법이라고 설명했다. 특히 2022년 스탠포드대학교에서 발표한 '스타(STaR)'라는 방법과 유사하다는 분석이다.

스타는 '자체학습 추론자(Self-Taught Reasoner)'의 약자로, 추론을 통한 추론의 부트스트래핑(Bootstrapping Reasoning With Reasoning)이라는 부제를 달고 있다. 간단하게 정리하면 AI가 방대한 데이터를 학습한 뒤에도 같은 작업을 계속 반복하며 추론 능력을 조금씩 향상하는 방법을 말한다. 학습을 반복하면 이론적으로는 AI가 인간 수준에 근접할 수 있다는 것이 논문 저자들의 설명이다.

따라서 이는 엄청난 컴퓨팅 리소스를 필요로 한다. 알트먼 CEO가 AI 칩 확보를 위해 글로벌 네트워크를 구축하겠다며 뛰어다닌 것도 큐스타의 실마리를 잡았다고 밝힌 직후부터다. 또 연초에는 "AI의 가장 중요한 진보 분야는 추론 능력이 될 것"이라고 강조했다.

문서에는 AI 에이전트 개발 계획도 언급된 것으로 밝혀졌다.

오픈AI는 스트로베리의 목표 중 하나로 '장기 작업(LHT)'을 수행하는 것이라고 밝혔는데, 이는 모델이 미리 계획하고 장기간에 걸쳐 일련의 작업을 수행해야 하는 복잡한 작업을 말한다. 여기에는 '심층 연구(deep reseach)'라는 이름을 붙였다.

이를 통해 AI 에이전트를 구축할 수 있다는 설명이다. 오픈AI는 이를 '컴퓨터를 사용하는 에이전트(CUA)'라고 불렀다.

이와 관련, 오픈AI는 "새로운 AI 기능에 대한 지속적인 연구는 업계에서 일반적인 관행이며, 이런 시스템은 시간이 지남에 따라 추론이 개선될 것이라는 공통된 믿음이 있다"라는 공식 입장을 내놓았다.

스트로베리에 대해서는 답하지 않았다.

임대준 기자 ydj@aitimes.com