딥마인드 핵심 개발자들이 설립해 화제가 된 인공지능(AI) 에이전트 스타트업 리플렉션 AI(Reflection AI)가 투자 유치 사실을 공개하고 스텔스 상태를 벗어났다. 이들은 AI 코딩 에이전트를 통해 '초지능 자율 시스템(superintelligent autonomous systems)' 구축을 목표로 내세웠다.
블룸버그는 8일(현지시간) 리플렉션 AI가 총 1억3000만달러(약 1885억원)의 초기 자금을 확보하고 공식 출범했다고 보도했다. 이 회사는 이날 홈페이지를 공식 오픈하고 개발자를 모집한다고 밝혔다.
이번 자금은 세쿼이아 캐피털과 CRV가 주도한 지난해 시드 라운드의 2500만달러와 CRV 및 라이트스피드 벤처 파트너스가 주도한 시리즈 A 라운드의 1억500만달러를 합친 것이다. 이 외에도 엔비디아와 리드 호프먼 링크드인 공동 창립자, 알렉산드르 왕 스케일 AI CEO 등 유명 투자자들이 참여했다. 기업 가치는 5억5500만달러(약 8000억원)로 평가됐다.
이 회사의 설립은 이미 지난해 8월 세쿼이아의 투자 발표와 함께 공개됐다. 당시에는 구글 딥마인드 베테랑 연구원인 이오아니스 안토노글루와 세르질 오자르, 그리고 버클리 인공지능 연구소를 거쳐 딥마인드에 합류한 미샤 라스킨 CEO가 공동 설립했다는 것 외에는 많은 것이 알려지지 않았다.
하지만 멤버의 이름값만으로 많은 사람들의 관심을 끌었다.
안토노글루 공동 창립자는 딥마인드의 '알파고' 구축에 참여했으며, 지난 2013년 딥마인드가 아타리 비디오 게임을 인간 개입 없이 학습할 수 있도록 개발한 '심층강화학습(Deep Reinforcement Learning)' 논문 저자 중 한명으로도 유명하다. 지난해까지 구글의 '제미나이' 개발 팀에서 인간 피드백을 통한 강화 학습(RHLF)을 이끈 핵심 인물이다. 라스킨 CEO도 제미나이의 개발에 참여했다.
오자르 역시 '트랜스포머'만큼 유명한 '적대적 생성 신경망(GAN)' 논문 저자 중 하나다. 그는 테슬라를 거쳐, 리플렉션 AI에 합류했다.
특히 이 회사의 멤버들이 개발에 참여한 모델은 ▲심층강화학습 알고리즘 'DQN'(2013년)을 시작으로 ▲알파고(2015년) ▲알파제로(2017년) ▲뮤제로(2019년) 등 일련의 게임 이론 모델을 거쳐 팜(PaLM, 2022년) ▲GPT-4 ▲제미나이(이상 2023년) ▲제미나이 1.5(2024년)까지로, AI 모델 역사 자체로 볼 수 있다.
이 때문에 이들이 구글을 떠났다는 사실은 꽤 주목받았으며, 이미 지난해 1월부터 회사를 설립했다는 소식이 전해졌다.
이들은 '초지능 에이전트' 개발을 목표로 내세웠으며, 첫번째 프로젝트로 자율 프로그래밍 에이전트를 개발하고 있다고 밝혔다. 이 에이전트는 코드 취약점 탐지, 메모리 사용 최적화, 코드 설명 문서 자동 생성, 응용 프로그램 인프라 관리 등의 작업을 자동으로 수행할 수 있다.
이를 위해 대형언어모델(LLM)과 강화 학습(RL)을 결합한 새로운 AI 시스템을 설계하고 있다. 자세한 사항은 밝히지 않았으나, 기존의 트랜스포머 아키텍처를 넘어 새로운 접근법을 모색하고 있으며 대안 아키텍처인 '맘바(Mamba)'를 활용하는 방안도 고려 중인 것으로 알려졌다.
라스킨 CEO는 "우리는 트랜스포머를 뛰어 넘는 문제에 대해 10년 넘게 고민해 왔으며, 이제야 LLM과 강화 학습을 결합해 실용적인 초지능을 구축하고 컴퓨터에서 작업을 수행하는 시스템을 만들 때라고 확신했다"라고 말했다.
이처럼 기존 코딩 도구들이 개발자의 지시를 받고 대신 코드를 짜주는 데 그치는 것과 달리, 이 회사는 사람처럼 독립적으로 소프트웨어 개발 계획을 세우고 결정을 내릴 수 있는 능력을 갖춘 완전 자율 에이전트를 구축하는 것이 특징이다.
라스킨 CEO는 이를 자율주행 시스템에 비유했다. "다른 회사의 AI 에이전트가 인간의 운전을 보조하는 '크루즈 컨트롤'이라면, 우리는 웨이모처럼 '완전 자율주행' 시스템을 구축하는 것이 목표"라고 설명했다.
박찬 기자 cpark@aitimes.com
