'AI 대모' 페이페이 리 스탠포드대학교 교수가 설립한 월드랩스가 현실 세계를 이해하고 판단하는 '공간 지능(spatial intelligence)'을 바탕으로 첫번째 ‘월드 모델(World Model)’을 선보였다. 앞으로 이 모델이 영화나 게임, 물리적 세계의 디지털 표현을 만드는 방식을 바꿀 것이라고 강조했다.

월드랩스는 2일(현지시간) 단일 이미지로부터 인터렉티브 3D 월드를 생성할 수 있는 인공지능(AI) 시스템을 공개했다.

이 시스템은 기존 AI 기술과 달리 단순히 2D 이미지를 3D 모델로 전환하는 데 그치지 않는다. 생성된 3D 모델은 사용자와 상호작용이 가능하며, 장면의 수정 및 조정도 지원한다. 즉, 물리법칙을 반영하는 디지털 세계를 생성(Generating Worlds)한다는 개념이다.

공식 블로그에서 기능을 체험해 볼 수 있다. 3D 게임처럼 키보드로 이미지 속을 이동할 수 있고, 마우스로 주변을 돌아볼 수도 있다. 게임 속 객체와도 상호작용이 가능하다. 이 모든 것이 정지 이미지 한장으로 생성된 것이다.

월드랩스는 “우리 기술은 어떤 이미지에서도 3D로 탐색할 수 있는 장면을 생성한다”라며 “입력 이미지 외의 모든 요소는 생성된 것”이라고 강조했다.

월드랩스의 AI 시스템은 이미지를 대화형으로 탐색 가능한 3D 장면으로 변환한다. (사진=월드랩스)
월드랩스의 AI 시스템은 이미지를 대화형으로 탐색 가능한 3D 장면으로 변환한다. (사진=월드랩스)

‘월드 모델(LWM)’이라는 새로운 카테고리에 속하는 이 시스템은 생성된 장면에 현실감을 더하기 위해 기본적인 물리 법칙을 준수하며, 높은 일관성과 사실성을 제공한다. 여기에 객체의 색상을 변경하거나 동적 조명을 추가하는 등의 자유롭게 효과와 애니메이션을 적용할 수 있다.

다만 현재 시스템은 초기 단계로, 장면 탐색이 특정 구역 내로 제한되거나 가끔 렌더링 오류가 발생할 수 있다. 월드랩스는 “지속적인 개선 작업이 진행 중”이라고 밝혔다.

이 기술이 어떤 분야에 유용할지는 확실하다. 주요 타깃으로 게임 개발자와 영화 스튜디오를 꼽았다. 이는 기존 그래픽이나 프로그래밍 작업을 획기적으로 줄일 수 있다. 또 디지털 트윈이나 현실 환경에서 훈련이 필요한 로봇의 AI에도 유용할 수 있다.

월드 랩스는 "대부분의 생성 AI 도구는 이미지나 비디오와 같은 2D 콘텐츠를 만들지만, 3D로 생성하면 제어와 일관성이 향상된다"라며 "우리는 영화나 게임, 시뮬레이터 및 물리적 세계의 다른 디지털 표현을 만드는 방식을 바꿀 것"이라고 밝혔다.

이번에 공개한 것은 3D 세계 생성 모델의 첫번째 초기 미리보기로, 대기자 명단을 통해 향후 출시 제품에 대한 정보를 공개하겠다고 덧붙였다.

한편, 이 회사는 지난 3월 설립됐으며, 10월에 공식 출범을 선언했다. 이미 기업가치는 10억달러를 넘었다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지