'AI 대모' 페이페이 리 스탠포드대학교 교수가 설립한 월드랩스가 현실 세계를 이해하고 판단하는 '공간 지능(spatial intelligence)'을 바탕으로 첫번째 ‘월드 모델(World Model)’을 선보였다. 앞으로 이 모델이 영화나 게임, 물리적 세계의 디지털 표현을 만드는 방식을 바꿀 것이라고 강조했다.
월드랩스는 2일(현지시간) 단일 이미지로부터 인터렉티브 3D 월드를 생성할 수 있는 인공지능(AI) 시스템을 공개했다.
이 시스템은 기존 AI 기술과 달리 단순히 2D 이미지를 3D 모델로 전환하는 데 그치지 않는다. 생성된 3D 모델은 사용자와 상호작용이 가능하며, 장면의 수정 및 조정도 지원한다. 즉, 물리법칙을 반영하는 디지털 세계를 생성(Generating Worlds)한다는 개념이다.
공식 블로그에서 기능을 체험해 볼 수 있다. 3D 게임처럼 키보드로 이미지 속을 이동할 수 있고, 마우스로 주변을 돌아볼 수도 있다. 게임 속 객체와도 상호작용이 가능하다. 이 모든 것이 정지 이미지 한장으로 생성된 것이다.
월드랩스는 “우리 기술은 어떤 이미지에서도 3D로 탐색할 수 있는 장면을 생성한다”라며 “입력 이미지 외의 모든 요소는 생성된 것”이라고 강조했다.
‘월드 모델(LWM)’이라는 새로운 카테고리에 속하는 이 시스템은 생성된 장면에 현실감을 더하기 위해 기본적인 물리 법칙을 준수하며, 높은 일관성과 사실성을 제공한다. 여기에 객체의 색상을 변경하거나 동적 조명을 추가하는 등의 자유롭게 효과와 애니메이션을 적용할 수 있다.
다만 현재 시스템은 초기 단계로, 장면 탐색이 특정 구역 내로 제한되거나 가끔 렌더링 오류가 발생할 수 있다. 월드랩스는 “지속적인 개선 작업이 진행 중”이라고 밝혔다.
이 기술이 어떤 분야에 유용할지는 확실하다. 주요 타깃으로 게임 개발자와 영화 스튜디오를 꼽았다. 이는 기존 그래픽이나 프로그래밍 작업을 획기적으로 줄일 수 있다. 또 디지털 트윈이나 현실 환경에서 훈련이 필요한 로봇의 AI에도 유용할 수 있다.
월드 랩스는 "대부분의 생성 AI 도구는 이미지나 비디오와 같은 2D 콘텐츠를 만들지만, 3D로 생성하면 제어와 일관성이 향상된다"라며 "우리는 영화나 게임, 시뮬레이터 및 물리적 세계의 다른 디지털 표현을 만드는 방식을 바꿀 것"이라고 밝혔다.
이번에 공개한 것은 3D 세계 생성 모델의 첫번째 초기 미리보기로, 대기자 명단을 통해 향후 출시 제품에 대한 정보를 공개하겠다고 덧붙였다.
한편, 이 회사는 지난 3월 설립됐으며, 10월에 공식 출범을 선언했다. 이미 기업가치는 10억달러를 넘었다.
박찬 기자 cpark@aitimes.com
- 'AI 대모' 리 교수 "수십년 연구한 나도 AGI 잘 몰라"...누가 감히 AGI를 거론하나
- 'AI 대모'의 스타트업 공식 출범..."언어모델 뛰어넘는 '세계모델' 개발할 것"
- 'AI 대모'의 공간 지능 스타트업, 설립 4개월 만에 유니콘 등극
- 구글도 '월드 모델' 공개...페이페이 리 교수의 월드랩스 모델과 유사
- '월드모델'로 게임 생성하는 스타트업, 두달 만에 기업가치 5배 상승
- 게임개발자, 생성 AI 부정적 인식 늘어...해고율 증가가 원인
- 페이페이 리 "AI 정책은 'SF가 아닌 과학'에 기반해야"
- MS, 게임용 AI 모델 공개...xAI도 게임 스튜디오 설립
- '어벤져스' 루소 형제, AI 전용 스튜디오 설립...자체 모델 'AI 스컹크' 구축 중
- 허사비스 "AGI 달성하려면 월드모델·에이전트 결합해야...'스타크래프트'로 테스트 중"
- 월드 모델 기반 ‘실시간 인터랙티브 비디오 생성’ 기술 등장..."동영상 AI와 달라"
- 페이페이 리 "인간도 공간 지능 완전치 않아...로봇은 지능 이상 '감각 통합' 필요"
- 페이페이 리의 월드랩스, 세계 최초 상용 ‘월드 모델’ 출시
