"텍스트를 3D 장면으로 바꿔준다"…애플, '가우디(GAUDI)' 공개

몰입형 3D 장면 생성을 위한 신경 아키텍처 선봬
영상 화질 낮고 아티팩트 발견…아직은 개선 필요
강화학습·SLAM·3D 콘텐츠 제작 등 분야에 도움

애플(Apple)이 몰입형 3차원(3D) 장면 생성을 위한 신경 아키텍처인 ‘가우디(GAUDI)’를 공개했다. (영상=Miguel Angel Bautista 트위터, Github).

애플(Apple)이 몰입형 3차원(3D) 장면 생성을 위한 아키텍처인 '가우디(GAUDI)'를 공개했다고 애플 특허 전문매체인 페이턴틀리 애플(Patently Apple)이 4일(현지시간) 보도했다. 유명 스페인 건축가 안토니 가우디의 이름을 딴 '가우디' 모델은 복잡하고 사실적인 3D 장면을 포착해 움직이는 카메라로부터 렌더링을 수행, 텍스트를 기반으로 3D 장면을 구현할 수 있다.

현재로서 가우디가 생성한 영상을 보면 그다지 고화질도 아닌데다 일종의 결함인 아티팩트(artifact)도 많이 발견된다. 그러나 매체에 따르면 가우디는 애플이 3D 물체와 장면을 렌더링하기 위한 AI 시스템을 개발하는 데 좋은 토대가 될 것이라는 설명이다. 또 애플의 확장현실(XR) 헤드셋에도 사용될 것으로 보인다.

텍스트 프롬프트를 기반으로 3D 장면을 생성할 수 있는 ‘가우디(GAUDI)’의 시연 모습. (영상=Miguel Angel Bautista 트위터).

오픈AI의 'DALL·E 2'나 구글의 'Imagen'과 같은 AI 시스템은 2D 이미지만 생성할 수 있다. 하지만 텍스트를 3D 장면으로 변환할 수 있다면 더욱 몰입감 높은 시각적인 경험을 할 수 있을 것이다. 가우디는 컴퓨터 비전 분야는 물론 모델 기반 강화학습과 SLAM(3차원 공간 인식 및 지도 생성), 3D 콘텐츠 제작 등 다양한 연구분야에 기여할 전망이다.

AI타임스 윤영주 기자 yyj0511@aitimes.com

[관련기사] DALL-E와 경쟁할 이미지 생성 AI 또 등장

손가락 강조된 ETㆍ자동차 탄 아바타…AI가 만든 영화 포스터

‘게임 덕후 주목’…인공지능이 그려낸 고전 명작 게임 캐릭터들

DALL-E에 '종말 전 셀카' 주문하니 오싹한 그림이…

윤영주 기자 우리 삶에 도움이 되는 AI 소식을 전하겠습니다. yyj0511@aitimes.com

다른기사 보기

상단영역

본문영역

SNS 기사보내기