메타버스용 3D 이미지 생성 AI모델도 나왔다...엔비디아, ‘GET3D’ 출시 < 뉴테크 < AI기술 < 기사본문

단일 2D 이미지에서 3D 모델 생성

박찬 위원
입력 2022.09.26 17:23
댓글 0

이 기사를 공유합니다

엔비디아가 메타버스를 채울 건물, 차량, 캐릭터 등 다양한 객체의 3D 이미지를 생성하는 AI 모델 ‘겟3D(GET3D: Generate Explicit Textured 3D)’를 출시했다고 23일(현지시간) 블로그에 밝혔다.

겟3D는 1개의 2D 이미지 입력으로 모든 토폴로지와 고품질 3D 폴리곤 메쉬를 합성할 수 있는 3D 생성 모델이다. 폴리곤 메쉬는 3D 프로그램, 게임 엔진 또는 영화 렌더러와 같은 그래픽 소프트웨어로 원활하게 가져올 수 있는 표준 형식인 삼각형으로 구성된다.

게임과 같은 실시간으로 처리되는 물체들은 거의 대부분 폴리곤(polygon) 모델링 기법을 사용한다. 폴리곤의 원래 뜻은 다각형이지만 컴퓨터 그래픽에선 주로 삼각형을 의미한다. 여러개의 폴리곤으로 구성된 하나의 객체를 폴리곤 메쉬라고 한다. 그림에서 볼 수 있듯이 더 많은 폴리곤을 사용할 수록 물체를 더욱 정교하게 표현할 수 있다.(사진=Zorin & Shroder)

3D 객체를 가져온 후 크기를 조정하거나 회전하고 조명을 밝히는 등 편집을 할 수 있다.

또 엔비디아의 스타일간-네이다(StyleGAN-Nada)를 사용하면 텍스트 명령만 사용해 3D 모델의 모양이나 텍스쳐를 추가로 변경할 수 있다. 일반 자동차를 경찰차로 변환하는 식이다. 텍스쳐는 실제 물체를 표현하기 위해 폴리곤 메쉬의 표면에 입혀지는 이미지다.

겟3D는 2단계 생성 프로세스로 구성된다. 지오메트리(geometry) 분기는 원하는 토폴로지로 폴리곤 메쉬를 생성한다. 텍스처 분기는 폴리곤 메쉬의 표면 지점에서 색상이나 재질을 나타낼 수 있는 텍스처 필드를 생성한다.

마지막으로 적대적생성네트워크(GAN)와 마찬가지로 판별자는 3D 모델의 합성 사진을 기반으로 출력 품질을 평가하고 대상 이미지와 일치하도록 지속적으로 최적화한다.

다양한 카메라 각도에서 캡처한 3D 모양의 약 100만개의 2D 이미지로 구성된 합성 데이터에 대해 겟3D를 훈련했다. 겟3D가 생성할 수 있는 3D 모델은 훈련 데이터에 따라 다르다. 훈련 데이터 세트가 더 크고 다양할수록 생성되는 3D 모델이 더 자세하고 다양해진다.

예를 들어 합성 자동차 또는 동물 이미지로 시스템을 훈련하면 3D 자동차 또는 동물을 생성할 수 있다. 2D 자동차 이미지의 훈련 데이터 세트를 사용해 세단, 트럭, 경주용 자동차 및 밴 컬렉션을 만든다. 동물 이미지로 훈련하면 여우, 코뿔소, 말, 곰과 같은 동물이 나온다. 주어진 의자에 대해 모델은 다양한 회전 의자, 식당 의자 및 아늑한 안락의자를 생성한다.