(사진=엔비디아)
(사진=엔비디아)

엔비디아가 텍스트 프롬프트를 활용, 3D 개체를 생성하는 도구를 공개했다. 무엇보다 '거의 실시간으로' 객체 생성이 가능, 이 분야의 획기적인 발전을 이뤘다고 강조했다.

벤처비트는 21일(현지시간) 엔비디아의 토론토 AI 연구소가 간단한 텍스트 프롬프트에서 밀리초(㎳, 1000분의 1초) 만에 3D 개체와 동물 이미지 등을 생성할 수 있는 '라떼3D(Latte3D)'를 선보였다고 보도했다.

이에 따르면 라떼3D는 엔비디아 'RTX A6000'과 같은 단일 GPU를 활용, 복잡한 3D 개체를 즉시 생성하며 시간이 많이 걸리는 렌더링 프로세스가 필요하지 않다.

또 A100 GPU와 챗GPT를 사용해 생성한 다양한 텍스트 프롬프트에 대해 훈련, 광범위한 텍스트 처리가 가능하도록 처리했다.

따라서 처음부터 힘들게 개체를 디자인하거나 3D 자산 라이브러리를 선별하는 대신, 제작자는 라뗴3D를 사용해서 빠르고 효율적으로 아이디어를 구현할 수 있다는 설명이다. 또 텍스트 입력을 기반으로 다양한 모양 옵션을 제공, 적합한 디자인을 선택할 수 있다.

2D 이미지나 텍스트 프롬프트를 기반으로 3D 개체를 생성하는 기술은 이미 2년 전부터 많은 기업이 뛰어든 분야다. 게임 제작이나 이커머스 등 수요가 많고, 곧바로 수익 모델을 창출할 수 있기 때문이다. 실제로 지난 19일에는 스태빌리티 AI가 360도 3D 렌더링 영상 제작이 가능한 인공지능(AI) 모델을 출시했다.

그러나 이 분야의 많은 전문가들은 생성 이미지나 실제 사진 등 2D 이미지를 3D로 변환하는 것이 쉽지 않은 일이라고 지적한다. 실제로 어떤 모델은 상품 이미지 변환 등 일부 분야에서는 잘 작동하지만, 게임과 같은 쪽에서는 잘 작동하지 않는 등 문제가 일어났다.

이런 점을 감안, 엔비디아는 라떼3D가 동물과 물체를 포함한 초기 데이터셋을 넘어 개발자가 다양한 유형의 데이터로 미세조정할 수 있는 유연성을 갖췄다고 강조했다. 이를 통해 조경설계나 로봇공학 등 다양한 도메인에서 활용할 수 있다고 설명했다.

예를 들어 조경 디자이너의 경우 정원 렌더링에 실제와 같은 나뭇잎을 채웠다고 다른 물체로 빠르게 변환할 수 있고, 로봇 개발자는 로봇 훈련을 위한 가정 환경을 순식간에 구축할 수 있다.

엔비디아의 새 모델이 어떤 성능을 보이는 지는 아직 검증되지 않았다. 그러나 거의 실시간으로 이미지를 처리하는 것은 분명한 강점이다. 기존 도구는 대부분 수분에서 수십분까지 시간이 걸렸다.

산자 피델라 엔비디아 AI 연구 부사장은 "라떼3D는 모든 업계의 제작자를 위한 게임 체인저"라며 “이제 모든 제작자는 거의 실시간으로 텍스트를 3D로 변환할 수 있게 됐다”라고 말했다.

한편 엔비디아는 지난 2022년 9월에도 단일 2D 이미지에서 3D 모델을 생성하는 '겟3D'라는 생성 AI를 공개한 바 있다. 당시에는 메타버스를 채울 다양한 개체를 생성하는 데 초점을 맞췄다.

임대준 기자 ydj@aitimes.com

키워드 관련기사
  • 스태빌리티 AI, 360도 3D 렌더링 영상 제작 AI 출시.."게임·커머스에 유용"
  • 로블록스, 3D 콘텐츠 제작을 향상하는 AI 기반 도구 출시
  • 메타버스용 3D 이미지 생성 AI모델도 나왔다...엔비디아, ‘GET3D’ 출시