광활하게 펼쳐진 사막이나 숲, 또는 눈 덮힌 알프스 산맥 등 멋진 풍경 사진을 보면 한번쯤 그 속으로 뛰어들고 싶은 충동이 느껴진다. '저 높은 산 위에 오르면 어떤 세상이 펼쳐질까' '저 숲속에는 무엇이 있을까'
이같은 상상을 현실로 구현해 주는 인공지능(AI) 모델이 등장했다. 사진 한 장만 있으면 마치 드론이 사진속으로 들어가 항공 촬영을 하는 것처럼 사진 속 세계를 가상으로 그려준다. 구글이 6일(현지시간) 공개한 '3D 뷰 생성 AI'다.
사진 전문매체인 페타픽셀은 6일(현지시간) 구글이 AI 3D 모델을 활용해 스틸사진 속으로 날아들어갈 수 있도록 해주는 프로그램을 개발했다고 보도했다.
구글이 개발한 새로운 3D 뷰 생성 기술은 풍경 사진을 찍은 다음 AI를 사용해 새처럼 비행하면서 공중에서 바라본 풍경을 비디오로 생성해준다.
사진에는 보이지 않는 숨겨진 영역을 AI로 생성해 채워주는 것으로 비행효과를 얻는 방식이다. '인페이팅'이라는 시뮬레이션 기법을 활용한다. 거대한 AI 데이터 세트를 머신러닝으로 학습해 거기에 있을 것으로 생각되는 숨겨진 부분을 예측해 생성하는 것이다.
또 사진 경계 밖에 있는 것은 '아웃페인팅' 기법으로 생성한다. 대규모 데이터 세트를 학습해 원본 사진을 기반으로 더 넓은 이미지를 만들어 낸다.
사진을 확대하면 이미지 품질이 흐릿한 픽셀로 분해되면서 떨어지는데 구글은 이를 방지하기 위해 AI를 활용, 노이즈가 많고 픽셀화된 이미지를 선명한 이미지로 합성하는 프로세스인 '초해상도' 기법을 사용했다.
구글의 3D 뷰 생성 AI ‘영구 뷰 생성’ (영상=구글)
구글은 '인페인팅' '아웃페인팅' '초해상도' 세 가지 기술을 결합해 비행효과를 만든다. 연구원들은 이 프로그램을 '단일 이미지에서 자연 장면의 영구 보기 생성'이라고 명명했다.
기존의 다른 연구에서는 모델을 훈련시키기 위해 대규모 데이터 세트를 필요로 했다. 하지만 다양하고 품질 좋은 자연 화면을 담은 긴 영상 데이터를 대량으로 얻기가 매우 힘들었다.
반면 구글이 이번에 개발한 프로그램은 단 한 장의 사진만 있으면 된다는 점에서 매우 획기적인 진전을 이룬 것으로 평가된다.
박찬 위원 cpark@aitimes.com
