(사진-셔터스톡)
(사진-셔터스톡)

오픈AI가 동영상 생성 인공지능(AI) '소라'를 전면 업그레이드, 아예 새로운 버전을 개발 중인 것으로 알려졌다. 지난 2월 공개된 버전보다 성능을 향상하기 위해 처음부터 다시 훈련을 시작했다는 말로, 이 때문에 출시가 계속 늦어진다는 설명이다. 

디 인포메이션은 25일(현지시간) 오픈AI의 임원진과 이야기를 나눈 소식통을 인용, 소라가 수백만시간의 비디오로 구성된 새로운 데이터셋으로 학습하는 등 새 버전으로 개발 중이라고 보도했다.

이에 따르면 오픈AI는 새로운 소라가 최고의 품질을 갖추는 것은 물론, 기존의 문제점을 대부분 해결하기를 기대하고 있다.

지난 2월에 발표한 버전보다 품질이 높고 더 긴 클립을 빠르게 생성하기는 데 초점을 맞췄다. 당시 소라는 1분짜리 영상을 만들 수 있다고 알려졌는데, 이는 여전히 현재 동영상 모델 중에서 가장 긴 편이다.

소라 훈련에 사용하는 영상 데이터도 까다롭게 선별한 것으로 전해졌다. 고해상도에다 다양한 스타일과 주제에 관한 영상을 수집했다는 말이다. 이는 소라의 출력 해상도를 높이는 것은 물론, 특정 스타일의 편향을 피하려는 조치라고 설명했다. 

결국 오픈AI가 2월에 선보인 소라를 공개하지 않은 것은 상업용 출시에 적합한 수준이 아니었다는 분석이다. 예를 들어, 이전 버전은 1분짜리 영상을 생성하는 데에는 10분 이상이 걸렸다.

또 소라를 사용한 제작자 세데버그는 들쭉날쭉한 출력 퀄리티로 인해 최적의 영상을 얻으려면 수백번의 시도가 필요했으며, 객체의 일관성 유지도 어려웠다고 밝혔다. 이 밖에도 의자가 갑자기 등장하는 등의 물리 법칙을 무시하는 모습과 손가락 숫자 등 인체를 잘 못 표현하는 경우가 있었다.

이런 모든 문제를 해결하기 위해 오픈AI는 데이터셋부터 다시 구축하고 소라를 새로 학습하기로 결정했다는 설명이다. 이 때문에 6개월이 지난 현재까지도 대중에게 내놓지 못했다는 내용이다. 

오픈AI에서 출시 지연은 소라가 처음이 아니다. 이번주 정식 출시된 GPT-4o의 '고급 음성 모드(AVM)'도 지난 5월 공개 이후 4개월이 걸렸다.

특히, 새 데이터셋으로 훈련을 다시 시작한 소라가 언제 출시될지는 확실치 않다고 전했다. 다만, 오픈AI의 의도대로 개발을 마친다면, 파급력은 더 강력해질 것이라는 예측이다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지