GPT-3와 스테이블 디퓨전을 결합해 인공지능(AI) 아나운서와 같은 디지털 휴먼을 애니메이션으로 만들어 내는 플랫폼이 출시됐다.
이스라엘의 스타트업인 ‘디-아이디(D-ID)’가 텍스트와 이미지, 애니메이션을 결합한 AI 비디오 플랫폼을 선보였다고 포브스가 14일 보도했다. 명령글을 입력하면 디지털로 합성된 얼굴과 음성을 가진 인간이 애니메이션으로 구현되는 플랫폼이다.
대형언어모델인 GPT-3와 이미지 생성 AI 도구인 스테이블 디퓨전을 통합해 구축된 서비스로 119개 언어를 지원한다. 포브스는 시험 삼아 이 플랫폼에서 “AI 아나운서를 생성하고, 생성 AI 기업을 소개하는 기사의 제목 10개를 추천하라’고 주문, 35초 만에 결과를 얻었다고 전했다.
디-아이디는 ‘크리에이티브 리얼리티 스튜디오’로 이름 붙인 이 플랫폼의 초기 버전을 지난 9월 출시, 소셜 미디어에서 많은 사용자를 모았다고 포브스는 소개했다. 회사 측은 기업의 교육과 마케팅, 홍보 부서에 이 서비스를 판매할 계획이다. 무료 평가판과 기업용 맞춤형 요금제를 마련했다.
이 회사는 생성 AI의 오남용을 막기 위해 욕설이나 인종차별적 발언이 생성되지 않도록 필터링하고, 저작권과 사생활 침해를 피하기 위해 유명인의 이미지가 사용되지 않도록 했다고 밝혔다.
질 페리 CEO는 “우리는 이제 막 생성 AI 기술의 잠재력을 보기 시작했다”면서 “이용자들이 만들어낼 결과가 매우 기대된다”고 말했다.
정병일 위원 jbi@aitimes.com
관련기사
