바이두의 이미지 생성 AI 플랫폼 '웬신 이지'에서 만들어낸 이미지 (사진=웬신 이지)
바이두의 이미지 생성 AI 플랫폼 '웬신 이지'에서 만들어낸 이미지 (사진=웬신 이지)

생성 인공지능(AI) 분야에서 중국의 반격이 시작됐다.

생성 AI는 지난해 미국 기술 기업들이 개발, 선풍적인 인기를 모으고 있는 인공지능 모델이다. '달리' '미드저니' '스테이블 디퓨전' 등 종류도 다양하다. 

테크크런치는 최근 중국 기업과 연구소 등이 생성 AI를 자체 기술로 속속 개발하는가 하면 투자에 참여하려는 투자자가 늘고 있다고 1일(현지시간) 보도했다.

보도에 따르면 바이두는 지난 2021년에 이미 '어니-비아이엘지(ERNIE-ViLG)'라는 이미지 생성 도구를 개발한 바 있다. 미국의 '달리'나 '스테이블 디퓨전' 등보다 앞선 시점이었다.

바이두가 개발한 모델은 1억4500만개에 이르는 이미지로 훈련, 100억개의 매개변수를 보유했다. 달리, 미드저니, 스테이블 디퓨전 등과 마찬가지로 확산 알고리즘을 이용해 개발했다. 다만 훈련에 사용한 데이터셋 규모가 작을 따름이다. 매개 변수도 GPT-3의 1750억개에 크게 못미친다.

바이두는 또 지난해 8월에는 중국의 심층학습 프레임워크인 '패들패들'을 활용해 개발한 AI 이미지 생성 플랫폼 '웬신 이지'를 오픈했다. 그동안 서비스에 박차를 가해 이용자를 계속 늘려가고 있는 것으로 알려졌다.

텐센트의 '이 쓰이웬더 워'로 만든 이미지 (사진=트위터 Marta@nonsuitubi)
텐센트의 '이 쓰이웬더 워'로 만든 이미지 (사진=트위터 Marta@nonsuitubi)

텐센트는 사진을 애니메이션 캐릭터로 바꿔주는 AI 도구 '이쓰이웬더워(异次元的我, ‘차원이 다른 나’ 라는 뜻)'를 개발, 자국내 입지를 넓혀가고 있다.

또 이데아(IDEA)는 '타이이(Taiyi)'라는 텍스트-이미지 모델을 개발해 오픈소스 모델로 서비스하고 있다. 2000만개의 필터링된 이미지 데이터로 훈련했고, 10억개의 매개변수를 가지고 있는 것으로 전해졌다.

다만 중국이 개발한 이미지 생성 도구는 모두 '천안문'처럼 정치적으로 민감한 텍스트를 차단하고 있다. 또 생성 AI 애플리케이션을 이용하려면 실명 확인을 받아야 하는 불편함이 있다.

중국의 생성 AI는 미국의 AI 칩 봉쇄조치로 인해 성능 한계도 뒤따른다. 그럼에도 미국과의 기술전쟁에서 뒤지지 않기 위한 노력은 계속될 것으로 보인다. 

두 쉔 바이두 부사장은 "'쿤룬(Kunlun)'이라는 AI 칩을 자체 개발해 대형 언어모델에 사용, 텍스트와 이미지 인식 효율성을 40% 향상시키는 동시에 비용도 감축했다"면서 강한 자신감을 보이기도 했다.

올해는 기존 생성 AI 모델이 어느정도 수준까지 발전할지와 함께 중국산 생성 AI 모델이 얼마나 약진할 수 있을지를 지켜보는 것도 흥미로울 전망이다. 

정병일 위원 jbi@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지