12월 1주

'GPT-4'와 같은 대형언어모델(LLM)에 스포트라이트가 쏟아지고 있지만, 최근 이미지 생성 인공지능(AI)과 동영상 생성 AI의 움직임도 심상치 않습니다.

지난달에는 주요 업체가 일제히 새 모델을 공개, 본격 경쟁을 예고했습니다. 계기는 역시 오픈AI가 챗GPT에 '달리 3'를 통합한 것입니다. 다른 업체들로서는 팔짱만 끼고 지켜볼 수는 없었던 것입니다.

먼저 포문을 연 곳은 '스테이블 디퓨전'으로 유명한 스태빌리티 AI입니다. 기존 2D를 넘어서 3D 이미지를 생성해 주는 서비스를 공개했습니다. 그러자 어도비는 며칠 뒤 5초 만에 2D를 3D로 바꿔준다는 모델을 내놓았습니다. 

특히 3D 이미지 생성은 상업화 의도에 따른 것입니다. 거대한 게임이나 애니메이션 제작사에 생성 AI를 제공하고 수익을 올리겠다는 것입니다. 미드저니가 이미지 스타일을 통일할 수 있는 서비스를 출시한 것도 같은 맥락입니다. 

메타가 나선 것은 결정적입니다. 기존 포토샵처럼 이미지 편집이 자유로운 생성 AI는 물론 비디오까지 만들어 주는 도구를 선보였습니다. 퀄리티가 뛰어난 것은 물론 인스타그램이나 페이스북 등으로 배포하기 때문에 파급력이 대단할 것으로 보입니다.

기존 이미지 생성 AI의 최강자로 꼽히던 미드저니가 이제는 가장 '구식'이 돼버린 셈입니다.

동영상 부분은 이제 경쟁이 시작됐다고 봐야 합니다. 런웨이가 이제까지 선도 업체로 꼽혔지만, 강력한 라이벌이 속속 등장하고 있습니다.

대표적인 곳이 피카 랩입니다. 올여름 디스코드를 통해 출시한 테스트 버전에 50만명이 몰리며 엄청난 인기를 끌었고, 지난주에는 정식 버전을 출시하기에 이르렀습니다. 

스태빌리티 AI도 동영상 분야로 진출했습니다. 둘 다 뛰어난 퀄리티를 장점으로 내세웠습니다.

런웨이도 이달 초 '젠-2' 업데이트를 통해 폭발적인 반응을 얻었습니다. 많은 사용자가 "게임 체인저" "생성 AI의 전환점"과 같은 찬사를 보낼 정도였습니다.

페나키가 500여자의 프롬프트로 생성한 2분 분량 비디오 (사진=구글)
페나키가 500여자의 프롬프트로 생성한 2분 분량 비디오 (사진=구글)

사실 이 분야의 강자는 따로 있습니다. 바로 구글입니다. 

구글은 1년 전 '페나키(Phenaki)'라는 모델을 선보여 화제가 됐습니다. 이제까지 다른 모델들이 이미지를 일부 변형해 4~15초 분량의 짧은 동영상을 만들어주는 데 반해, 페나키는 길고 복잡한 프롬프트로 여러 장면이 등장하는 2분이 넘는 영상을 만들어 낼 수 있습니다. 

만약 내년 출시될 구글 차세대 모델 '제미니'에 페나키가 통합된다면, 동영상 생성 AI의 판도 역시 크게 변할 것으로 보입니다.

이어 국내외 주요 이슈입니다.

(사진=셔터스톡)
(사진=셔터스톡)

■ 오픈AI, AGI 개발 돌파구 찾았다...인간처럼 추론하는 LLM '큐스타' 개발 중

오픈AI가 인공일반지능(AGI)의 돌파구가 될 만한 기술을 개발했다고 알려져서 화제입니다. 이 때문에 알트먼 CEO가 해임됐다는 말도 나왔는데, 기술에 대한 추측이 쏟아지고 있습니다.

■ 아마존, 기업용 AI 챗봇 'Q' 출시...MS·구글과 본격 대결

아마존이 기업용 AI 챗봇과 이미지 생성 AI, 미세조정 도구 등 AI 서비스를 한보따리 풀어 놓았습니다. 클라우드 경쟁 업체인 마이크로소프트(MS)나 구글 등이 뒤처지지 않겠다는 의도입니다.  

(사진=인플렉션)
(사진=인플렉션)

■ '인플렉션-2' 공개..."GPT-4에 이은 현존 2번째 LLM"

감성 챗봇 '파이'로 유명한 인플렉션이 후속 모델을 내놓았습니다. 회사 설립 때부터 '오픈AI 라이벌'로 꼽힌 곳답게, 새 모델은 현재 GPT-4에 이어 현존 두번째로 뛰어난 성능을 갖췄다고 합니다.

■ 유럽 기업 "AI 법의 파운데이션 모델 과다 규제에 반대"

유럽연합(EU)의 AI 법 제정이 점점 꼬이고 있습니다. LLM을 집중 규제하자는 방침에, 프랑스와 독일 등이 반발한 데 이어 관련 기업들도 반대하고 나선 겁니다. 

(사진=구글 딥마인드)
(사진=구글 딥마인드)

■ 구글, 무기화합물 생성하는 AI 공개..."신소재 220만개 예측"

구글이 신소재 개발을 이끌 무기화합물 생성 AI를 발표했습니다. 단백질 생성 AI인 '알파폴드'가 그랬듯, 관련 분야의 획기적 발전을 이끌만한 기술로 평가됩니다.

■ LLM 추론 속도 300배까지 향상...'패스트 피드 포워드' 아키텍처 공개

추론을 위해 활성화되는 뉴런의 수를 최소화하는 방식으로 LLM의 속도와 비용을 크게 개선하는 기술이 등장했습니다. 관련 연구가 늘며, LLM 비용도 점점 줄어들 것으로 보입니다. 

(사진=KAIST)
(사진=KAIST)

■ KAIST, 구글과 '체계적 일반화' 벤치마크 개발..."추론 능력 발전 기대"

'빨간 포도'나 '파란 바나나'와 같이 AI가 본 적 없는 개념을 이해시키는 기술이 발표됐습니다. 이는 AGI로 발전하는 핵심이라는 설명입니다.

■ AGI 판단하는 'GAIA 벤치마크' 등장..."GPT-4가 30%로 1위"

AGI인지를 알아보기 위해 복잡한 전문 지식을 묻는 것보다 일상적이지만 여러 단계가 필요한 과정을 테스트하는 방법이 등장했습니다. 그 결과 가장 똑똑하다는 GPT-4도 정확도가 30%에 그쳤습니다.

AI타임스 news@aitimes.com

키워드 관련기사
  • 혼돈의 5일...알트먼은 어떻게 오픈AI에 복귀했나
  • 마침내 삼성전자...역시 오픈AI
  • 애플, 마침내 'A.I.'