영상이해 초거대 인공지능(AI) 전문 트웰브랩스(대표 이재성)는 오는 12월 열리는 세계 최대 규모 AI 학술대회 ‘신경정보처리시스템학회(NeurIPS 2024)’에서 영상 언어 모델 워크숍을 주최한다고 20일 밝혔다.
1987년 시작한 뉴립스(NeurIPS)는 AI와 머신러닝 분야 세계 최고 권위를 가진 학술 행사다. 매년 전 세계 AI 전문가들이 모여 최신 연구 성과와 기술 동향을 공유하며, 논문 채택률이 약 26%에 불과하다.
트웰브랩스는 이번 학회에서 '영상-언어 모델 워크숍(Workshop on Video-Language Models)'을 주최한다. ▲텍스트 및 이미지 데이터에 비해 부족한 영상 데이터 ▲방대한 분량의 영상 데이터 처리 방법 ▲시각, 음성, 시간, 텍스트 등 다양한 데이터가 혼재돼 있는 영상 데이터의 특성을 반영한 정교한 모델 설계 ▲영상-언어 모델 평가 및 비교 등 다양한 논의를 진행할 예정이다.
특히 뉴립스에서 영상-언어 모델워크숍을 개최하는 것은 이번이 처음이라고 전했다. 대형언어모델(LLM)에서 영상언어모델(VLM)로의 패러다임 전환을 반영한 결과라는 설명이다. 또 뉴립스에서 한국 기반 스타트업으로서는 최초로 주최하는 워크숍이다.
워크숍에는 이승준 트웰브랩스 최고기술책임자가 네이버AI랩, 마이크로소프트, 애플, AI2 등과 공동 주최자로 참가한다. 디나 데이먼 구글 딥마인드 시니어 리서치 사이언티스트, 커스틴 그라우만 텍사스 대학교 오스틴 컴퓨터 공학 교수, 이샨 미스라 메타 영상생성 리드 등 주요 석학들이 연사로 참가한다.
이재성 트웰브랩스 대표는 “세계 최고 권위 학회 뉴립스에서 영상-언어 모델 워크숍을 주최하게 된 것은 트웰브랩스의 기술력과 비전이 글로벌 AI 커뮤니티에서 인정받았다는 의미”라며 "이번 워크숍에서 전세계 최고 AI 연구자들과 영상 AI 기술의 현재와 미래를 조망하고 본격적인 멀티모달 인텔리전스 시대를 열어갈 것”이라고 말했다.
한편, 워크숍 참가를 희망하는 연구자는 9월10일까지 논문 초록 제출이 가능하다. 자세한 사항은 뉴립스 워크숍 2024 웹사이트에서 확인할 수 있다.
장세민 기자 semim99@aitimes.com
- [기고] 멀티모달 AI와 영상이해가 미디어 산업을 혁신하는 법
- [기고] 트웰브랩스 "복잡한 '비디오'를 다루는 혁신적 모델"
- 트웰브랩스, 엔비디아 등으로부터 700억 규모 시리즈A 투자 유치
- 스토리, AI·웹3·디지털아트 전문가와 ‘새로운 IP 생태계 조성’ 논의
- [기고] 비디오 초거대모델을 기반으로 한 멀티모달의 미래
- [기고] 무엇이 파운데이션 모델을 특별하게 하는가
- 트웰브랩스 “디즈니·NFL 이어 SKT 등 국내외 주요 기업과 협업 논의"
- 이승준 트웰브랩스 CTO "영상언어모델은 인간처럼 생각하는 AI...로보틱스 기반될 것"
- 트웰브랩스, '시리' 개발 주역 김윤 CSO 영입..."멀티모달 AI 강화로 글로벌 선두 도약할 것"
- AI 투자 붐 타고 학술회의 '뉴립스'도 폭발적 성장..."핵심 논제는 추론"
