(사진=셔터스톡)
(사진=셔터스톡)

허깅페이스가 16일(현지시간) 매개변수 1억3500만개, 즉 0.135B 모델을 출시했습니다. 공식적인 기록은 없지만, 잘 알려진 기업이 출시한 언어모델(LM) 중 가장 작은 규모가 아닐까 하는 추측입니다.

이처럼 최근 등장하는 인공지능(AI) 모델은 기존 상식을 깨버릴 정도로 사이즈가 작습니다. 최근 한달 동안 발표된 모델만 4~5종에 달합니다.

마이크로소프트(MS)는 비전 작업에 특화된 매개변수 2억3200만개의 '플로렌스-2'라는 모델을 내놓았고, 스태빌리티 AI는 20억 매개변수의 이미지 생성 모델 ‘SD3 미디엄’을 출시했습니다. 

특히 오픈 소스 강자로 알려진 알리바바는 최강 성능의 언어모델 '큐원'을 50억 매개변수 버전으로 공개했으며, 애플이 아이폰에 탑재할 '애플 인텔리전스'의 기반 모델은 매개변수가 30억개에 불과한 것으로 알려졌습니다.

상식적으로 언어 모델은 매개변수, 즉 출력을 설명하는 변수가 많을수록 정교한 대답을 내놓습니다. 하지만 최근 등장한 소형모델은 몇십배 큰 모델만큼 성능이 뛰어나다는 것이 특징입니다. LLM 기술이 비약적으로 발전하고 있다는 증거입니다.

매개변수가 작아지게 된 것은 온디바이스 AI의 본격 등장과 맞물립니다. 매개변수가 10B 이하로 떨어진 데 가장 선도적인 역할을 했던 것은 지난해 12월 구글이 내놓은 '제미나이 나노'와 MS의 '파이-2'일 겁니다.

(사진=구글)
(사진=구글)

나노는 1.8B, 파이2는 2.7B에 불과합니다. 각각 AI 폰과 AI PC 본격 출시를 앞둔 터라, 작은 모델을 출시하는 것이 급선무였기 때문입니다.

이어 삼성전자의 AI 폰과 MS의 코파일럿+ PC 본격 출하에 이어 '애플 인텔리전스'까지 등장하는 등 모바일 장치에 급속도로 AI 탑재가 주를 이루며, 소형모델 출시는 붐을 이루고 있습니다. 일부에서는 소형(small)이라는 말도 모자라, '미소(tiny) 모델'이라는 단어를 사용합니다.

이처럼 온디바이스 AI와 엣지 컴퓨팅이 대세를 이루며, 이 분야의 발전은 더 빨라질 것으로 보입니다. 이렇게 작아진 모델은 NPU에 탑재, 다양한 장치에서 활용할 수 있습니다.

머지않아 모든 사람이 서너개의 AI 모델을 몸에 달고 다닐 수도 있을 거라고 봅니다. 실제로 휴대폰과 안경, 시계, 이어버드 등에 AI가 탑재되고 있습니다.

또 이런 모델은 한곳에 통합, 결국 AI 개인 비서인 휴머노이드 로봇으로 출시될 것입니다. SF 같은 시대가 그리 멀지 않았다는 것을 체감하는 순간입니다.

이어 16일 주요 이슈입니다.

KT, 멀티모달 대화 중 이미지 맥락 잘 이해하는 AI 챗봇 기술 공개
전날 삼성에 이어 이번에는 KT가 LLM 관련 기술을 논문으로 발표했습니다. 챗봇이 이미지 맥락을 더 잘 읽게 하는 모델과 이를 학습하기 위한 데이터셋을 공개했습니다. 국내 AI 기업도 연구 발표가 본격화되길 바랍니다. 

(사진=arXiv)
(사진=arXiv)

MS, 스프레드시트 내용을 추론할 수 있는 ‘스프레드시트LLM’ 출시

업무용으로 많이 사용하는 스프레드시트의 복잡한 내용을 읽고 정리해 주는 LLM이 개발됐습니다. 스프레드시트에 이를 적용하는 것은 시간문제로 보입니다.

애플, 개발자용 iOS 18 공개 베타 출시...AI 기능은 빠져

애플이 제품용 iOS 18 정식 출시에 앞서 개발자용 버전을 공개했습니다. 하지만 AI 기능은 공개하지 않았습니다. AI가 포함된 버전은 내년초 업데이트 예정입니다.

차량 내 카메라로 AI가 음주 여부 75% 측정

운전자의 얼굴을 스캔, 음주 여부를 측정할 수 있는 AI 기술이 발표됐습니다. 이를 사용하면 음주 운전을 원천 봉쇄할 수 있으며, 도로변 카메라에 작용하면 24시간 음주단속이 가능하다는 설명입니다. 몰론 개인정보 문제로 쉽지는 않은 것으로 보입니다.

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지