메타가 최근 발표한 대형언어모델 ‘라마’가 유출된 뒤 이를 활용한 개발 붐이 일고 있는 것으로 나타났다. 휴대전화와 노트북, 윈도 심지어 소형 컴퓨터인 라즈베리 파이에서 이 모델을 적용하는 개발 시도가 잇따르고 있다.
아스테크니카는 13일(현지시간) 라마 유출 이후 이를 활용한 개발활동이 급격히 늘었다고 보도했다.
메타는 지난달 24일 이 모델의 개발을 발표하면서 연구 목적으로 승인받은 사람에게만 제공하겠다고 밝혔다. 그러나 누군가가 비트토렌트를 통해 ‘라마’가 사용하는 가중치를 유출했다. 메타측에서는 공개하지 않은 것이었다.
이후 10일에는 조지 게르가노프라는 개발자가 M1 칩을 구비한 맥킨토시 노트북에서 이 모델을 실행할 수 있는 코드(llama.cpp)를 만들어 공개했다. 11일에는 아르템 안드린코라는 개발자가 라즈베리 파이에서 속도는 느리지만 ‘라마’를 실행하는데 성공했다.
13일에는 익명의 개발자가 픽셀6 휴대전화에서 llama.cpp를 실행했다. 같은 날 스탠포드의 연구진은 오픈AI의 다빈치-003과 비슷하지만 훨씬 가벼운 하드웨어에서 실행되는 ‘라마 7B’의 조정 버전인 ‘알파카 7B’를 내놨다.
'라마’는 대형언어모델이지만 매개 변수가 기본형의 경우 650억개로 1750억개인 GPT-3에 비해 훨씬 적은데다 고성능 그래픽처리장치(GPU) 없이도 실행될 수 있어서 파장을 일으켰다. 오픈 소스로 배포된 대형언어모델들이 이미 있지만 GPU나 저장공간이 필요하고 일반인들이 노트북 등의 로컬 장치에서 구동할 수는 없다.
반면 '라마'는 로컬 장치에서 구동되면서 성능은 언어모델 중 가장 뛰어나다는 GPT-3 급으로 평가된다. 이에 따라 지난해 이미지 생성 AI인 스테이블 디퓨전이 오픈소스로 공개된 직후처럼 '라마'를 둘러싼 개발 시도가 봇물을 이루고 있는 것이다.
아스테크니카는 이와 관련해 일반인이 휴대전화나 노트북에서 GPT-3급 AI 모델을 실행할 수 있게 된 것이라고 평가했다. 이에 따라 메타의 ‘라마’가 무료로 누구나 쓸 수 있는 언어모델로 진화할 수 있을지 주목된다.
메타 측은 ‘라마’의 유출에도 불구하고 제한된 연구자들에게만 무료 모델 이용을 허락한다는 방침을 고수하고 있다. 언어모델은 오남용 등 부작용이 뒤따를 수 있기 때문에 책임있게 배포한다는 공식 입장을 유지하려는 것으로 풀이된다.
정병일 위원 jbi@aitimes.com
