인공지능(AI) 스타트업 1세대인 라이터(Writer)가 의료와 금융 등 도메인 특화 대형언어모델(LLM)을 출시했다. 미국에서도 오픈 소스 모델 기반의 맞춤형 모델 개발이 본격화됐다는 예다.
벤처비트는 31일(현지시간) 샌프란시스코에 본사를 둔 라이터가 의료 전문 '팔미라-메드 70b(Palmyra-Med-70b)'와 금융 특화 '팔미라-핀-70b(Palmyra-Fin-70b)' 등 모델 2개를 출시했다고 보도했다.
이 모델은 오픈 소스로, 허깅페이스나 엔비디아 플랫폼 등에서 사용할 수 있다. 특히 전문 분야의 작업에서는 'GPT-4'와 같은 더 큰 모델보다 월등한 성능을 보인다고 주장했다.
와심 알시크 라이터 CTO 겸 공동 창립자는 "도메인별 모델은 그리 많지 않다. 구축하기 너무 어렵기 때문"이라며 "엔지니어링뿐만 아니라 전문 데이터와 인력의 전문성도 필요하기 때문"이라고 강조했다.
벤치마크에서도 뛰어난 결과를 냈다. 이제까지 등장한 의료 전문 모델 중 최고로 꼽히는 구글의 '메드-팜-2'가 845의 정확도를 기록한 반면, 팔미라-메드'는 85.9%를 나타냈다.
라이터는 의료 모델을 개발하기 위해 실제 의사를 기용, 인간 피드백을 통한 강화 학습(RLHF)을 진행했다고 밝혔다.
금융 모델은 투자 관리 전문 분야에서 가장 어려운 시험 중 하나로 여겨지는 CFA 레벨 3 시험에 합격할 수 있는 최초의 AI 모델이라고 소개했다.
"제정 문제는 단순한 질문보다 계획 수립에 관한 것이 많다"라며 "이 모델은 단순히 답변하는 것이 아니라, 쿼리가 주어지면 의도와 상황 등을 더 파악하기 위해 거꾸로 질문을 한 뒤 맞춤형 계획을 수립해 준다"라고 전했다.
특히 두 모델을 오픈 소스화한 것에 대해서는 "앞으로는 더 많은 기업이 오픈 소스를 채택할 것으로 믿는다"라며 "사업의 중요한 부분을 블랙박스 같은 폐쇄형 모델에 의존하는 것은 더욱 어려워질 것"이라고 말했다.
또 "AI 안전성을 해결할 수 있는 유일한 방법이 오픈 소스"라며 "(폐쇄형처럼) 블로그 게시물로만 모델을 평가할 수는 없다"라고 강조했다.
라이터는 이번 출시에 이어 산업별 전문 모델을 더 확장할 뜻을 밝혔다.
한편, 라이터는 지난해 2월에도 200억 매개변수의 '팔미라-라지' 등 LLM 3종을 출시한 바 있다.
임대준 기자 ydj@aitimes.com
