인공지능(AI) 스타트업 라이터가 기존 AI 모델의 획일적인 출력을 개선하기 위해 새로운 접근법을 제시했다.
라이터는 17일(현지시간) 기존 모델과는 차별화된 답변을 생성할 수 있는 AI 모델 ‘팔미라 크리에이티브(Palmyra Creative)’를 공개했다.
와심 알시크 라이터 CTO는 “현재 AI 모델들이 생성하는 텍스트는 놀라울 만큼 비슷하다”라며 “더욱 놀라운 점은 AI가 생성한 텍스트를 이제는 전문가뿐 아니라 누구나 즉시 구별할 수 있다는 것”이라고 밝혔다.
라이터는 이 문제를 해결하기 위해 훈련 데이터를 늘리는 기존 방식 대신, AI 아키텍처 자체를 새롭게 설계하는 방식을 채택했다.
팔미라 크리에이티브는 '병합 기법'과 '적응형 모델 레이어링'을 통해 모델이 언어를 해석하고 생성하는 방식을 재구성했다. 세가지 서로 다른 데이터셋으로 훈련된 모델을 병합, 독창적이고 역동적인 출력을 만들어내는 방식이다.
그 결과, 방대한 데이터를 추가로 훈련하지 않아도 기존 모델보다 창의적이고 예측하기 어려운 결과를 만든다는 설명이다.
비용 효율성 면에서도 경쟁력을 갖췄다. 라이터는 팔미라 크리에이티브의 훈련 비용이 70만달러(약 10억원)로, 오픈AI의 460만달러(약 66억원)에 비해 훨씬 저렴하다고 강조했다.
창의적인 출력물을 생성함과 동시에 정확성도 떨어지지 않는다고 강조했다. ‘클레임 감지(claim detection)’ 시스템을 통해 모델이 생성한 내용이 도메인별 모델에서 제공된 사실과 일치하는지 검증한다는 설명이다.
특히 의료 특화 모델인 ‘팔미라 메드(Palmyra Med)’나 금융 특화 모델 ‘팔미라 핀(Palmyra Fin)’과 결합할 때 유용하다고 전했다. 의료 모델과 통합 시, 클레임 감지 시스템은 기존 의료 정보를 벗어난 내용을 자동으로 감지해 표시함으로써 규제 준수와 신뢰성을 유지할 수 있도록 돕는다.
또 창의성을 평가하기 어려운 기존 벤치마크의 한계를 극복하기 위해, 라이터는 새로운 평가 프레임워크를 직접 개발했다. 언어학자 20여명으로 구성된 팀이 팔미라 크리에이티브가 생성한 텍스트를 3주 동안 분석했으며, 여러 세대의 생성물을 비교해 토큰 고유성과 독창성을 측정하는 새로운 벤치마크 시스템을 도입했다.
알시크 CTO는 “토큰의 고유성과 토큰 간 관계가 훈련 데이터와 얼마나 다른지 살펴보는 것이 독창성을 정량화하는 방법”이라고 설명했다. 라이터는 이 벤치마크를 내년 1월 오픈 소스로 공개할 예정이다.
팔미라 크리에이티브는 API, 노코드 툴, 라이터 프레임워크, 그리고 엔비디아의 NIM 추론 마이크로서비스 등을 통해 사용할 수 있다.
박찬 기자 cpark@aitimes.com
