김동환 포티투마루 대표가 사업 상황을 설명하고 있다.,
김동환 포티투마루 대표가 사업 상황을 설명하고 있다.,

포티투마루가 RAG(검색 증강 생성)과 MRC(기계독해)를 혼합한 '하이브리드 대형언어모델(LLM)' 기술로 엔터프라이즈 시장 확장을 진행 중이라고 밝혔다.

김동환 포티투마루 대표는 "우리의 기술적 차별점은 RAG(검색증강생성)과 MRC(기계독해)를 종합적으로 사용한다는 점”이라며 "퍼블릭 LLM과 프라이빗 LLM의 장점을 모두 갖춘 기술로, 이를 통해 유수의 기업들과 협업을 논의 중"이라고 6일 말했다.

김 대표는 “이제 업계에서는 RAG가 빠지지 않는 분위기”라며 “이전까지는 대다수가 정의조차 제대로 알지 못했다면, 올해 들어 확실히 분위기가 바뀌고 있다”라고 전했다.

RAG는 지난해부터 LLM의 환각을 최소화하기 위한 해결책으로 자리 잡았다. 수많은 데이터 중 질의에 해당하는 데이터만 검색하고 범주화, 다시 순위를 매기는 식으로 답변 정확도를 올리는 방법이다. 

하지만 RAG 단순 도입이 중요한 것이 아니라고 지적했다. 그는 "데이터의 규모와 성격을 넘어, 기업에서 추구하는 ‘콘텐츠’를 분석하는 게 중요하다"라고 말했다. 또 "이는 포티투마루의 강점"이라며 "일찌감치 검색 기술과 포털 운영 능력을 쌓아 왔기 때문"이라고 설명했다.

포티투마루는 전문 IT 인력을 중심으로 2015년 설립됐다. 2017년 중순 이후부터 연구개발 단계를 지나 ‘원천기술 상용화’에 들어섰다. 

2021년부터는 반도체, 통신, 금융, 보안, 법률, 병원까지 LLM 적용 분야를 넓혀왔다. 특히 지난해 5월 환각, 보안, 고비용 등 문제를 해결한 소형언어모델(sLM) ‘LLM42’을 선보였다. 지난해 9월에는 LLM42 내부에 'RAG42'를 추가 출시하기도 했다. 

김 대표는 "인터넷 포털 하나에는 뉴스와 커머스, 블로그, 음악 등 다양한 카테고리가 포진해 있는데, 이때 각 카테고리에 부합하는 ‘콘텐츠’를 연구한 이력이 현재의 RAG 사용 노하우로 자리 잡았다"라고 밝혔다.

여기에 MRC를 더하면 모델 성능이 더욱 강력해진다고 설명했다.

"MRC는 기존 LLM의 알고리즘과 크게 다르지 않다. 하지만 커버리지가 다르다. LLM이 ‘팔방미인’ 스타일이라면, MRC는 ‘너드’에 해당한다"라고 비유했다.

즉 LLM은 분야에 국한하지 않고 답변이 가능하지만, 한번 더 점검이 필요하다. 반면 MRC는 전문 분야가 한정적이지만, 그만큼 정확하고 깊이 있는 답변이 가능하다.

“우리가 지향하는 언어모델은 두가지 성격을 모두 가지고 있는 것”이라며 일종의 하이브리드 언어모델을 목표로 하고 있다고 말했다.

특히 "프라이빗과 퍼블릭이라는 이분법적 구도가 일반화되는 상황에서, 이 둘을 모두 합친 ‘하이브리드 모델’은 국내에서 거의 유일한 시도일 것"이라고 강조했다. 

“국내 한 기업에서는 오픈AI의 퍼블릭 LLM 라이선스를 1조원 이상의 가격으로 구매한 것으로 알고 있다”라며 “하지만 이를 뒷받침할 인프라 부족은 물론 실제 사업 도메인에 적용했을 때 제대로 작동하지 않는 문제를 겪고 있다”라고 전했다. 포티투마루가 하이브리드를 강조하는 것은 이런 문제를 방지하자는 의도다.

김동환 포티투마루 대표
김동환 포티투마루 대표

더불어 김동환 대표는 이전부터 ‘언어모델 성능 평가 지표 정립’의 중요성을 언급해 온 바 있다. 한국어 언어 능력을 평가하는 오픈 Ko-LLM 리더보드에 참가, 상위권을 차지한 일도 있다.

“리더보드 참여를 위해 일주일 정도 개발을 거쳐 상위권에 올랐다”라며 “이후 사업 확장에 집중하는 바람에, 리더보드 관련 개발은 멈춘 상태”라고 설명했다.

포티투마루는 지난 1월 LGU+로부터 100억원의 투자를 이끌어내 화제가 됐다. 이어 지난달에는 샌즈랩, LGU+와 보안 특화 LLM 개발에 나선다고 발표했다.

김동환 대표는 “자금 확보를 통해 기술 고도화와 인력 충원을 진행하고 있다"라며 “특히 국내외 굵직한 기업들과 투자 및 협업 건을 앞두고 있어, 곧 발표가 따를 것”이라고 귀띔했다.

또 "다소 낯설어 보이는 보안 분야 LLM도 결국 이제까지 진행한 엔터프라이즈 사업의 일환"이라며 "기업 특화 하이브리드 LLM 기술로 향후 국방 등을 포함한 광범위한 도메인으로 나아갈 것"이라고 강조했다.

장세민 기자 semim99@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지