데이터 인텔리전스 전문 에스투더블유(S2W, 대표 서상덕)가 다크웹 전문을 넘어 ‘기업별 도메인 특화 인공지능(AI) 구축 전문’으로 거듭나겠다고 밝혔다.
서상덕 S2W 대표는 13일 서울 코엑스 스튜디오159에서 열린 'S-AIP 론칭데이'에서 “국내를 넘어 아시아의 팔란티어가 될 것”이라고 말했다. 빅데이터 수집과 분석에 특화한 아시아 대표 기업이자 B2B AI 선두 업체로 나가겠다는 선언이다.
S2W는 지난해 다크웹 기반 언어모델 '다크버트(DarkBERT)'를 선보이며 국내는 물론 해외에도 주목받는 기업이 됐다. 다크웹의 다양한 데이터를 경험, 정제하며 노하우를 구축해 왔다.
특히 이날 공식 론칭한 B2B AI 플랫폼 'S-AIP'는 그간 연구와 노력의 총집합이라고 소개했다. 여기에는 데이터 수집, 검색, RAG(검색증강생성), 데이터 벡터화 등 도메인 특화 소형언어모델(sLLM) 구축에 필수적인 기술을 모두 적용했다.
무엇보다 제조, 금융 등 다크웹과 보안을 벗어난 분야에서도 충분히 이용이 가능할 수 있도록 베타 플랫폼 운영 및 테스트를 모두 완료한 상태라고 설명했다.
또 ▲오픈 소스 sLM을 활용한 온프레미스 방식 ▲기업 내부 데이터를 지식그래프 형태로 변환해 LLM 컨텍스트로 활용, 답변에 대한 출처 명시 ▲신뢰성 보강 등에도 힘을 쏟았다고 밝혔다.
AI 개발을 총괄하는 정진우 이사는 S-AIP 구축의 밑바탕이 된 다크웹 연구 노하우를 공개했다. 그는 “다크웹은 표면웹 데이터와 수집 방법도 다를뿐더러 정형 데이터, 비정형 데이터, 웹사이트 실시간 크롤링 등 여러 형태의 정보를 모두 AI에 맞춰 처리해야 한다”라고 강조했다.
특히 다크웹 데이터를 학습한 AI 솔루션을 실제 범죄 예방 및 보안에 사용하려면 ‘지식그래프, 온톨로지 구축’ 기술이 필수적이라고 설명했다.
예를 들어 다크웹 사이트에서 상이한 닉네임을 설정, 활동하는 유저를 ‘지식그래프’ 기반으로 검거해 낼 수 있다는 것이다. 사용 ID 및 타깃 업권, 타깃 국가, 글 쓰는 스타일이나 자주 쓰는 단어 등 여러 특성을 기반으로 지식그래프를 구축해 놓으면, AI가 체계적이고 정확하게 판단을 내릴 수 있다.
이를 통해 다크웹의 ‘음란물’ ‘해킹’ 등의 작은 도메인에도 대응할 수 있다고 설명했다. 여기에 채팅 인터페이스(UI)를 접목한 ‘다크챗’을 이용하면 자연어 형태로 질의응답도 가능하다. 이 경우 해외 정보기관과 협력, 영어 버전을 먼저 출시했지만, 이른 시일 내 한국어로도 이용 가능할 것이라고 전했다.
연구를 진행하며 S2W는 다크웹 기반 보안 도메인 선두 주자는 물론 AI 대표 기업으로 올라설 수 있었다고 밝혔다. 국내 기업 중 유일하게 마이크로소프트가 진행하는 인큐베이팅 프로그램 ‘페가수스’에 선정된 것이 좋은 예다.
또 전체 구성원 중 R&D 담당 개발자가 55%, 석사 학위 이상 소유자가 47%, 박사 학위 이상 소유자가 10명에 달할 정도로 AI 연구에 집중하고 있다.
서상덕 대표는 “AI는 도로나 운송수단처럼 결국 필수적인 엔진 역할을 하게 될 것”이라며 S-AIP의 사용성과 회사의 미래를 강조했다.
장세민 기자 semim99@aitimes.com
