코스닥 상장사 솔트룩스, 9월 디지털 뉴딜 우수기업 선정
데이터를 잘 활용해 새로운 경제적 가치를 창출할 것
기업간 생태계 만들어 동반 성장 기반 마련할 것
"2025년까지 전 세계 1억명이 솔트룩스 기술 매일 사용"목표

 

이경일 솔트룩스 대표(사진=김재호 기자)
이경일 솔트룩스 대표(사진=김재호 기자)

"솔트룩스는 인공지능(AI) 자체를 만드는 회사입니다. 데이터를 필요로 하기 때문에 데이터의 쓰임새를 잘 알고, 데이터를 잘 만들어야 하죠. 오랜 경험을 바탕으로 데이터를 잘 활용해 새로운 경제적 가치를 창출하는 것에 사명감을 갖고 있습니다."

2016년 이세돌과 알파고의 바둑 대결 이후 국내에서 AI 기술을 향한 관심이 높아졌다. 이후 AI는 미래 시대를 이끌 신기술ㆍ신산업의 핵심으로 떠올랐다. 하지만 이경일 솔트룩스 대표는 20여년 전부터 AI 기술에 흥미를 느끼고 관련 사업을 시작했다.

이 대표는 대학 3학년 때부터 컴파일러와 자동 번역 프로그램 등에 관심을 가지며 소프트웨어(SW). 자연어처리(NLP) 연구를 수행했다. 1994년 첫 사업을 펼쳤으나 이내 사업을 정리하고 LG 연구소에서 연구원 생활을 시작했다.

하지만 자신의 손으로 세상이 기대하는 회사를 만들어 보고 싶다는 생각에 연구소를 나와 2000년 솔트룩스를 창업했다. 이후 음성 인식ㆍ합성과 이미지 분석 등 AI 솔루션 개발에 매진했고, 기술 고도화를 위한 대규모 데이터 확보에 집중해 약 150억건 이상의 AI 학습 데이터와 2만 시간 이상의 음성데이터를 구축ㆍ공유했다.

이에 지난 10월 솔트룩스는 데이터셋 구축ㆍ개방 노력과 AI 서비스 발전에 기여한 것을 인정 받아 과학기술정보통신부(장관 최기영)  9월 디지털 뉴딜 우수사례로 선정됐다.

◆ 데이터 활용법을 아는 회사…디지털 뉴딜 원동력될 것

"솔트룩스는 '데이터 이해도'가 높은 회사라고 자부합니다. 데이터 구축ㆍ공급뿐 아니라 데이터의 중요성과 필요성 등을 고려해 데이터를 만들고 적절한 활용법을 찾는 능력을 갖고 있습니다."

이경일 솔트룩스 대표(사진=김재호 기자)
이경일 솔트룩스 대표(사진=김재호 기자)

이경일 대표는 솔트룩스만의 강점을 이렇게 소개했다.

AI는 데이터를 바탕으로 학습하며 고도화하기 때문에 적절한 데이터 확보ㆍ정제 기술이 중요하다. 만약, 언어 분석 AI를 제작할 때 의료 데이터를 활용한다면 AI의 제 기능을 기대할 수 없을 것이다. 이에 대규모 데이터를 필요에 따라 활용ㆍ정제하는 능력이 필요하다.

이 대표는 "많은 데이터를 확보하는 것만이 중요하지 않다"며 "확보한 데이터의 본질을 이해하고 활용법을 알아야 만들고자 하는 결과물의 본질에 더 빨리 접근할 수 있다"고 설명했다.

그는 솔트룩스에서 진행한 '당신의 방언을 삽니다' 사업을 예로 들었다.

"전 세계적으로 사투리 관련 음성데이터가 많지 않습니다. 그 결과, 사투리를 썼을 때 AI 음성 인식이 원활하지 않죠. 게다가, 노인층으로 갈수록 사투리 비중이 크기 때문에 폭넓은 음성 인식을 위해 사투리 음성데이터 확보가 필요했습니다."

이경일 대표는 "당시 관련 데이터 확보를 앞두고 상당히 막연한 상황이었다"면서도 "지난 20년간 쌓은 노하우와 기술을 살려 구체적인 사투리 음성데이터를 확보할 수 있었다"고 회상했다.

솔트룩스는 ▲AI Suite ▲Bigdata Suite ▲GraphDB Suite ▲AI Cloud 4개 제품을 바탕으로 AIㆍ빅데이터 서비스를 제공하고 있다.

AI Suite은 음성 인식ㆍ합성, NLP, 이미지ㆍ얼굴 인식 등 10가지 기술 서비스를 제공하는 AI 통합 플랫폼이며 빅데이터 Suite의 경우 빅데이터를 저장ㆍ융합ㆍ분석하는 데 활용할 수 있다. 이외에도 기존 테이블 구조의 데이터베이스(DB)에서 연결된 그래프데이터의 저장ㆍ분석이 가능한 GraphDB Suite와 클라우드 형태로 AI 기능을 제공하는 AI 클라우드도 함께 서비스한다.

"향후 클라우드 사업을 더욱 강화할 계획입니다. 현재 클라우드 관련 사업을 별도 진행할 정도로 힘을 쏟고 있죠. 지금까지 이룬 AIㆍ빅데이터 플랫폼 사업을 바탕으로 새로운 도전을 준비할 계획입니다."

◆ "사람은 사람처럼, 기계는 기계처럼"…GPT-3, '퓨샷 러닝' 구현에 의미 있어

“GPT-3는 기계학습 방법과 대규모 데이터를 근거로 추론을 합니다. 하지만 추론을 했다고 인간처럼 생각을 했다고 보진 않습니다. 사람은 사람처럼 생각하듯이, GPT-3는 기계의 방식대로 생각한 것이죠.”

솔트룩스는 LGU+ 'TV 아이들나라' AI 프로젝트에 참여, GPT-2.5를 바탕으로 한 디지털 휴먼 'AI 가람이'를 탄생시켰다. AI 기술, 3D 모델링, 애니메이션 기술 등을 결합해 제작했으며 향후 키오스크와 스마트폰 앱에 대화형 AI 형태로 공급할 예정이다.

이경일 대표는 "GPT-3의 등장은 다양한 의미가 있다"면서도 "GPT-3가 강한 AI를 도래했다는 의견은 다소 과하다고 생각한다"고 설명했다.

GPT-3는 한국어, 영어, 불어 등 인간 언어뿐 아니라 프로그램 언어를 비롯한 대규모 언어데이터까지 학습한 뒤 이를 활용한다. 그 과정에 추론 기술은 기본적으로 포함돼 있다. 이에 프로그램 코딩과 시 짓기 등을 가능하게 한다.

"GPT-3는 자신이 학습한 데이터만을 활용하기 때문에 학습하지 못한 데이터를 적용할 경우 이상한 답을 내놓습니다. 하지만 사람의 경우 직관적으로 문제를 유추ㆍ분석해 기초적인 대응이 가능하죠. GPT-3는 스스로 학습한 데이터를 근거로 추론할 뿐 모든 것을 이해한 것이라고 보는 데 한계가 있습니다."

하지만 그는 "GPT-3의 등장은 충분한 가치가 있다"고 짚었다. 이전까지 AI가 새로운 지식을 학습할 때 대규모 기계학습을 활용해야 했다. 하지만 GPT-3의 경우 미리 대규모 학습한 것을 활용해 소규모 학습이 가능하도록 한 '퓨샷러닝(Few-shot Learning)'을 적용했다.

"GPT-3는 미리 학습한 대규모 데이터를 바탕으로 적은 데이터에 따른 학습 가능성을 제시한 점에서 큰 의미가 있다고 생각합니다."

◆ 데이터 댐 구축ㆍ개방…기업간 생태계 구축해 협력 모델 만들 것

"지난 시간 동안 AI 개발을 위한 데이터를 꾸준히 구축하며 AI 기술의 핵심 자산을 확보했습니다. 하지만 저희 노력만으로 일군 것은 아니라고 생각합니다. 학교, 연구소, 국가기관 등 다양한 곳과 프로젝트 연구를 수행하며 다양한 데이터를 확보할 수 있었죠."

솔트룩스는 기업 자체적으로 약 150억건 이상의 AI 학습 데이터와 2만 시간 이상의 음성데이터를 구축했다. 이후 기업 보유의 오픈 데이터, 소셜 데이터, 언어자원 등 약 80억건의 데이터를 단계적으로 개방했다. 연말에는 광주광역시와 협력해 AI 클러스터 내 스타트업과 연구자에게 일부 데이터를 기부할 예정이다.

이 대표는 "AI 산업 발전과 연구자 성장을 위해 무엇을 도울 수 있을지 고민했다"며 "저희가 많은 분의 도움으로 성장한 것처럼, 저희 도움이 필요한 곳에 잘 전달되길 바란다"고 설명했다.

"솔트룩스는 다양한 AI 스타트업과 협력해 AI 산업의 생태계를 구축할 목표를 갖고 있습니다. 많은 고객 데이터를 접목하고 다양한 고객 도메인을 확보해 기업간 성장을 돕는거죠."

이경일 대표는 구체적인 꿈을 갖고 있다. 향후 2025년까지 전 세계 1억명의 사람이 솔트룩스의 기술을 매일 사용할 수 있는 세상을 만들겠다는 것이다. 하지만 꿈을 이루기까지 AI 기술 고도화와 다양한 데이터 확보 등이 많은 노력이 필요하다.

이에 기업간 생태계를 구축해 협력 모델을 만들어 동반 성장을 위한 기반을 마련할 계획이다.

이 대표는 "국내에서 솔트룩스와 협력 가능한 스타트업을 발굴ㆍ선정해 투자를 하고 있다"며 "기업 생태계 구축에 끊임없는 투자를 거쳐 다양한 스타트업을 성장시키는 데 힘쓸 것이다"라고 강조했다.

"저희가 갖고 있는 기술력과 투자한 관계 회사의 도메인 전문성을 바탕으로 새로운 AI 서비스를 함께 개발할 계획입니다. 서로의 제품 기술을 통합해 융합 제품 서비스로 발전할 수 있도록 해야겠죠. 끊임없이 새로운 기술을 찾고 파트너 기업과 협력해 동반 성장할 수 있는 기반을 만드는 것이 무엇보다 중요합니다."

 

[관련 기사]“코딩 없는 의료 AI툴, 의사가 개발 주도” 최우식 딥노이드 대표

[관련 기사][특별 기획] AI, 저널리즘을 부탁해! ③ : 외근(취재)부서의 명암

키워드 관련기사
  • [특별 기획] AI, 저널리즘을 부탁해! ③ : 외근(취재)부서의 명암
  • 과기정통부, 인공지능(AI) 반도체 기술 인력 확보한다
  • [AI가 궁금해!?]②로보틱스, '스팟'의 고통을 공감한 인간...소셜 로봇의 미래