규칙 기반 시스템, “더 적은 노력이 들고, 더 비용 효율적, 덜 위험
자신의 할일만 하도록 프로그래밍···경직돼 AI 능력 제한할 수 있어
고정된 결과 예상될 때·오류 위험·머신러닝 도입 계획 없을 때 사용”

머신러닝시스템, “라벨링 안된 데이터 등으로 업무를 해석·분류·수행
고정된 세트 대신 새 규칙 학습하고, 더 이상 작동않는 규칙은 버려
단순 규칙 적용 불가능할 때 데이터 급변·자연어 처리 필요시 활용”

AI 사용 목적을 달성하는 방법은 여러 가지가 있는데, 그 모든 것이 데이터에서 시작한다.  양질의 데이터가 없으면 AI는 공허하다. AI 활용의 목적을 달성하기 위해 데이터를 다루는 방법에는 규칙학습(Rule based learnng)시스템과 머신러닝(ML·기계학습)시스템 두 가지가 있다. 사진=혼다
기업은 AI로 업무 목적을 달성하기 위해 규칙기반 시스템과 머신러닝시스템의 특성과 최적 사용례를 살펴볼 필요가 있다. (사진=혼다)

규칙 기반 시스템은 자신의 할 일만 하도록 프로그래밍 된 시스템이다. 더 적은 노력이 들고, 비용 효율적이고, 덜 위험하지만 경직돼 있다. 소수의 결과나 고정된 결과가 나올 때,오류 위험 예상시, 머신러닝 도입 계획이 없을 때 활용할 수 있다.

반면 머신러닝시스템은 라벨링 안된 데이터 등으로 업무를 해석하고 분류하고 수행한다. 고정된 세트 대신 스스로 새로운 규칙을 학습하고, 더 이상 작동않는 규칙은 버리는 등 인간을 본뜨려고 한다. 이 시스템은 단순 규칙을 적용하기 불가능할 때, 데이터가 급변할 때, 그리고 자연어 처리 필요성이 있을 때 활용하면 좋을 것이다.

더넥스트웹은 14일(현지시간) 산업계 전 분야의 기업들이 인공지능(AI) 프로젝트를 발굴·실행하고 있는 가운데 기업이나 조직이 AI시스템을 도입하려 할 때 언제, 어떤 시스템을 도입해야 하는지에 대한 조언을 제시했다.  

기업이 AI로 빅데이터에서 로봇에 이르기까지, 비즈니스 프로세스를 자동화하고 고객 경험을 향상시키며 제품 개발을 혁신하고 있는 가운데 언제, 어떤 AI를 도입하는 게 좋은지에 대한 친절한 어드바이스인 셈이다.

◆데이터, 또는 파멸

컴퓨터와 기계가 이 세상에 나올 때 지식이나 사물의 작용방식에 대한 이해를 갖고 나오지 않는다.

그런 기계들에도 인간처럼 적색 신호등은 멈추는 것을 의미하고 녹색 신호등은 가는 것을 의미하도록 해야 한다.

기계가 자동차 운전(자율주행차)이나 질병 진단(암진단 AI) 같은 업무를 수행하는 데 필요한 정보를 얻는 방법은 빅데이터다.

AI 사용 목적을 달성하는 방법은 여러 가지가 있는데, 그 모든 것이 데이터에서 시작한다.  양질의 데이터가 없으면 AI는 공허하다. AI 활용의 목적을 달성하기 위해 데이터를 다루는 방법에는 규칙학습(Rule based learnng)시스템과 머신러닝(ML·기계학습)시스템 두 가지가 있다. 몇 가지 모범 사례 제시는 두 가지 방법 중 하나를 어떻게 선택할지 도움을 줄 수 있다.

◆규칙 기반 시스템

개발자들은 인공지능(AI)과 머신러닝(ML·기계학습)이 첨단IT분야의 주류에 들어오기 오래전 변방에 있을 때부터 인간의 지식을 컴퓨터 시스템에 암호화해 지식기반으로 저장하는 규칙(rule)으로 만들고 있었다. 이 규칙은 일반적으로 ‘If(만일)’문장(“만일 A라면 B를 한다. 그 외에 X라면 Y를 한다”)의 형태로 업무의 모든 측면을 정의한다.

작성해야 하는 규칙의 수는 시스템이 처리하기를 원하는 액션의 수에 따라 달라지지만(예를 들어, 20개의 액션은 최소 20개의 규칙을 수동으로 작성하고 코딩하는 것을 의미함), 규칙 기반 시스템은 일반적으로 이러한 규칙들이 저절로 변경되거나 업데이트되지 않기 때문에 더 적은 노력이 들고, 더 비용 효율적이며, 덜 위험하다. 하지만 규칙은 자신이 해야 할 일만을 하도록 프로그래밍된 만큼 경직된 지능으로 인해 AI 능력을 제한할 수 있다.

◆머신러닝(기계학습) 시스템

규칙 기반 시스템은 ‘고정된’ 지능을 가진 것으로 간주될 수 있지만, 이와 대조적으로 머신러닝 시스템은 적응력이 뛰어나며 인간의 지능을 시뮬레이션하려고 시도한다. 아직 기초적인 규칙의 층이 있지만, 이 기계는 인간이 프로그래밍한 고정된 세트를 쓰는 대신 스스로 새로운 규칙을 학습하고, 더 이상 작동하지 않는 규칙들을 버릴 수 있는 능력을 가지고 있다.

실제로 기계가 학습할 수 있는 방법에는 여러 가지가 있다.

그러나 기계에 훈련할 데이터가 제공되는 지도훈련(supervised training)은 일반적으로 기계 학습 프로그램의 첫 번째 단계다. 결국 기계는 라벨링이 돼 있지 않은 데이터나 스스로 알 수 없는 정보로 다른 작업을 해석, 분류, 수행할 수 있게 된다.

◆어디서부터 조직의 AI 전략을 시작할까?

AI 사용에 대한 기대 이익이 높기 때문에 기업이 시행 초기에 내리는 결정이 성공에 결정적인 영향을 미칠 수 있다.

그 기반은 AI가 달성하도록 설정한 기본 사업 목표에 맞춰 기술 선택권을 조정하는 것이다. 즉, 어떤 문제를 해결하려고 노력하고 있는가, 아니면 어떤 도전에 대응하기 위해 노력하고 있는가다.

규칙 기반 시스템이나 머신러닝 시스템을 구현하기로 한 결정은 기업의 AI 프로그램을 어떻게 진화하고 확장할지에 대해 장기적인 영향을 미칠 것이다.

그렇다면 각각 상황이 다른 회사들에 적합한 접근 방식을 평가할 때 고려해야 할 몇 가지 모범 사례는 어떤 것이 있을까.

◆규칙 기반 접근 방식을 선택하는 것이 타당한 경우는?

-고정된 결과가 나올 때: 결과가 적거나 고정된 수로 나올 때 이 시스템을 사용하는 것이 바람직하다. 예를 들어 “카트에 추가” 버튼을 누를 수 있는 상태는 두 가지뿐이다. 사용자가 버튼을 눌렀는지 여부를 감지하기 위해 머신러닝을 사용하는 것이 가능하긴 하지만, 그런 방식
을 적용하는 것은 말이 되지 않는다.

-오류 위험이 있을 때: ‘잘못된 긍정’의 위험을 감수하기에는 오류에 따른 처벌(불편)이 너무 크기 때문에 100% 정확할 규칙만 구현해야 할 때 이를 사용하는 것이 좋다.

-머신러닝 도입할 계획이 없을 때: 시스템을 유지 관리하는 사람들에게 머신러닝 지식이 없고 기업이 앞으로 이를 지원할 계획이 없는 경우에도 이에 해당한다.

◆머신러닝(기계학습)을 적용하는 것이 타당한 경우는?

-단순 규칙이 적용되지 않을 때: 간단한 규칙을 사용해 태스크를 쉽게 정의할 수 있는 방법이 없는 경우엔 머신러닝을 적용해야 한다.

-데이터가 급속히 바뀔 때: 상황, 시나리오 및 데이터가 지속적으로 새로운 규칙을 작성할 수 있는 능력보다 빠르게 변화하고 있는 경우에 머신러닝이 필요하다.

-자연어 처리를 필요로 할 때: 언어, 또는 자연어 처리에 대한 이해를 필요로 하는 작업에는 머신러닝을 도입해야 한다. 무언가를 말하는 방법은 무한히 많기 때문에 정상 언어에 대한 규칙을 쓰는 것은 완전히 불가능하지는 않다하더라도 비현실적이다. 머신러닝의 타고난 적응형 지능은 규모에 최적화되어 있다.

즉 AI의 약속은 현실이지만, 많은 조직에게 부여된 도전 과제는 어디서부터 시작하느냐다.

이를 고민하는 조직이라면 무엇보다도 먼저 규칙기반 시스템이 조직에 적합한지 머신러닝 시스템 적합한지를 먼저 확인해야 한다.

 

[관련기사] 오픈AI, 자연어 처리(NLP) 모델용 API 출시

[관련기사] 구글, AI로 활성분자 식별 이니셔티브 가동

키워드 관련기사
  • 슈퍼브AI, 머신러닝으로 데이터 라벨링 자동화 90% 구현
  • 인공지능이 타협도 한다고?...딥마인드, 승부 넘어 윈윈하는 AI 교육
  • 기업이 AI로 성과 얻는 10가지 방법