인공지능(AI) 자체가 인프라가 돼가고 있다.
제품 또는 서비스를 공급하는 기업들은 더이상 AI를 적용하는 것만으로는 차별화가 어렵게 됐다.
설령 차별화에 성공한다고 하더라도 특허와 같은 억제 수단이 없는 한 경쟁사의 빠른 복제, 표절, 모방을 막아내는 것은 불가능하다.
AI 기술 특허의 성공 여부 비즈니스의 성패를 좌우하게 될 것이다.
특허를 획득하는 데 가장 큰 걸림돌은 '진보성'이다. 진보성은 특허를 받고자 하는 발명(이하 출원발명)과 선행기술 간의 차이점을 평가하는 것이다.
평가 결과 차이점의 수준이 통상의 창작 범위를 벗어나는 경우에 한해 특허를 준다. '통상의 창작 범위'라는 것은 선행기술에 보탠 아이디어의 수준이 미미한 경우라고 설명할 수 있겠다.
AI 기술에 대한 특허청의 진보성 판단 절차는 다음과 같다.
가장 먼저 출원발명과 선행기술의 과제 해결 원리가 동일한지를 판단한다. 쉽게 설명하면 '문제 인식과 해결 방식이 근본적으로 동일한지'를 판단한다.
출원발명과 선행기술이 동일한 문제 인식에서 출발했고, 문제를 해결하기 위한 특유의 아이디어나 기술 구성에 있어서도 차이가 없는 가운데 단순히 'AI를 이용하는 것'만이 유일한 차이점이라면 특허를 받는 데 실패할 것이다.
예를 들어, 기술 구성을 전반적으로 동일하게 둔 채 룰베이스 시스템을 머신러닝 시스템으로 대체하는 경우는 대부분 특허를 받을 수 없다. 사람이 수행하는 업무를 AI 기술을 이용해 단순히 시스템화한 경우에도 진보성을 부정한다.
이런 상황은 대체로 다음의 원인에 의해서 발생한다. 'AI를 이용해 보자'라는 콘셉트 수준의 아이디어만 도출하고 멈춘 경우 또는 나름의 기술적 특징들이 있었지만 이를 특허 명세서에 담아내는 데 실패하는 경우이다. 후자라면 대리인에게도 책임이 있다.
과제 해결 원리에 차이가 없는 것으로 판단했다면, 다음 단계로 학습 모델이 동일한지를 살펴본다. 모델이 같은 것인지 다른 것인지 만을 살펴보는 것은 아니고, 공지의 학습 모델(CNN, RNN, GAN, 트랜스포머 등)을 적용한 것인지도 함께 살펴본다.
여기서 선행기술과 신경망이 구조적으로 달라 효과의 차이를 보인다면 진보성을 긍정한다. 그러나 글로벌 빅테크나 국내 주요 AI 기업을 제외한 대부분의 기업은 이 기준을 적용받기 어려워 보인다.
마지막 판단 과정은 학습 데이터를 살핀다. 학습 모델이 동일하거나 공지의 학습 모델을 적용한 것이더라도, 출원발명과 선행기술의 학습 데이터가 동일한지 한 번 더 판단한다.
학습 데이터의 차이에 따라 모델의 성능을 개선하거나, 학습 데이터의 용량 또는 학습 시간 등을 감소하는 효과가 만들어진다면 진보성을 인정받을 수 있다.
학습 데이터에 일부 차이가 있지만, 선행기술을 비롯하여 종래의 사례에 비추어 봤을 때에 일반적인 수준의 기술자가 손쉽게 선택할 수 있는 경우라면 진보성은 부정당한다.
이와 관련하여 특허청의 심사실무가이드는 보수적이다. 선행기술 1에서 (AI 기술을 사용하지 않고) 룰베이스 방식으로 동일한 데이터를 분석하도록 하고 있고, 선행기술 2에서 동일한 기술 분야에서 (비록 학습 데이터에 차이는 있지만) 어떤 데이터를 학습 데이터로 하여 AI 모델을 학습시키는 것을 설명하고 있다면, 선행기술 1과 선행기술 2의 결합으로 대부분 진보성을 부정할 수 있다는 입장이다.
이 같은 방침에 따르면, 종래의 룰베이스 방식에서 사용했던 데이터를 동일하게 학습 데이터로 한다면 특허는 불가능해진다. 우리는 새로운 학습 데이터를 찾는 데 더 많은 노력을 기울여야 한다.
한편, 학습 과정의 주요한 절차는 아니지만, (학습 모델과 학습 데이터가 모두 동일하더라도) 전처리에 있어서 차이가 있다면 진보성을 손쉽게 인정받을 수 있다.
단 전처리에 의해서 학습모델의 수렴이나 추론 시간 등을 단축하는 효과를 기대할 수 있는 경우에 한한다. 학습 모델과 학습 데이터가 모두 동일하지만 출력 데이터의 활용에 있어서 차이가 있는 경우에도 마찬가지다.
결론적으로 AI 기술 특허를 실패하지 않으려면, 과제해결원리부터 다르게 하는 것이 가장 좋다.
이를 위해서는 룰베이스 사고를 버리고, 전혀 새로운 차원에서 문제 인식과 해결책을 고민하는 것이 필요하다. 그렇다면 특허청에 제시한 학습 모델이나 학습 데이터가 동일한 상황은 대개 피할 수 있을 것이다.
그렇지 않다면, 즉 아이디어 차원에서 유사한 선행기술이 있다면, 학습 데이터의 정의, 종류, 학습 모델의 종류 및 학습 구조 등 학습 수단을 구체적으로 그리고 상세하게 기재해야 한다.
종래에 이 같은 학습 데이터를 채택하는 데에 어떤 어려움이 있었는지, 그리고 학습 모델을 이것으로 변경하면서 그 전후 과정에 어떤 처리 과정이 추가되었는지, 학습 알고리즘을 수정하면서 어떤 성능 개선 효과가 있는지 등을 최대한 자세히 설명해야 한다. 그래야만 선행기술 대비하여 뾰족한 부분을 보여주고 특허청 심사관의 고개를 끄덕이게 만들 수 있다.
김성현 위포커스 특허법률사무소 대표 변리사 shkim@wefocus.kr
