인공지능(AI)이 단순히 소설을 쓰는 것을 넘어 사용자가 원하는 성향에 따라 소설을 쓰는 시대가 곧 다가올 것으로 보인다. 언어처리 기술과 기계독해(MRC) 기술이 고도화되면서 앞으론 AI가 유명 작가의 문체로 새로운 창작물을 만들어낼 수 있는 기술이 등장할 전망이다.
김동환 포티투마루 대표는 10일 지능정보산업협회(AIIA)와 지능정보기술포럼(TTA ICT 표준화포럼 사업)이 공동 주최한 조찬포럼에서 "MRC 기술 발달로 최근 언어 모델은 새로운 것을 생성하는 기술로 발전하고 있다"며 "스토리 라인만 주면 AI가 헤밍웨이 문체나 허균 문체로 소설을 쓰는 날이 얼마 남지 않았다"고 말했다.
여기서 생성은 기존에 데이터를 토대로 새로운 것을 만들어내는 것을 의미한다. 그동안 언어모델은 글에서 정보를 찾아내는 쪽으로 많이 발전해 왔다. 논문 자료가 사실인지 아닌지 대조하고 신문 기사의 요점은 무엇인지를 찾아 사용자에게 제공하는 기술이 많이 등장했다. 앞으로는 이 단계를 넘어 AI가 글을 이해해 새로운 콘텐츠를 만들어내는 기술이 나온다는 설명이다.
이미지로 이해하면 쉽다. 현재 AI 기반 이미지 기술은 새로운 것을 생성하는 기술이 많이 등장했다. AI가 촬영한 사진의 배경을 자동으로 생성해주거나 명화에서 보이지 않는 부분 만들어주기도 한다. 역사 속 인물을 자세하게 생성하는 기술도 나왔다.
사실 언어에서의 생성 기술은 이미지보다 어렵다고 평가된다. 이미지는 객관적으로 보여줄 수 있는 시각화 자료가 있지만 글은 같은 내용을 요약하더라도 사람별로 해석하는 기준과 지적 이해도가 달라 다르게 요약되기 때문이다. 따라서 어떻게 요약을 할 것인지, 어떻게 글을 쓸 것인지가 AI 언어처리 분야가 가진 숙제였다.
이 문제는 글을 독해하고 분석하는 MRC 기술로 극복될 것으로 보인다. MRC 기술을 활용해 유명 저자의 문체를 분석한 후 이를 토대로 글을 생성하면 되기 때문이다. 김 대표는 "AI가 어떤 화풍을 모방해 그림을 그렸다는 얘기가 나오고 있는데 언어 분야 역시 AI가 유명 작가의 문체를 모방해 글을 쓰는 날이 머지 않았다"며 "포티투마루는 현재 이 분야를 학습 데이터를 생성하는데 사용하고 있다"고 밝혔다.
김 대표는 이외에도 AI 언어모델 발전이 가져올 핑크빛 변화도 소개했다. MRC의 경우 지금까지는 지문에서 단어나 문장을 추출하는 쪽으로 기술이 많이 개발됐다면 최근에는 추론이 영역까지 개발되고 있다고 밝혔다.
예를 들어 '평창올림픽은 80개의 금메달을 놓고 대회가 펼쳐진다. 소치올림픽보다는 8개 늘어난 숫자다'라는 문장에는 소치올림픽은 몇 개의 금메달을 두고 대회가 열렸는지는 나와 있지 않다. 하지만 사람은 80에서 8을 뺀 72개의 금메달이 있었다는 사실을 쉽게 할 수 있다. 하지만 AI는 아니었다. 글에서 정보를 추출할 뿐 수리 추론은 가능하지 않았기 때문이다.
앞으로는 AI가 이러한 수리 추론 영역까지 가능해질 것으로 보인다. 김 대표는 "현재 MRC는 수리 추론을 할 수 있는 영역까지 개발되고 있다"며 "이외에도 각 문장의 정보를 이해해 정답과 팩트만 뽑아내는 것이 아닌 그 문장에서 '어떻게(How)'까지 찾아낼 수 있는 방향으로 발전하고 있다"고 말했다.
또 "이러한 기술 발전으로 앞으로는 다지선다형 대답을 할 수 있는 AI가 등장할 것으로 보인다"며 "이후에도 여러 가지 형태의 MRC 기술이 발전할 것으로 보이는데, 이러한 기술의 등장은 생각보다 빠르게 이뤄질 것으로 예상된다"고 밝혔다.
AI타임스 김동원 기자 goodtuna@aitimes.com
