인공지능(AI)이 작성한 콘텐츠가 앞으로 점차 늘어날 전망이다. 뉴질랜드 매체 RNZ(라디오뉴질랜드)는 콘텐츠 생성 AI의 개발이 활발해져 활용이 늘고 있다고 소개했다.
콘텐트 생성 AI 모델인 GPT-3는 최근 몇 년 동안 일상 생활에 조용히 스며들고 있다. 2년 전에 GPT-3가 소개된 이후 아직 이에 대해 들어보지 못했더라도 작품을 읽었을 가능성이 높다고 매체는 소개했다. GPT-3 코드를 실행하는 웹사이트를 사용했거나 챗봇 또는 게임 캐릭터를 통해 이 코드와 대화를 나눴을 수도 있다.
최근 몇 달 사이 이러한 일은 점점 늘고 있다. GPT-3와 같은 AI를 사용하는 애플리케이션이 점점 더 많아지고 있고, 이러한 AI 프로그램은 단어, 이미지, 코드에 이르기까지 더 많은 양의 데이터를 생산하고 있다. 이러한 일은 보이지 않는 뒤에서 일어나고 AI가 무엇을 하는지 알 수 없거나, 좋은 지 아닌 지 알 수 없다. 그러나 판단하기 쉬운 몇 가지 것들이 있고 글이 그 중의 하나다.
학생 에세이에서 컨텐츠 마케팅에 이르기까지, AI 작성 도구는 불과 몇 년 전만 해도 불가능해 보였던 작업을 수행하고 있다. 이러한 과정에서 기술은 인간의 독특한 활동으로 여겨졌던 것에 대한 생각을 바꾸고 있다. 그리고 AI 모델이 어떻게 이를 수행하고 있는지 알지 못하고 있다.
대니 마호니 대표의 동료는 휴가를 떠나거나 잠자거나 휴식을 취하지 않는다. 매일, AI 글쓰기 도우미는 멜버른에 있는 마호니의 디지털 마케팅 회사인 안드로 미디어의 고객을 위해 블로그 게시물, 리뷰, 회사 설명 등을 제공한다. 마호니 대표는 “작가는 비용이 많이 든다. 그리고 사람이 얼마나 많은 양질의 컨텐츠를 생산할 수 있느냐에는 한계가 있다”며 “AI 도구를 사용하면 동일한 품질의 콘텐츠를 얻을 수 있고 더 빠르게 얻을 수 있다”고 밝혔다.
얼마나 더 빠를까? 그는 세 배 정도로 추정한다. AI 생성 텍스트를 확인하고 편집해야 하지만, 이 작업은 더 적은 분량이고 비용은 절반으로 줄일 수 있었다. 그는 “접했던 모든 검색 엔진 최적화 에이전시에서 어느 정도 AI를 사용하고 있다”고 했다.
퍼스에서 세바스찬 마크는 더 이상 콘텐츠 에이전시들을 신경 쓰지 않는다. 약 1년 전, 그는 AI 작문 보조자 광고를 보고 등록했다. AI 도구는 이제 모터사이클을 판매하고 레이싱 이벤트를 주관하는 마크의 회사 모토 다이내믹스를 위해 대부분을 작성하고 있다. 여기에는 인사 기록, 마케팅 카피, 소셜미디어 게시물 및 비즈니스 제안서가 포함된다.
퍼스 대표는 “데이터를 제공하고 일하는 방법을 학습하기 시작한 후 더욱 사용자 친화적이 되었다”며 “이제 우리는 필수적인 관리자로 사용한다”고 밝혔다. 마호니가 사용하는 특별한 AI 작성 도구인 콘텐트봇(ContentBot)은 다른 경쟁사들과 마찬가지로 지난해 초에 출시됐다.
콘텐트봇의 공동 창립자인 닉 던컨은 “매우 흥미로웠다”며 “이 기술에 관한 많은 입소문이 있었고 대박이 났다”고 했다. 오픈AI(OpenAI)는 2021년 11월 GPT-3 AI를 개발자 누구에게나 제공하기로 결정했다. 이는 제한된 수의 고객에게만 2020년 5월에 도입된 AI 도구에 대해 비용을 지불하면 쓸 수 있다는 것을 의미한다.
2021년 초에는 수십 개의 AI 작성 도구가 출시됐다. 롱샷 AI(LongShot AI)는 1년 밖에 되지 않았지만 호주를 포함해 전 세계 1만2,000명의 사용자가 있다고 밝혔다. 공동 창립자인 앙쿠르 판디는 “우리 회사보다 고객 수가 10배나 되는 다른 제품들도 있다”며 “AI의 혁신적인 변화는 2020년 가을에 발생했다. 이 분야 전체가 완전히 치솟았다”고 평가했다. 콘텐트봇 및 롱샷과 같은 기업들은 GPT-3에 대한 이용료를 오픈AI에 지불하고 있다. 가장 인기 있는 모델 다빈치의 이용료는 750단어에 미화 0.06달러(74원) 정도다.
2021년 3월 GPT-3는 하루 평균 45억 단어를 생성했다. 현재 수치는 알 수 없지만 AI가 보다 널리 사용되고 있다는 점을 감안하면 훨씬 높을 것이다. 학생들에게 광고하고 있는 AI 작성 도구는 수십 가지가 있다. 이 중 GPT-3 기반 도구로 학교와 대학이 사용하는 표절 검사를 통과할 수 있다고 주장하는 아티클 포지가 있다.
이 제품에 대한 수요는 2년 사이에 5배로 증가했다고 CEO 알렉스 카드넬은 밝혔다. 그는 “제작에 필요한 전반적인 노력을 덜 필요로 하는 짧은 처리 시간과 더 저렴한 콘텐츠에 대한 수요라고 할 수 있다”며 “사람들은 AI를 원하지 않으며 AI가 비즈니스에 제공할 수 있는 것을 원한다”고 했다.
데킨 대학의 커리큘럼 전문가인 루신다 맥나이트는 학생들이 AI 작성 도구에 대해 얼리어답터라고 밝혔다. 그는 “아이들이 이런 것들을 매우 널리 사용하고 있다는 것은 의심할 여지가 없다. 특히 인터넷 스피너는 더 그렇다”고 말했다.
스핀너는 콘텐츠의 구문을 변경하고 다시 쓰는 자동화 도구로, 표절에 대한 확인이 되지 않는다. 그는 “몇 초 만에 같은 것을 여러 개의 서로 다른 사본으로 만들 수 있지만 서로 다른 단어로 돼 있다”고 설명했다.
이러한 발전은 학생 저술에 대한 생각을 변화시키고 있다. AI의 글과 사람의 글을 구별하지 못할 경우 표절을 탐지할 때 중요한 점은 무엇일까? 맥나이트는 “우리는 학생들이 인공지능을 글의 또 다른 소스로 어떻게 사용했는지 밝히도록 해야 한다”며 “이는 학생들이 사용하는 것을 처벌하기 보다는 앞으로 나아가는 방법”이라고 강조했다.
그렇다면 AI가 좋은 글을 쓸 수 있을까? GPT-3가 2년 전에 시작되었을 때, 쓰기 능력에 대한 입소문이 퍼졌으나 접근이 제한돼 있었다. 최근 오픈AI는 게스트 로그인을 사용하는 모든 사람에게 개방을 한다. 게스트 로그인을 하려면 몇 분 정도가 걸린다.
“AI에 대한 뉴스 스토리를 작성하세요”라는 메시지가 표시되면서 AI 도구가 세 문단을 내보낸다. 첫 번째는 다음과 같다. “세계는 새로운 정보화 시대에 와 있다. 인공지능은 사상 처음으로 인간의 지능을 능가하게 된다. 이 중요한 사건은 역사의 과정을 변화시킬 것으로 확신하고, 이는 AI 연구자들의 끊임없는 연구 덕분이다.”
일반적으로 GPT-3는 사실에 대해 빠르고 느슨하지만 문장과 문장을 서로 잘 엮는다. 2022년 호주 선거에 관한 글을 써 달라는 요청에 대해 선거가 5월 21일이 아닌 7월 2일에 실시될 것이라고 주장했다. 그러나 여전히 무엇을 말하고 있는지 알고 있는 것처럼 들릴 수 있었다.
“누가 당선되든, 치열한 접전이 될 것이 확실하다. 많은 분야에서 도전에 직면해 있는 우리나라의 다음 정부는 인력 감축에 나설 수밖에 없을 것”이라고 했다.
던컨 대표는 “AI가 쓰고 싶은 대로 쓰게 할 수 없다”며 “사실 확인은 잘 못한다. 실제로는 사실을 만든다”고 했다. 마호니 대표는 “단순히 AI를 통해 컨텐츠를 제작하는 경우, AI가 직접 작성한 것이 분명하게 드러난다”며 “너무 장황하거나 아니면 말이 안 된다”고 설명했다.
그러나 적절한 지침을 제시하면 GPT-3(및 기타 AI 작성 도구)는 스타일보다 속도가 중요한 업무용 이메일 또는 컨텐츠 마케팅과 같은 일반적인 전문 작성 작업에 적합할 수 있다.
롱샷의 앙쿠르 판디는 “마케팅용 컨텐츠를 제작하는 사람들은 매일 사용하는 경향이 있다”며
“이 업계에서 가장 중점을 두는 것은 컨텐츠 작가, 컨텐츠 마케터, 카피라이터이다. 이러한 요소가 이들에게 매우 중요하기 때문이다”라고 했다.
코딩이 중요하다. 2021년 11월, 코드용 호스팅 플랫폼 깃허브의 코드 중 3분의 1이 5개월 전에 출시된 GPT-3 기반 코딩 도구인 코파일럿(Copilot)으로 작성되고 있었다.
미국 기술 연구 및 컨설팅 회사인 가트너는 2025년까지 GPT-3와 같은 생성 AI가 전체 데이터의 10%를 차지하게 될 것으로 예측하고 있다. 이는 현재의 1% 미만에서 증가한 것이다. 이러한 데이터에는 웹사이트 코드와 챗봇 플랫폼에서 이미지 생성 및 마케팅 카피에 이르기까지 모든 것이 포함된다.
가트너의 AI 연구 책임자인 앤서니 물랜은 “현재 콘텐츠 제작은 주로 생성 AI를 사용해 작업의 일부로 활용되고 있는데 당분간 계속될 것이라고 생각하지만, 점차 기술을 사용하는 것보다 아이디어에 더 중점을 두게 될 것”이라며 “완전히 완성된 작업을 생산하든, 창의적인 프로세스에서 작업을 자동화하든, 생성 AI는 계속해서 창의적 산업을 재편할 것이고 이 기술은 엄청나게 혁신적인 것”이라고 말했다.
AI 작성 도구는 어떻게 작동할까? 최근까지, 적절한 텍스트 생성 AI는 멀리 떨어져 있는 것처럼 보였다. 자연어 처리(NLP)의 진보, 즉 컴퓨터 프로그램이 인간의 언어를 이해하는 능력은 과제의 복잡성으로 인해 수렁에 빠져 있는 것으로 보인다.
그 후 2017년에 일련의 급속한 발전이 새로운 종류의 AI 모델로 마무리됐다. 기존의 머신 러닝에서는 프로그래머가 컴퓨터에 개가 있는지 여부를 인식하도록 가르친다. 딥 러닝에서 컴퓨터는 개와 관련한 특징 세트를 만드는 데 사용하는 일련의 학습 데이터(예: 개 및 개가 아닌 태그가 달린 이미지)를 제공한다.
이 세트를 사용하면 태그가 지정되지 않은 이미지가 개를 포함할 지 여부를 예측할 수 있는 모델을 만든다. 이러한 딥 러닝 모델은 무인 자동차에 사용되는 컴퓨터 비전의 배후 기술이다.
구글 번역의 개선 방안을 모색하던 중, 구글 연구원들은 다음 단어들이 어떤 문장으로 나올지 예측하는 데 탁월한 것으로 입증된 딥 러닝 모델을 우연히 발견하게 됐다. 트랜스포머라고 불리는 이 제품은 문자 메시지 자동 완성 기능이 한층 강화된 것과 같다.
독립적인 AI 연구원이자 컨설턴트인 알란 톰슨은 “트랜스포머는 매우, 매우 좋은 통계 예측”이라며 “당신의 문장이나 문장, 언어, 혹은 어떤 경우에는 음악이나 이미지, 혹은 당신이 트랜스포머에 주입한 그 밖의 어떤 것들이 다음에 올 지 알고 싶어한다”고 설명했다.
이와 동시에 호주의 기술 기업가이자 데이터 과학자인 제레미 하워드는 구글과 함께 대규모 데이터 세트에 대한 딥 러닝 모델을 학습하는 새로운 방법을 찾고 있었다. 퀸즐랜드 대학의 명예교수가 될 하워드 교수는 6년 전 멜버른에서 샌프란시스코로 이사했다. 그는 트랜스포머에게 큰 텍스트 데이터를 주고 무슨 일이 일어나는지 볼 것을 제안했다.
톰슨 박사는 “2018년에 오픈AI 팀은 하워드 교수의 조언을 받아 원본 GPT에 이 트랜스포머 모델에 전체 도서 데이터를 공급했다”며 “그리고 그들은 어디에서도 볼 수 없는 것처럼 보이는 문장을 완성할 수 있는 것을 지켜보았다”고 밝혔다.
트랜스포머는 GPT와 기타 현재 언어 모델의 기반이다. 하워드 교수의 공헌은 실리콘 밸리에서 널리 인정되고 있지만, 최근 귀국한 호주에서는 그렇지 못하다.
하지만 AI는 어떻게 문장을 형성할까? 모른다. GPT-3와 같은 AI는 ‘블랙 박스’로 알려져 있으며, 이는 내부 계산 프로세스를 알 수 없다는 것을 의미한다. AI는 자체적으로 작업을 수행하도록 훈련됐지만 실제로 해당 작업을 수행하는 방법은 매우 미스터리다.
톰슨 박사는 “학습 데이터를 제공했고 몇 달 동안 이러한 데이터를 일종의 불리기로 규정했다. 이는 수 많은 인간의 해 또는 수 십 년에 해당하는 것”이라며 “도저히 할 수 없다고 생각되던 일을 할 수가 있다. 스스로 코딩과 프로그래밍을 학습한다. 존재하지 않는 새 프로그램을 작성할 수도 있다”고 했다.
이 기술이 어떻게 작동하는지 정확히 이해하지 못하는 것은 AI를 통해 생사를 결정하는 무인 자동차에 문제가 된다.
한편, 새롭고 더 강력한 AI는 거의 매주 공개되고 있다. 톰슨 박사는 “3월부터 4월까지 3~4일마다 한 번씩 나오는 것을 문서화했다”며 “이제 30, 40, 50개의 다양한 대형 언어 모델(GPT-3 등)이 출시되었고 가끔 매주 출시되기도 한다”고 밝혔다. GPT-4는 몇 개월 안에 공개될 예정이다.
이번 주 구글 딥마인드는 지금까지 출시된 AI 중 가장 인상적인 가토(Gato)를 선보였다. 이 AI는 다양한 작업에 활용할 수 있도록 설계됐다.
이 회사의 제작자들은 이를 인간이 할 수 있는 모든 지적 과제를 이해하고 배울 수 있는, 오랫동안 예견된 범용인공지능(AGI)의 전조로 묘사하고 있다. 이론적으로 모든 인간 직업은 AGI로 대체될 수 있다.
톰슨 박사는 “우리는 인공지능과 인간의 교체가 2045년 경 될 것 같다고 말하곤 했다”며 “지금 AGI의 시작을 보고 있다”고 밝혔다. 창의적인 인간 작업을 수행하는 AI 도구는 더 이상 공상 과학 소설 또는 10년 후 일어날 일이 아니다.
마호니 대표는 “사람들이 이 시점에서 이 기능이 얼마나 유용한지 진정으로 과소평가한다고 생각한다”며 “인터넷에서 상당한 시간을 보내는 사람은 전혀 모르고 AI 콘텐츠를 읽고 있다”고 강조했다.
AI타임스 이한선 객원 기자 griffin12@gmail.com
