사람과 인공지능(AI)의 협업적 글쓰기에 대한 연구가 진행되고 있다.
미국 IT 매체 벤처비트는 30일 스탠포드 대학에서 사람과 AI의 협업적 글쓰기에 대한 연구가 진행되고 있다고 보도했다.
사람과 AI의 협업 글쓰기 모델인 '공동작가(CoAuthor)'에는 인터페이스, 데이터 세트 및 실험이 모두 포함돼 있다. 스탠퍼드대 컴퓨터공학과 박사과정인 미나 리와 스탠퍼드대 컴퓨터학과 부교수이자 스탠퍼드대 인간중심 인공지능연구소 출신의 기반 모델 연구소장 퍼시 량, 조력자 콴 양 조교수가 관련 연구 논문의 공동 저자다.
이 기사의 기울임꼴로 표시된 글은 대형 언어 모델이 썼다.
리 연구원은 “언어 모델이 작성 과정에 도움이 될 수 있는 엄청난 잠재력을 가지고 있다고 믿는다. 사람들은 이미 이러한 모델이 유용하다는 사실을 깨닫고 이를 워크플로우에 통합하고 있다. 예를 들어, 이러한 모델과 함께 여러 권의 책과 수상 경력에 빛나는 에세이가 공동 저술됐다”고 밝혔다.
실험을 통해 이 연구원은 언어 모델이 사람의 글쓰기를 대체하기 보다는 강화하는데 가장 유용하고 강력한 것이라고 믿고 있다. 그는 “언어 모델을 인간의 생산성과 창의성을 향상시키고 표현력과 속도를 높일 수 있는 문서 작성 과정에서 ‘협력자’라고 생각한다”고 설명했다.
사람들이 글을 쓰는 데 도움이 되는 AI는 새로운 것이 아니다. 구글의 예측 검색은 스마트폰의 다음 단어 텍스트 제안 알고리즘과 마찬가지로 쉬운 사례라고 할 수 있다. 다른 앱은 이메일을 작성하거나 코드를 작성하는 데 도움을 준다. 사람의 글에 도움이 되는 AI를 만드는 것은 어떨까?
친구에게 컴퓨터 코드나 텍스트를 쓰는 것은 매력적인 시 또는 능숙한 에세이를 쓰는 일과는 거리가 멀다. 이러한 작품에는 독창적이고, 흥미롭고, 생각을 가다듬는 창의적인 작가가 필요하다.
CoAuthor는 인터넷에 이미 있는 방대한 텍스트 컬렉션을 학습시킨 오픈AI(OpenAI)의 최신 대형 언어 모델 중 하나인 GPT-3에 기초하고 있다. 기존 텍스트를 기반으로 한 모델이 원본을 만들 수 있다고 생각한다면 어려운 요구가 될 것이다. 하지만 연구팀은 작가가 자신의 틀에서 벗어나도록 어떻게 조정할 수 있는지 알아보려 했다. 작가의 편안한 영역(예: 매일 사용하는 어휘)을 넘어 다른 글로 쓰지 않았을 것을 쓰는 것 말이다. 그러한 협업이 작가의 개인적 성취감과 소유권에 미치는 영향을 이해하려 시도했다.
이 연구원은 “AI가 훌륭한 글쓰기에 대한 무형의 수준을 달성하는 데 도움이 되는지 알아보려 한다”고 밝혔다. 시스템은 검색, 연결성 확인 등의 작업을 수행하는 데 적합하다. 사람은 창의성을 찾는 데 좋다. 이 기사가 잘 쓰였다고 생각한다면, 그것은 AI 때문이 아니고 사람 작가 때문이다.
이 연구원은 목표에 대해 사람들이 더 빠르고 효율적으로 쓸 수 있는 시스템을 구축하는 것이 아니라고 말한다. 대신 최근 대형 언어 모델의 잠재성을 조사해 글쓰기 과정에 도움을 주고 성공하고 실패하는 지점을 알아보기 위한 것이었다. 타자 수준에서 쓰기 세션을 기록하는 인터페이스로 CoAuthor를 구축하고, GPT-3를 사용해 작업할 때 대규모 상호 작용 데이터 세트를 선별하여, 사람 작가와 AI의 협업 방식을 분석한다.
연구진은 60명 이상의 사람들이 1440개 이상의 이야기와 에세이를 CoAuthor의 도움을 받아 집필했다. 작가가 입력하기 시작하고 ‘Tab’ 키를 누르면 GPT-3에서 생성된 5가지 제안 사항이 표시된다. 그러면 작가는 제안을 받아들이거나, 수정하거나, 그것들을 모두 무시할 수 있다.
데이터 세트로, CoAuthor는 텍스트 삽입 및 삭제뿐만 아니라 커서 이동 및 제안 선택을 포함해 작성자와 모델 간의 모든 상호 작용을 추적한다. 이러한 풍부한 상호 작용 데이터를 통해 연구자들은 언제 작성자가 제안을 요청하는지, 작성자가 제안을 얼마나 자주 수락하는지, 어떤 제안을 받아들였는지, 어떻게 편집됐는지, 그리고 그 내용이 후속 글에 어떤 영향을 줬는지 분석할 수 있다.
분석적 도구로서, CoAuthor는 수용된 제안이 사람 작가에게 얼마나 도움이 될지를 판단할 수 있고, 반대로 거부된 제안을 분석하면서 작가의 취향을 대리해 미래의 언어 모델을 위한 제안을 개선시킬 수 있다.
이후 작가는 공동 작업에 대한 상대적 만족도와 결과물의 생산성과 소유권과 관련한 설문조사를 실시했다. 작가들은 주로 CoAuthor가 제안한 단어들과 아이디어들은 새롭고 유용한 것으로 환영한다고 답했다. 반면, 제안들이 의도한 것과 다른 방향으로 작가를 유도했기 때문에 무시됐다고 했고 때때로 제안이 너무 반복적이거나 모호하다고 느꼈고, 이야기와 에세이에 많은 가치를 더하지는 못했다고 답하기도 했다.
이 연구원은 GPT-3와 작가 사이의 협업 정도는 작문 만족도에는 별 영향을 미치지 않는 것 같지만 결과적으로 글의 소유의식에 부정적인 영향을 줄 수 있다는 사실을 알게 됐다. 반면, 많은 참가자들은 모델 제안을 통해 새로운 아이디어를 얻고 후속 글에 활용했다. 한 참여자는 사후 설문 조사에서 “특히 이름이 도움이 됐다”며 “실제로 전형적인 재미있는 농담과 관련한 이름을 생각하려고 노력했고 AI가 줬다. 완벽했다”고 답했다.
CoAuthor 협업 작가들은 대형 언어 모델이 생성하는 단어 수와 문서 작성에 소요되는 시간을 측정했을 때 작성자의 생산성이 향상되었다는 사실을 알게 됐다. 순수하게 실용적이지만 흥미로운 수준에서, 사람 작가와 모델이 쓴 문장은 사람이 만든 문구보다 철자와 문법 오류가 적었고 어휘의 다양성이 더 높은 것으로 나타났다.
이 연구원은 “사람과 모델 간의 가장 좋은 협력은 작가가 자신의 창조적인 감수성을 사용해 제안을 평가해 무엇을 유지하고 무엇을 빼야 할지 결정하는 방식으로 보인다”며 “전체적으로 CoAuthor가 새로운 아이디어를 제시하면서 생산성과 예술적 기교가 높아지는 것을 느꼈다는 답변이 나왔다”고 설명했다.
가까운 시일 내에, 일부 기술적 장애물이 극복될 필요가 있다. 대형 언어 모델은 편향되고 해로운 언어를 생성하기 쉽다는 점이 드러나기도 했다. 현재 CoAuthor는 금지 단어 목록을 기반으로 잠재적으로 문제가 될 수 있는 제안을 걸러낸다. 보다 광범위한 필터링을 채택하면서도 언어 모델 기능을 강화할 수 있는 방안을 모색할 필요가 있다.
걸작을 생성할 수 있는 AI는 세련된 산문이나 도발적인 시를 내주는 것이 아니라 사람의 글을 보완해 줄 수 있는 제안을 제시하는 방식일 것이다. CoAuthor가 증명하고 있는 것처럼, 이미 일어나고 있다.
AI타임스 이한선 객원 기자 griffin12@gmail.com
