알파벳의 인공지능(AI) 연구소 딥마인드가 더 안전한 AI 시스템을 개발하기 위한 AI 챗봇 ‘스패로우(Sparrow)’를 선보였다.
딥마인드는 "스패로우가 기존 AI 챗봇보다 사용자 질문에 대해 그럴듯한 답변을 더 잘 생성할 수 있다"며 "또 스패로우에는 편향되고 유해한 답변의 위험을 크게 줄이는 기능이 포함돼 있다"고 22일(현지시간) 블로그를 통해 발표했다.
딥마인드는 강화 학습(reinforcement learning)으로 알려진 AI 학습 방법을 사용해 스패로우를 개발했다. 이 방법은 신경망이 작업을 올바르게 수행하는 방법을 배울 때까지 반복적으로 작업을 수행하는 것이다. 반복된 시행착오를 통해 신경망은 정확도를 향상시킬 수 있다.
스패로우 챗봇을 개발하기 위해 딥마인드는 강화 학습과 사용자 피드백을 결합했다. 챗봇의 정확성을 평가하기 위해 사용자들은 스패로우에게 질문을 하고, 챗봇이 생성한 여러 개의 답변 중에서 가장 정확하다고 생각하는 답변을 선택했다. 딥마인드는 이 접근 방식이 챗봇의 정확도를 크게 향상시키는 데 도움이 됐다고 밝혔다.
또 사용자가 스패로우에게 천문학과 같은 특정 주제에 대한 정보를 검색하도록 요청하면, 챗봇은 구글을 사용해 웹을 검색해서 요청된 정보를 찾는다. 그다음 스패로우는 검색된 웹사이트에 대한 링크와 함께 답변을 사용자에게 제공한다. 딥마인드에 따르면 사용자는 스패로우가 이러한 방식으로 생성한 답변의 78%가 그럴듯하다고 평가했으며, 이것은 기존 AI 챗봇에 비해 크게 개선된 것이다.
딥마인드는 챗봇이 편향되고 유해한 답변을 생성하는 것을 방지하기 위해 23가지 규칙으로 스패로우를 설계했다. 적대적인 평가를 위해 딥마인드는 사용자에게 스패로우를 속여 규칙을 위반하도록 요청했다. 사용자는 8% 정도만 속이는 데 성공했는데, 다른 방법을 사용해 훈련된 AI 모델 보다 훨씬 낮은 수치다.
딥마인드는 "스패로우는 적대적 평가에서 규칙을 더 잘 따른다"며 "우리의 기존 대화 모델은 참가자가 속이려고 할 때 스패로우보다 약 3배 더 자주 규칙을 위반했다"고 설명했다.
박찬 위원 cpark@aitimes.com
