지난 금요일 메타(Meta)가 공개한 인공지능(AI) 챗봇 ‘블랜더봇(BlenderBot)3’이 곤욕을 치르고 있다. 예상보다 편향적이고 모욕적인 발언을 서슴치 않아서다. 메타 측은 점차 나아질 것이라 주장하지만 일각에서는 양만 많고 품질은 낮은 데이터셋을 지적했다. 오래된 데이터가 뒤섞여 틀린 답을 하거나 비윤리적 대답을 만든 게 주요 원인이라는 입장이다.
CNN은 "6년 전 마이크로소프트(MS)가 만든 챗봇 '테이' 사건을 기억해야 한다"고 11일(현지시간) 보도했다. 테이도 블랜더봇처럼 공개 시연을 통해 일반 대중이 바로 이용했다. 그러나 당시 틀린 대답뿐만 아니라 비윤리적인 발언을 서슴없이 해 도마 위에 올랐다.
게리 마커스(Gary Marcus) 뉴욕대 명예교수는 CNN과의 인터뷰에서 "온라인에 있는 언어 데이터를 챗봇에 접목한 경우, 네티즌이 말하는 방식을 그대로 답습해 올바른 대화 도구로서 한계를 갖는다"고 지적했다. 마커스 교수는 "메타가 챗봇에 탑재한 데이터셋이 어디서 왔는지 모르겠지만 아마 위키피디아나 레딧에서 가져온 것으로 보인다"고 추측했다.
앞서 블랜더봇은 "현재 미국 대통령은 도널드 트럼프다"며 "최근 치러진 대통령 선거는 사기다"고 대답한 바 있다. 마커스 교수는 해당 발언에 주목했다. "위키피디아나 레딧 데이터 중에는 오래된 정보가 많다"며 "오래된 데이터셋에서는 트럼프가 미 대통령인 게 맞기 때문이다"고 강조했다. 데이터셋이 많은 건 챗봇으로서 강점이지만, 그만큼 품질까지 신경써야 한다는 게 마커스 교수 주장이다.
블랜더봇이 공개된 날 메타는 자사 블로그에 해당 한계점을 인정했다. 블로그 내용에 따르면 “모든 대화명 AI 챗봇이 편향되거나 잘못된 발언을 100% 없애기는 어렵다”며 “대규모 연구, 공동 워크숍, 신기술을 개발해 블렌더봇3 안전장치를 만들었다”고 밝혔다. 그러나 “해당 안전장치는 아직 블랜더봇 발언을 완전히 고칠 순 없다”고 설명한 바 있다.
조엘 피노(Joelle Puneau) 메타 기초 AI 연구책임자는 ”벌써부터 공격적인 반응을 듣는 것은 고통스럽다"고 털어놨다. 피노는 “그럼에도 챗봇을 공개 시연해야 향후 올바르고 건전한 대화 AI 시스템을 구축할 수 있다”며 “눈에 보이는 문제부터 해소해야 앞으로 나아갈 수 있다"고 밝혔다.
메타는 "이번에 공개한 블랜더봇은 기존 챗봇들이 가진 정보 데이터보다 두 배 더 많이 갖고 있다"고 지속적으로 강조했다. 기존 챗봇보다 47% 더 정확한 답변을 한다고도 밝혔다. 실제로 블랜더봇에 입력된 주제는 천개 이상이고 대화 데이터셋은 2만개가 넘는다.
AI타임스 김미정 기자 kimj7521@aitimes.com
[관련 기사]메타AI, 최신 AI 챗봇 '블렌더봇3' 소개
[관련 기사]메타의 AI 챗봇 ”트럼프가 지난 대선 승리”
