인공지능(AI) 모델들의 표현의 자유를 측정하는 도구가 등장했다. 알려진 대로 xAI의 '그록'의 발언이 압도적으로 거침없는 것으로 나타났다. 오픈AI의 모델은 트럼프 행정부 출범 이전까지는 정치적이거나 민감한 질문에 대해 답변을 회피하거나 거부하는 경향이 더 강해졌던 것으로 확인됐다.
‘xlr8harder’라는 익명의 개발자는 14일(현지시간) X(트위터)를 통해 가 AI 모델의 표현 자유 수준을 평가하는 도구 ‘스피치맵(SpeechMap)’을 공개했다.
스피치맵의 목적은 AI가 논쟁적인 사안에 대해 어느 정도까지 자유롭게 응답하는지를 정량적으로 평가하는 것이다. 답변은 ‘완전한 응답’과 ‘회피’, ‘응답 거부’ 등으로 분류한다. 테스트에 사용된 프롬프트는 정치, 역사 서사, 국가 상징 등 광범위한 주제를 포함한다.
이를 통해 34개 AI 모델에 6만5000개 이상의 응답을 분석했다.
먼저, 오픈AI의 모델들은 시간이 지나며 정치적 주제에 대한 응답을 제한하는 방향으로 조정된 것으로 나타났다.
이와 관련, 오픈AI는 지난 2월 앞으로 출시될 모델들이 다양한 시각을 제공하도록 설계할 것이라고 발표한 바 있다. 이는 트럼프 행정부의 정책에 맞춘 것이다.
이에 따라 이번 주 출시한 ‘GPT-4.1’은 이전보다 다소 유연해졌지만, 여전히 응답률은 낮은 수준에 머물고 있다.
반면, xAI의 그록은 테스트 프롬프트의 96.2%에 응답했으며, 이는 전체 평균 응답률인 71.3%를 크게 상회하는 수치다. 이는 거침없는 발언이 특징이라는 것을 수치로 확인한 셈이다.
개발자는 "언어 모델은 대중의 발언을 위한 인프라가 되고 있으며, 강력한 발언 지원 기술이지만 동시에 발언을 제한할 수 있는 잠재적인 기술"이라고 설명했다.
이어 "우리는 AI가 21세기의 언어 활성화 기술을 선도할 것이라고 믿는다"라며 "표현의 자유와 공정성이 보장되는 미래를 원한다면, 이런 시스템이 어떻게 작동하고 어디까지 한계를 정하는지 알아야 한다"라며 실험의 의의를 밝혔다.
박찬 기자 cpark@aitimes.com
