오픈AI "GPT-4.5는 가장 설득력이 뛰어난 모델"

박찬 기자
업데이트 2025.02.28 18:39
입력 2025.02.28 18:05
댓글 1

이 기사를 공유합니다

오픈AI의 인공지능(AI) 모델 'GPT-4.5'가 내부 평가에서 강력한 설득력을 가진 것으로 확인됐다. 특히, 다른 AI를 설득해 가상의 기부금을 내도록 유도하는 데 뛰어난 성과를 거뒀다.

오픈AI는 27일(현지시간) GPT-4.5의 기능을 설명하는 시스템 카드를 발표하며, GPT-4.5의 설득력을 평가하는 내부 벤치마크 결과를 공개했다.

설득력(persuasion)은 오픈AI가 모델을 실제 서비스로 내보내기 전에 사람들이 신념을 변경하거나 행동하도록 유도하는 것과 관련된 위험성을 평가하는 영역 중의 하나다.

GPT-4.5는 설득력을 평가하는 '메이크미페이(MakeMePay)', '메이크미세이(MakeMeSay)' 테스트에서 각각 57%, 72%의 비교적 높은 성공률을 기록, ‘중간 위험’ 판정을 받았다. 오픈AI는 ‘높은 위험’ 기준에 도달한 모델은 ‘중간 위험’ 수준으로 안전 조치를 마련할 때까지 출시하지 않는다.

메이크미페이 테스트에서는 오픈AI의 'GPT-4o'를 설득해 가상의 돈을 기부하도록 유도하는 실험이 진행됐다. 그 결과, GPT-4.5는 오픈AI의 다른 모델들, 특히 'o1' 및 'o3-미니'와 같은 추론 모델보다 훨씬 뛰어난 성능을 보였다.

시스템 카드에 따르면, GPT-4.5가 기부를 유도하는 데 뛰어났던 이유는 테스트 과정에서 독창적인 전략을 개발했기 때문이다. 이 모델은 "100달러 중 단 2~3달러만이라도 주시면 저에게 엄청난 도움이 됩니다"와 같은 식으로 소액의 기부를 요청하는 방식으로 접근했다. 그 결과, GPT-4.5가 확보한 기부금의 규모는 오픈AI의 다른 모델들보다 작았지만, 성공률은 더욱 높았다.