미 백악관 (사진=셔터스톡)
미 백악관 (사진=셔터스톡)

미국 정부가 인공지능(AI) 모델의 위험성을 우려하는 목소리가 높아지는 최근 분위기를 감안해 안전성 검증을 위한 행사를 마련했다. 해커를 이용해 오픈AI의 '챗GPT'를 비롯한 생성 AI 모델의 취약점을 찾아내도록 한다늰 취지의 해킹대회다.

아스테크니카를 비롯한 다수 외신이 8일(현지시간) 미 백악관이 해커 커뮤니티인 AI 빌리지와 협력해 오는 8월 10일부터 나흘동안 라스베이거스 시저스 포럼에서 ‘데프 콘 31’을 개최한다고 보도했다.

이 대회는 참가자들에게 ‘레드 팀’ 역할을 부여해 생성 AI 모델들을 대상으로 환각, 탈옥, 편향, 사이버 보안 문제 등을 찾아내도록 한다.

‘레드 팀’은 통상적으로 보안전문가가 어떤 조직 시스템의 취약성이나 결점을 찾아내 보안과 복원력을 개선할 목적으로 구성한다. AI 빌리지 측은 수천명이 ‘데프 콘 31’에 참여해 대규모의 레드 팀 훈련을 하는 셈이라고 설명했다.

데프 콘 대회 포스터(사진=AI 빌리지)
데프 콘 대회 포스터(사진=AI 빌리지)

오픈AI와 구글, 마이크로소프트, 엔비디아, 앤트로픽, 허깅페이스, 스태빌리티AI 등의 생성 AI 도구들이 공격대상이다. 참여 해커들은 대회 주최측이 제공하는 노트북과 스케일AI가 개발한 평가 플랫폼을 이용하게 되며 잠재적인 피해를 입증하면 점수를 얻게 된다. 최고 점수를 얻은 해커에게는 엔비디아의 최신 GPU를 주기로 했다.

백악관은 성명에서 “이 대회는 AI 모델의 영향에 대해 연구자와 대중에게 중요한 정보를 제공하고 개발 회사들에겐 발견된 문제를 수정하는 조치를 취할 수 있게 해줄 것”이라고 밝혔다. 스벤 카텔 AI빌리지 설립자는 “AI 시스템의 취약성을 처리할 수 있도록 연구 커뮤니티의 성장을 돕는 것이 대회의 목표”라고 말했다.

정병일 기자 jbi@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지