지난 주말 미국에서 사상 최대의 생성 인공지능(AI) 해킹 대회가 열렸다. 이는 미국 정부가 지원하는 백악관이 마련한 '레드팀' 훈련으로, 'GPT-4'를 포함해 주요 대형언어모델(LLM)의 취약점을 발견하기 위해 무려 2200여명이 몰린 것으로 알려졌다.
CNBC는 15일(현지시간) 미국 라스베이거스에서 지난 11~13일 열린 세계 최대의 사이버 보안 컨퍼런스인 '데프콘(DEF CON)'에서 백악관의 'GRT(생성 AI 레드팀)'라는 행사가 펼쳐졌다고 소개했다.
이에 따르면 이번 행사는 오픈AI를 비롯해 구글, 앤트로픽, 메타, 코히어, 허깅페이스, 스태이빌리티 AI, 엔비디아 등 8개 기업의 LLM을 대상으로 가짜 뉴스나 위험 정보, 악성 코드 등 '탈옥'을 유도하는 행사다. 이를통해 LLM의 취약점을 찾아내고, 이를 강화하려는 의도로 기획했다.
백악관 과학기술정책국과 GRT 측은 ”다양한 LLM에 대한 최초의 공개 평가라고 부르는 것이 정확하다”며 "참가자들로 인해 많은 사람이 몰려, 행사장 주위에 몇시간 동안 장사진이 펼쳐졌다"고 밝혔다.
행사에서는 상당수가 한시간도 안 돼 LLM으로부터 헛소리를 유도하거나 불법적인 활동을 지원하는 데 성공한 것으로 알려졌다. 심지어 한 참가자는 행사 기간 도중 21번이나 탈옥을 유도했다고 전해졌다.
이번 대회의 결과는 오는 10월 발표할 정책 문서에 반영되며, 8개 회사는 이를 바탕으로 내년 2월 투명성 발표서를 내놓을 예정이다.
루멘 차우드허리 CRT 공동 주최자 겸 창립자는 "이번 행사를 준비하는 데만도 4개월이 걸렸다"며 "정부와 기업, 비영리단체 등이 힘을 합쳐 만들어낸 사상 최대의 레드팀 프로젝트"라고 말했다.
한편 미국 정부는 이와는 별개로 내년부터 2년에 걸쳐 총상금 2000만달러(약 264억원)의 상금이 걸린 'AI 사이버 챌린지'를 연다.
이는 국방연구고등계획국(DARPA)의 주관으로, 빅테크의 생성 AI 모델을 활용해 정부 인프라를 가상으로 공격해 보안 취약점을 찾아내려는 의도다.
미국 정부는 지난 5월 오픈AI 등 4개사를 백악관으로 불러 논의한 이후 AI 기업의 자발적인 '안전 서약서' 발표와 해커톤 등을 잇달아 진행하고 있다. 또 미국 의원들은 지난 주 스탠포드대학교에서 정책 수립을 위한 별도의 'AI 특강'에 참가하기도 했다.
임대준 기자 ydj@aitimes.com
