오픈AI가 문제로 지적된 챗GPT의 '환각'과 '탈옥' 등 문제를 해결하기 위해 최대 2만달러(약 2650만원)의 보상금을 걸었다.
블룸버그는 오픈AI가 챗GPT 등 인공지능(AI) 제품을 사용하는 동안 발견한 문제나 버그, 보안 취약점 등을 보고하면 보상하는 '버그 바운티 프로그램'을 실시한다고 11일(현지시간) 밝혔다.
이에 따르면 버그의 심각도에 따라 가장 낮은 200달러(약 26만5000원)부터 '예외적인 발견'의 경우에는 2만달러까지 지급한다.
매튜 나이트 오픈AI 보안 책임자는 "우리는 위험을 방지하기 위해 노력하고 있지만, 사람들이 현실 세계에서 기술을 사용하거나 오용하는 모든 방식을 예측할 수는 없다"라며 "많은 이들의 도움이 필요하다"고 전했다.
이 프로그램의 진행을 맡은 버그 바운티 전문 버그크라우드 홈페이지를 통해 보상금 사례를 상세하게 소개했다. 여기에는 탈옥을 유도하는 프롬프트와 악성 코드를 작성하게 하는 질문, AI가 악의가 있는 답변을 하게 만드는 쿼리 등 최근 문제로 꼽힌 사례들이 포함돼 있다.
더불어 단순 버그나 오용 문제가 아닌 AI 모델의 '안전 문제'에 대한 의견도 접수한다고 밝혔다. "이런 문제를 해결하려면 상당한 연구와 광범위한 접근 방식이 필요하다"며 버그 바운티 대신 적절한 양식을 사용해 문제를 보고해주길 바란다고 설명했다.
이에 대해서는 블룸버그는 지난 9일 AI 프로그램에 내장된 제한 사항을 우회해 유해하거나 증오심을 표현하는 답변을 유도하는 '탈옥(Jailbreaking) 프롬프트' 기술이 새 트렌드로 떠오르고 있다고 소개했다.
당시 그렉 브록먼 오픈AI 사장은 탈옥 관련 게시물을 리트윗하고 "현상금 프로그램 시작을 고려 중"이며 "(탈옥을 전문적으로 테스트하는) '레드팀' 네트워크를 운영 중"이라고 밝혔다.
또 "시간이 지날수록 이런 문제점을 찾아내는 작업에는 더 많은 '판돈'이 걸릴 것"이라고 덧붙였다.
강두원 기자 ainews@aitimes.com
