오픈AI가 ‘챗GPT 에이전트’를 도입하며 인공지능(AI) 보안 패러다임이 중대한 전환점을 맞이했다고 밝혔다. 기존 수준을 훨씬 뛰어넘는, 초강력 보안 조치를 적용했다는 설명이다.
오픈AI는 18일(현지시간) 챗GPT 에이전트를 도입하면서 역대 최고 수준의 보안 검증과 대응 체계를 구축했다고 전했다.
케런 구 오픈AI 안전 연구팀 연구원은 X를 통해 "챗GPT 에이전트는 우리의 준비 프레임워크(Preparedness Framework)에 따라 생물학 및 화학 분야에서 '고성능'으로 분류된 최초의 모델" 이라며 "이에 따라 챗GPT 에이전트에 가장 강력한 안전장치를 활성화했다"라고 말했다.
유료 사용자만 이용할 수 있는 챗GPT 에이전트는 이메일 계정에 로그인하고 메일을 작성·응답하거나 파일을 다운로드·수정·생성하는 등 복잡한 작업을 스스로 수행할 수 있도록 설계됐다. 사람이 컴퓨터를 직접 조작하는 것처럼, 챗GPT가 사용자 권한으로 웹 기반 서비스를 활용할 수 있게 된 것이다.
이는 전례 없는 보안 리스크를 동반한다. 단순한 대화형 응답을 넘어 실제 사용자 계정과 파일에 직접 접근할 수 있게 되며, 데이터 유출이나 악용, 시스템 침입 같은 심각한 위협이 현실적인 문제로 떠오른 것이다. 이에 오픈AI는 기능 도입에 앞서 그 어느 때보다 강력한 보안 점검과 대응 체계를 마련하는 데 집중했다고 설명했다.
오픈AI는 16명의 생명과학·보안 관련 박사급 전문가로 구성된 ‘레드 팀(Red Team)’을 투입해 챗GPT 에이전트를 집중 테스트했다고 밝혔다.
이들은 총 110건의 공격 시나리오를 설계해 모델의 취약점을 검증했으며, 그중 16건은 오픈AI 내부의 위험 기준을 초과하는 심각한 결함으로 분류됐다. 예를 들어, 외부 웹사이트 접근 중 발생 가능한 탈옥 유도(prompt injection), 생물학적 위협 정보 생성 가능성, 그리고 데이터 탈취 공격 등 실제 공격에 악용될 수 있는 치명적 취약점들이 발견됐다.
We’ve activated our strongest safeguards for ChatGPT Agent.
— Keren Gu (@KerenGu) July 17, 2025
It’s the first model we’ve classified as High capability in biology & chemistry under our Preparedness Framework. Here’s why that matters–and what we’re doing to keep it safe. https://t.co/FjJ6JyKX39
사전 테스트 결과를 바탕으로 챗GPT 에이전트에 고도화된 보안 조치를 적용했다고 전했다.
우선, 모든 사용자 활동은 96% 탐지율의 빠른 분류기와 84% 탐지율의 고도화된 추론 모니터를 통해 100% 실시간 이중 감시가 이뤄진다. 또 감시 모드(Watch Mode)를 통해 이메일이나 금융 서비스처럼 민감한 환경에서 사용자가 갑작스럽게 이탈하면 에이전트의 모든 활동이 즉시 중단된다.
데이터 유출 위험을 줄이기 위해서는 핵심 기능 중 하나인 메모리 기능을 초기 버전에서 아예 제거했다.
아울러, 외부 시스템 명령 실행을 차단하기 위해 네트워크 연결은 GET 요청만 허용되며, 그 외 요청은 제한된다. 이와 함께 신속 대응 프로토콜도 운영 중으로, 취약점이 발견될 경우 수 시간 내로 보안 패치를 완료할 수 있는 체계를 갖췄다.
이런 조치에도 불구하고 챗GPT 에이전트의 강력한 기능은 기존 보안 개념의 한계를 드러냈다고 밝혔다. 레드 팀은 “전통적 보안 경계는 자율 AI 에이전트에게 무력하다”라며, 모든 상호작용을 전방위로 감시하고 빠르게 대응하는 체계가 필수라고 강조했다.
이에 따라 공동 작업에 나선 영국 AI안전연구소는 에이전트의 내부 정책과 추론 구조에 접근해 7가지 ‘보편적 공격’ 시나리오를 구현했고, 오픈AI는 이를 모두 사전 차단하도록 보안 구조를 대폭 재설계했다.
이처럼 챗GPT 에이전트 출시는 단순한 기능 업데이트를 넘어, AI 보안을 제품의 ‘부가 요소’가 아닌 ‘핵심 기반’으로 재정의한 사례로 평가받는다. 오픈AI는 이번 경험을 바탕으로, 앞으로의 고도화된 AI 모델들은 모두 이 수준의 안전성 프레임워크를 갖춰야 한다는 기준을 제시하고 있다.
구 연구원은 “이제 대비(Preparedness)는 단순한 시뮬레이션이 아니라, 운영 필수 요건이 됐다”라고 강조했다.
박찬 기자 cpark@aitimes.com
- 챗GPT 에이전트, '엑셀·PPT 사용'이 아니라 '직접 코드 생성'
- 오픈AI, 엑셀·PPT 만드는 '챗GPT 에이전트' 출시...기업 시장 도전
- 오픈AI, MS 앱 없어도 엑셀·파워포인트 만드는 '챗GPT' 기능 개발
- 챗GPT 에이전트, 캡차 인증 가볍게 통과...'나는 로봇이 아닙니다'
- 오픈AI, 챗GPT '대화 공유' 실험 중단...“의도치 않은 정보 노출 우려 커”
- 구글, AI '버그 헌터'로 오픈 소스 SW 보안 취약점 20개 발견
- 구글 캘린더 초대장 통한 ‘프롬프트웨어’ 공격 발견
- 오픈AI, 영국 전 국민 대상 '챗GPT 플러스' 제공 논의했으나 불발
- 구글, AI가 보안 취약점 수정하는 ‘코드멘더’ 공개...자동 패치 시대 개막
- 오픈AI, GPT‑5 기반 보안 연구 에이전트 '아드바크' 출시
