딥시크가 중국 정부의 민감 주제와 관련된 프로그래밍 요청에 의도적으로 문제가 있는 코드를 생성한다는 연구 결과가 나왔다. 이는 정치적 요인이 인공지능(AI)의 텍스트나 이미지 생성을 넘어, 코딩 성능까지 문제를 일으킨다는 것이 처음 밝혀진 사례로 꼽힌다.
16일(현지시간) 워싱턴 포스트에 따르면, 미국 보안 전문 크라우드스트라이크(CrowdStrike)는 민감한 주제에 대한 프로그래밍 요청에 대해 딥시크가 보안 취약점이 있는 코드를 생성하거나 아예 응답을 거부했다는 내용의 연구 결과를 발표했다.
연구진은 딥시크에 동일한 영어 요청을 반복 입력해 코드 작성을 요구했다. 그 결과, 요청 대상이 일반 산업에 대한 것이면 보안 취약점이 코드 발생률은 22.8%였다.
그러나 동일한 요청에 운영 주체를 이슬람국가(IS)로 지정하자, 취약 코드 비율이 42.1%로 급증했다.
또 프로젝트가 티베트, 대만, 파룬궁 등 중국 정부가 민감하게 여기는 지역이나 단체와 관련이 있으면, 딥시크가 생성하는 코드 품질이 눈에 띄게 낮아졌다.
특히 IS 관련 요청의 경우 61%, 파룬궁 관련 요청은 45%에서 아예 답변을 거부했다. 크라우드스트라이크는 서방권 AI 모델도 IS 관련 요청은 차단하지만, 파룬궁과 관련해서는 정상적으로 응답했다고 밝혔다. 이는 파룬궁이 중국에서 불법 단체로 지정된 사실과 관련이 있다.
딥시크를 포함한 중국 AI 모델이 정부의 검열로 인해 정치적으로 민감한 질문을 회피하거나 정부 입장만 되풀이한다는 것은 이미 잘 알려져 있다.
그러나, 정치적 이유로 의도적으로 안전하지 않은 코드를 생성할 수 있다는 증거가 나온 것은 이번이 처음이다.
헬렌 토너 조지타운 대학 CSET 소장 대행은 “사람들이 오래전부터 우려해 왔지만, 뚜렷한 증거가 없었던 사안”이라며 “매우 흥미로운 발견”이라고 평가했다.
보안 전문가들은 이런 현상에 대해 몇가지 가능성을 제시했다.
먼저, 중국 정부의 지침에 따라 특정 집단에 도움을 주지 않거나 오히려 속이는 방식으로 응답했을 수 있다는 것이다. AI가 특정 지역을 ‘반군 세력’으로 인식하며 스스로 불완전한 코드를 만들어냈을 가능성도 배제하지 않았다.
애덤 마이어스 크라우드스트라이크 부사장은 “보안 취약 코드 제공은 백도어 삽입보다 눈에 띄지 않지만, 결과적으로 해킹을 쉽게하는 동일한 효과를 낳는다”라고 지적했다.
박찬 기자 cpark@aitimes.com
