(사진=셔터스톡)
(사진=셔터스톡)

생성 인공지능(AI) 모델 개발에 사용하는 ‘인터넷상 공개 데이터’에 대한 정부 차원의 기준이 나왔다. 하지만 구체적인 사례를 제시한 것이 아니라, 향후 논의를 위한 기본 틀을 제시하는 수준이다.

개인정보보호위원회(위원장 고학수)는 AI 개발에 필수적인 공개 데이터가 현행 개인정보 규율체계 내에서 적법하고 안전하게 처리될 수 있도록 'AI 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련했다고 17일 밝혔다.

공개 데이터는 인터넷상 누구나 합법적으로 접근할 수 있는 커먼크롤이나 위키피이아, 블로그, 웹사이트 등의 데이터를 말한다.

개인정보위는 공개된 개인정보 수집‧활용의 법적기준을 명확화하고 AI 개발 및 서비스 단계에서 어떤 안전조치를 취하는 것이 적정한지에 대해 기업이 참고할 수 있는 최소한의 기준을 제시하는 안내서를 마련하게 됐다고 밝혔다. 또 유럽연합(EU)이나 미국 등의 상황을 감안, 국제적으로 상호운용성 있는 기준을 마련하는 데 중점을 뒀다고 설명했다.

이날 발표 중 가장 핵심이 되는 부분은 "보호법 제15조에 따른 ‘정당한 이익’ 조항에 의해 공개된 개인정보를 AI 학습·서비스 개발에 활용할 수 있다"라는 점이다.

보호법 제15조제1항제6호는 "개인정보처리자의 정당한 이익을 달성하기 위하여 필요한 경우로서 명백하게 정보주체의 권리보다 우선하는 경우. 이 경우 개인정보처리자의 정당한 이익과 상당한 관련이 있고 합리적인 범위를 초과하지 아니하는 경우에 한한다"로 규정돼 있다.

또 ‘정당한 이익’ 조항이 적용되기 위해서는 AI 개발 목적의 정당성, 공개된 개인정보 처리의 필요성, 구체적 이익형량이라는 세가지 요건을 충족해야 한다고 명시했다.

하지만 이에 대해 최종 기준안을 제시한 것으로는 볼 수 없다. 정당성이라는 부분에 구체적인 설명이 없고, 개별 사례에 대한 디테일한 가이드라인이 없기 때문이다. 

예를 들어 현재 EU에서는 소셜 미디어에서 사용자가 쓴 글로 AI 모델 학습을 동의 없이 진행하는 것을 금지하는 추세다. 따라서 기본 설정을 '사용 동의'로 설정, 사용자가 번거롭게 거부 항목을 찾아서 거부 의사를 밝혀야 하는 '옵트인(opt-in) 방식'을 금지하고 있다. 

반면 미국에서는 메타나 X(트위터)가 옵트 아웃 방식으로 사용자 동의를 얻어 SNS 데이터를 학습에 사용하고 있다.

이처럼 구체적인 사례에 대한 세부 기준이 필요한 상황이다. 하지만 이번 가이드북이 제시한 사례는 불법 사용을 금하거나 민감한 개인정보가 포함되서는 안 된다는 정도의 원칙적인 사례가 주를 이루고 있다.

또 이번 가이드북은 데이터 학습의 여러 측면 중 개인 정보에 관한 부분일 뿐, 저작권에 대한 문제는 빠져있다. 이 부분 역시 관련 부처에서 추후 고도화해야 할 내용이다.

개인정보위 역시 안내서는 추후 개인정보 관련 법령 제·개정, AI 기술발전 추이, 해외 규제정비 동향 등을 고려해 지속 업데이트될 예정이라고 밝혔다. 

또 이용자 개인정보의 적법한 처리 근거와 기준 등에 대해서는 학계, 산업계, 시민단체 등의 의견수렴을 거쳐 구체화해 나가겠다고 덧붙였다.

더불어 이번 가이드북은 법 해석 기준을 제시한 것일 뿐, 법적인 구속력이 없다. 

이번 안내서 관련 논의에 참여한 김병필 한국과학기술원 교수는 “안내서는 신뢰할 수 있는 AI 개발, 이용을 위한 좋은 참고 자료가 될 것이라 생각한다”라고 밝혔다.

민·관 정책협의회의 공동의장인 배경훈 엘지 에이아이 연구원장도 “이번 안내서 공개는 인공지능(AI) 기술 발전과 개인 데이터 보호를 동시에 달성하기 위한 중요한 진전이자 첫걸음”이라고 전했다.

고학수 개인정보위 위원장은 “이번 안내서를 통해 국민이 신뢰하는 AI·데이터 처리 관행을 기업 스스로 만들어 나가고 이렇게 축적된 모범사례가 안내서에 지속적으로 반영될 수 있기를 기대한다”라고 말했다.

박수빈 기자 sbin08@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지