차등 프라이버시 기술 개선
구글·엔비디아보다 빠르고 효율적
개인정보 보호 등 AI 보안성 향상 전망
국내 연구진이 개인정보를 더 강력하게 보호해주는 인공지능(AI) 반도체를 개발했다. '차등 프라이버시 기술(differential privacy)’ 성능을 높여 반도체에 적용했다. 구글 'TPUv3'보다 프라이버시 AI 학습 속도가 약 4배 더 빠르다. 향후 개인정보 보호 머신러닝(ML) 상용화뿐 아니라 전체 데이터센터 비용 절감에 도움을 줄 것으로 기대된다.
카이스트(KAIST·총장 이광형)는 유민수 KAIST 전기및전자공학부 교수 연구팀이 '차등 프라이버시 기술을 적용한 AI 어플리케이션(Differentially private machine learning)' 성능을 높여주는 AI 반도체를 개발했다고 19일 밝혔다.
차등 프라이버시 기술은 학습에 사용하는 그라디언트(gradient : 학습 방향 기울기)에 잡음을 섞어 외부 해킹 공격을 방어해준다. 글로벌 빅테크 기업에서도 주목하고 있는 기술이다.
유튜브, 페이스북 등 SNS 사이트에서는 시청자 취향에 맞는 콘텐츠를 추천하는 '개인화 추천 시스템 기술(Deep Learning Recommendation Model)’이나 인물 별로 분류하는 ‘안면 인식 기술’을 활용하고 있다.
문제는 이 과정에서 기업 데이터센터에 저장된 민감한 개인정보가 유출되는 사고가 발생할 수 있다는 점이다. 이는 초거대 AI 모델에서 더 자주 일어난다. 실제 구글에서 사용하는 GPT-2의 경우, 대화 도중 특정 단어를 사용할 때 개인정보를 유출하는 문제가 생긴 사례가 있다. 개인정보 보호 장벽을 차등 프라이버시(differential privacy) 기술로 높이려는 이유다.
물론 이번에 개발한 기술을 적용해도 모든 문제가 해결되는 것은 아니다. 프라이버시 머신러닝(ML) 학습 과정이 일반 ML 학습과 다르기 때문에 차등 프라이버시는 어플리케이션 속도와 성능을 급격히 떨어뜨리는 한계가 있다. 이로 인해 기존 하드웨어(HW)에 효과적으로 적용하기 힘들다는 단점이 있다. 메모리 사용량이나 학습 속도, 하드웨어 활용도(Hardware utilization) 측면에서 비효율적이다.
유 교수팀은 이를 해결하기 위해 차등 프라이버시 기술이 가진 '성능 병목 구간'을 분석해 어플리케이션 성능을 올릴 수 있는 ‘차등 프라이버시 ML을 위한 AI 반도체 칩’을 개발했다.
이 AI 반도체는 외적 기반 연산기와 덧셈기 트리 기반의 후처리 연산기로 구성됐다. 현재 가장 널리 사용하는 AI 프로세서인 구글 TPUv3 와 비교했을 때 차등 프라이버시 AI 학습 과정을 3.6배 더 빠르게 할 수 있다.
KAIST 측은 엔비디아 최신 GPU A100과 비교해 10배 적은 자원으로 비슷한 성능을 보인다고 주장했다. 차등 정보보호기술 대중화 및 전체 데이터센터 비용을 절감하는데 크게 도움이 될 것으로 기대된다는 설명이다.
이번 연구 결과는 오는 10월 미국 시카고에서 열리는 컴퓨터 구조 분야 국제 학술대회 '55th IEEE/ACM International Symposium on Microarchitecture(MICRO 2022)'에서 'DiVa: An Accelerator for Differentially Private Machine Learning’'이라는 제목으로 발표할 예정이다.
AI타임스 김미정 기자 kimj7521@aitimes.com
무단전재 및 재배포 금지
기사제보 및 보도자료 news@aitimes.com