인공지능(AI)모델이 데이터를 학습할때 차분 프라이버시(DP) 기술을 적용해 개인정보를 보호해주는 파이토치 라이브러리가 오픈소스로 나왔다.

페이스북이 기존 차분 프라이버시(DP)기술보다 확장성을 높인 파이토치 라이브러리 '오파쿠스'를 오픈소스로 공개했다고 지난 31일(현지시간) 벤처비트는 보도했다.

DP는 구글, 애플 등 많은 기업이 활용하고 있는 개인정보 암호화 기술이다. 학습 데이터의 전체 총량에는 변화를 주지 않지만 개별 학습 데이터에 노이즈(변형값)을 주는 방식으로 암호화한다. 예를들어 A , B 두명의 키 데이터178cm, 185cm에 변형을 줘서 179cm, 184cm 로 만드는 방식이다. 평균값은 181.5cm로 같기 때문에 AI모델 학습에 큰 영향을 주지 않으며 개인정보를 보호할 수 있다. 

 

오파쿠스 워크플로우 다이어그램(사진=페이스북 블로그)

오파쿠스는 AI 학습 과정에 DP를 적용하기 위해 표준 파이토치 옵티마이저를 변경한다. 좀 더 구체적으로 말하면, DP의 확률적 경사 하강법(SGD)에 초점을 맞춰 진행한다. 특히, 모델이 직접 데이터를 업데이트 하기 보다 무게를 업데이트하는 데 사용하는 파라미터 그래디언트에 개입해 학습 데이터 셋의 개인 정보를 보호 할 수 있다.

페이스북에 따르면 오파쿠스는 파이토치의 후크를 기존 라이브러리에 비해 '계산차수' 속도를 독보적으로 향상시켜준다. 또 실시간 모니터링을 가능하게하기 위해 특정 시점에서 개인정보 상한을 설정해 얼마나 많이 사용되었는지 추적한다.

무작위 보안 암호화 숫자 생성기 'CS PRNG'를 사용, 호환되지 않는 구성 요소에 대해 경고하는 자습서 및 도우미 함수 기능을 제공한다. 또 백그라운드에서 작동하며 추가 단계 없이도 평상시처럼 배치할 수 있는 표준 AI모델을 만든다.

페이스북이 오파쿠스를 오픈소스로 공개한 데에는 구글과 마이크로소프트(MS)가 DP 라이브러리를 깃허브에 오픈소스로 공개한 것에 영향을 받은것으로 보인다. 구글은 지난해 분류 머신러닝(ML) 분류 및 보안성을 평가하는 텐서 플로우 프라이버시를 오픈소스로 공개했다. 또 마이크로소프트(MS)는 최근 애저에서 DP를 위한 AI툴킷 화이트 노이즈를 깃허브에 공개했다.

 

[Life & 교육] '작품 보실래요?' 2020 파이토치 해커톤 마감

[AI & 산업] 링크드인, 학습 데이터 편향성 측정하는 오픈소스 툴킷 공개