▲빅데이터 윤리는 윤리의 일환으로 자료와 관련된 윤리적인 문제를 평가하고 연구한다(출처=123RF)

빅데이터 리서치 수행 시의 윤리

빅데이터의 성장 배경으로는 모바일 인터넷 사용, 스마트폰 대중화, 스마트 도시 내 센서망 활용 등이 꼽힌다. 수년간 사람들은 다양한 자료를 대규모로 생산했다. 미 케임브릿지대학 리서치 그룹인 CRASSH는 자료 증가에 따라 공유되는 속도도 매우 빨라졌다고 전했다.

그러나 공개된 정부 및 기업 자료는 잠재적으로 의도되지 않은 방식으로 인간 행동, 상호 작용, 관행 등을 밝혀낼 수도 있다. 이 때문에 빅데이터 리서치를 수행 시 윤리적인 지원이 중요하다.

빅데이터 윤리란 무엇인가

빅데이터 윤리는 자료와 관련된 윤리적인 문제를 평가하고 연구한다. 이를테면 정보의 녹취, 생성, 보급, 사용, 공유, 그리고 처리를 비롯해 윤리적으로 좋은 솔루션을 지원하고 만들어 내기 위한 알고리즘과 이에 준하는 관행을 지칭한다.

최근에는 빅테이터 윤리, 혹은 단순히 데이터 윤리가 정보와 컴퓨터 윤리에 의해 제공된 기반에 기초한다고 간주되고 있다. 이는 리서치 필드의 접근법을 윤리적 추상화 요구 수준을 변경시킴으로써 단순히 다듬는다. 이 변화는 정보의 윤리적 차원에 초점을 맞추며, 심지어 정보로 직접 변환되지 않고 행동을 생성하는 데 사용되는 것까지도 포괄한다.

책임감 있는 데이터 조사를 위한 규칙

'책임감 있는 빅데이터 조사를 위한 10가지 단순한 규칙'이라는 연구에서 저자는 윤리적 문제가 부쩍 긴급해졌다고 지적한다. 조사 의제가 전형적인, 자연스러운, 그리고 컴퓨터를 사용한 과학 그 너머로 옮겨가고 있기 때문이다. 그래서 이들은 책임감 있는 빅데이터 조사를 위한 규칙 목록을 작성했다.

가장 기초가 되는 규칙 중 하나는 자료가 사람임을 인지하고 위해를 끼칠 가능성이 있음을 알아야 한다는 것이다. 이는 간단히 말해 데이터가 나타내는 것 때문에 사람이 영향을 받을 수 있다는 뜻이다. 일례로 해양학 자료를 꼽을 수 있다. 이는 지역 사회의 리스크 정보는 물론이거니와 이들의 자산 가치도 변동시킬 수 있다.

자료가 어떻게 사람에게 위해를 가할 수 있을까? 저자들은 겉보기엔 무해한 인구에 대한 자료들은 다른 개인들의 삶의 방식을 빚는 데 사용됐다. 이를테면 소셜 미디어의 소셜 네트워크 지도는 컨텐츠의 신뢰도를 쌓거나 상습범 발생 점수는 국가의 형사 처벌 결정을 내리는 데 영향을 미칠 수 있다.

켄터키대학 매튜 주크 지리학 박사 연구팀 제안한 다른 규칙은 빅데이터가 사생활 침해를 통해서 해를 입혀왔다는 사실을 인지해야 한다는 것이다. 바로 이렇기 때문에 사생활이라는 단어가 단순히 사적인 것과 공적인 것을 둘로 가르는 것 이상이라는 것을 인지해야 한다. 연구팀은 한 사용자의 인스타그램 사진 한 장을 보는 것으로, 해당 개인의 소셜 미디어 포스트 이력을 쭉 훑었을 때와는 서로 다른 윤리적인 결론을 도출할 수 있다고 말한다. 이들은 데이터 사생활이 데이터 그 자체의 특성 혹은 데이터가 입수되거나 만들어진 맥락에 좌우된다고 강조한다. 이 팀은 또한 재식별로부터 데이터를 보호해야 한다는 규칙을 강조한다. 빅데이터 플랫폼 데이타플로그에 따르면, 개인 재식별은 사생활 문제로 이어질 수 있다. 공개돼서는 안 될 자료가 공개적으로 입수가 가능해지기 때문이다. 이를테면, 사회적 활동이나 낙인이 찍힌 질병으로부터 고통을 받는 특정 커뮤니티에 대한 익명 데이터는 다른 사람들에 비해 더 많은 정보를 공개한다. 이는 개인을 식별하기 위해 다양한 변수로 작용한다. 생일, 우편번호, 성별, 디지털 활동성, 메타 데이터 등이 있다. 표식을 붙이지 않은 네트워크 그래프도 있다. 이를테면 스마트폰의 통화 이력, DNA 프로파일, 이동 및 지역, 지구의 HD위성 이미지 등이 여기에 속한다.

이러한 표식이 붙지 않은 네트워크 그래프는 사람을 재식별하는 데 사용될 수 있다. 저자는 책임감있는 데이터 연구의 일환으로 자료 식별로부터 ‘보호’하는 것이 중요하다고 강조한다.

▲데이터 윤리는 정보와 컴퓨터 윤리가 제공하는 기반에 기초한다(출처=123RF)

윤리적인 데이터 공유

데이터 공유는 데이터 리서치의 일부다. 이 사례로는 드문 유전병에 대한 연구를 다른 사람에게 공유하는 것 등이 있다. 연구자들은 자료나 생물학적 샘플을 공유해 함께 효율적인 치료법을 찾을 수 있다. 이러한 프로젝트는 철회권과 사전 통보된 동의를 얻어 진행된다. 이 그룹은 사람들에게 우리가 디지털 사회에 살고 있다는 사실을 상기시킨다. 이 사회에서 우리 삶의 흔적 요소를 보유한 데이터 클라우드가 우리를 뒤쫓아 다닌다. 이를테면 의학 검진 결과라든가 설치된 스마트폰 앱들, CCT 이미지, 그리고 신용카드 거래 내역 등이 에 속한다.