아웃라이어를 찾아서 - 브리즈번 2017-2020' (김영희, 2020)

AI시대 데이터란?

오늘날 우리는 일상적으로 CCTV가 있는 엘리베이터를 타고 외출해 교통카드로 지하철을 탄다. 스마트폰으로 SNS에 들어가 ‘좋아요’를 누르고, 뉴스를 보고, 사진과 글을 올리며 온라인 쇼핑을 한다. 매일 행하는 단순한 행동과 선택, 생각의 표현이 디지털화되어 방대한 데이터로 축적되고 있다. 실로 어마어마한 양의 데이터는 매일 모이고 축적되고 가공되고 분석되고 있다.

KT경제경영연구소에 따르면 인류가 기록을 남기기 시작한 이래 2000년대 초반까지 생산된 정보의 총량은 약 20엑사바이트에 달한다. 우리가 온라인에서 표출한 의견, 선택한 제품, 무심코 했던 행동은 데이터화되고 가까운 미래에 출시할 새로운 제품, 혹은 새로운 제도를 위해 분석된다. 런던, 뉴욕, 서울과 같은 국제적 도시에서는 오픈데이터 제도를 적극 운영해 도시에서 생성 데이터를 공공화하고 있다. 이렇게 데이터는 우리 생활 깊숙히 들어와 있다.

우리 사회는 이제 빅데이터 시대를 넘어서 알고리즘의 시대, 즉 인공지능(AI) 시대를 맞이하고 있다. 데이터와 머신러닝 알고리즘으로 만들어지는 AI 기술이 일상 속 제품이나 로보틱 제품 개발, 그리고 면접과 같이 정확한 판단이 필요한 곳에 쓰이기 시작했다는 것을 우리는 이미 알고 있다. AI와 기계학습(ML)에는 양질의 데이터가 꼭 필요하다고 볼 수 있기에, 데이터가 21세기의 석유라고도 불리는 것도 과언이 아니다. AI를 논하려면 반드시 데이터를 논해야 한다.

다나 보이드나 케이트 크로포드와 같은 인문학자들은 이토록 빠르게 데이터화된 사회의 문제점을 논한다. 데이터의 사생활 침해, 투명성, 편향성 등이 예시다. 무엇보다도 데이터가 지닌 편견과 편향은 AI 기술을 활용하는 제품과 제도에 그대로 반영되고 영향을 미칠 것이다. 물론 마이크로소프트사의 인공지능 챗봇 테이(Tey) 사건 이후 다수 데이터과학자와 AI 프로그래머들이 AI 편향성을 최소화하기 위한 노력을 하고 있는 것은 사실이다.

하지만 데이터 편견은 완전히 없어지지 않을 것이다. 우리는 이를 먼저 인정하고 공론화하면서 모든 정보를 AI에 의존하지 않았는지, 왜곡되지는 않았는지 스스로 질문을 할 수 있어야 한다. 이제 우리는 AI 데이터 분석과 통계를 순수하게 질문 없이 받아들여서는 안 된다.


데이터 시각화보다 개념적인 ‘데이터 아트’

뉴욕 코넬대 게이츠홀에서 전시된 무드클라우드(김영희, 2014-2015)
뉴욕 코넬대 게이츠홀에서 전시된 무드클라우드(김영희, 2014-2015)

데이터는 본질적으로 수집, 저장, 인식, 가공이 가능하다. 역사적이거나 실시간적이며 시간에 민감하다. 동시에 데이터는 사회적 문제를 드러나게 할 수 있는 속성을 지니고 있어 필자와 같은 미디어 아티스트에게는 이야기거리가 풍부한 작품의 소재이자 주제이며 탐구거리가 되는 예술적 영감 그 자체다.

필자는 5년 전 처음으로 데이터에 깊은 관심을 가지게 됐다. 데이터가 예술적 소재로 어떻게 분석, 가공될 수 있는지, 새로운 매체로서 데이터 기반 작품 성질은 어떠한지에 대해 호기심이 들었다. 2014년 코넬대 정보과학대 제리 게이 교수가 리드하는 인터랙션랩과 '무드클라우드(mood.cloud)' 작품을 협업했다. 이전까지는 전자부품으로서의 센서로 사람 움직임이나 부딪힘을 감지하는 정도의 로컬 데이터를 웨어러블과 인터랙티브 미디어작품에 이용하는 정도였다.

필자는 코넬대 정보과학 연구팀이 사전에 소셜미디어 데이터로 개발한 알고리즘 기반 데이터 값을 4미터 높이, 6미터 넓이 빛 설치물에 응용하면서 가공되지 않은 데이터의 숨겨진 의미를 직접 분석, 탐구해보고 싶은 목마름을 지니게 됐다. 이후 여러 소스의 실시간 데이터와 간단한 알고리즘을 섞어 작품으로 승화시킬 수 있는 툴로서 데이터쿡 온라인 플랫폼 구축을 시작했다.

데이터의 무게 시리즈, 소금과 설탕(김영휘, 2018)
데이터의 무게 시리즈, 소금과 설탕(김영희, 2018)

필자는 데이터쿡으로 방대한 실시간 데이터를 섞어 '데이터의 무게(Weight of Data) '시리즈를 창작, 전시했다. 이 미디어 설치 작품에서는 실체가 있는 원자재와 가상 화폐 가치를 비교했다. 과거 화폐처럼 사용된 쌀, 소금, 설탕을 주재료로 원자재 마켓과 가상화폐 거래시장의 실시간 데이터에 데이터쿡 알고리즘을 접목해 Kg단위 무게로 환산했다.

데이터로 이뤄진 가상(virtual) 가치를 비트코인 1개로 거래할 수 있는 정도의 쌀 무게로 환산했다. 스크린에서는 1분마다 오르고 내리는 무게를 Kg로 업데이트했다. 1Kg의 쌀, 소금, 각설탕으로 만든 이 미디어 설치물은 온라인 거래시장 내 실시간 데이터값에 따라 빛의 색과 패턴이 바뀐다.

필자는 본 작품 시리즈에서 예술 소재로 데이터를 탐구하면서 데이터가 가지고 있는 사회적 속성을 더욱 깊이 연구해보고 싶어졌다. 결국 홍익대에서 후학양성을 잠시 멈추고 호주 QUT로 가서 데이터 기반 예술을 4년간 연구했다. 본 기고글은 해당 연구 일부 내용을 기반으로 작성했다.


데이터 시대 본질적 문제 편향성, 예술로 승화하다

데이터는 단순히 분석하고 통계를 내어 정보로 전환하고 지표를 그리는 것이 아니다. 필자는 데이터를 많은 이야기들이 숨겨져 있는 예술적 소재이며 영감으로 본다. 데이터가 가진 가치와 속성, 사회적 이슈까지 예술적인 영감이고 다이나믹한 소재이며 다양한 주제가 될 수 있다.

데이터 아트는 더 이상 정보 시각화에 국한되지 않고 데이터가 가진 속성, 동시대 사회 반영, 데이터 기술로 창작을 주도하는 예술이다. 90년도에 넷아트가 그 시대 테크놀로지인 인터넷을 매체로 탐구하였듯이 말이다.

디지털아트 영역에서 데이터 아트는 소재와 콘텍스트(의미)를 데이터에 의해 결정짓는 창작활동이다. 예술가가 데이터를 가공해 메시지를 표현할 때 사실적 정보와 관계없이 사회비판적인 메시지를 가진 작품으로 승화시킬 수 있다는 이야기다.

예를 들어 호주에서 활동 중인 샘 하인스(Sam Hains)는 작품 ‘Zero Likes(2017)’에서 인스타그램 소셜데이터에 AI, 머신러닝을 접목해 아무도 ‘좋아요’를 누르지 않은 사진들을 찾아 대신 ‘좋아요’를 눌러주면서 SNS 사회 속 현상 실험을 진행했다. 루이사 부파데시(Louisa Bufardeci)는 ‘The Sea Between A and I(2015)’ 작품을 통해 바다에서 표류하다가 침몰한 난민선의 위치를 추적해 깊은 파란색으로 자수를 놓아 내전에 내몰린 난민들의 비극을 표현했다.

데이터를 다루는 작가는 데이터 속성 중에서도 편향성을 먼저 이해해야 한다. 실제 세상 속에 개인적, 사회적, 문화적, 정치적 편향과 편견이 존재하듯이 우리 사회를 반영하는 데이터는 사람들이나 문화, 역사가 수록했던 편견을 그대로 포함하고 있다. 데이터는 수집, 가공, 분석되고, 주관적으로 해석되는 과정을 통해 여러 겹의 편견으로 정보화된다.

무엇보다도 데이터는 수집될 때부터 특정 목적을 가지고 수집하는 자의 의도와 편향을 포함한다. 수집되지 않은 데이터는 남겨지고 배제된다. 이후에도 데이터를 가공, 분석하는 사람의 개인적 혹은 문화적 성향에 영향을 받아 ‘여러 겹의 편견 레이어’가 형성된다.

필자는 특히 배제된 데이터에 집중한다. 처음부터 수집되지 않은 남겨진 데이터 외에도 분석과정 중 주요 경향을 만드는 데이터 값과 크게 동떨어져서 분석에서 빠지는 아웃라이어(outlier)는 어디에도 소속될 수 없는, 그래서 배제되고 있는 사회 속 다양한 소수를 대변하고 있는 듯하다.

케롤라인 크리아도 페레스(Caroline Criado Perez)는 2019년 발간한 저서 ‘보이지 않는 여성들, 남성 중심 세상을 편중된 데이터로 고발하다’에서 의학연구를 비롯한 사회적 활동이 남성에 비해 적었던 여성에 대한 데이터가 분석, 설계에서 배제된다고 비판했다. 데이터에 포함되지 못한 주체들은 미래를 위한 설계에 포함되지 못하는 차별을 받게 된다.

이에 필자는 ‘아웃라이어를 찾아서’라는 제목의 데이터아트 시리즈를 퀸스랜드공대에서 박사연구 일환으로 제작했다. 작품에서는 데이터 분석에서 주 트렌드를 찾는 발상을 뒤집어 데이터 트렌드 분석 후 남겨진 데이터에 집중해 작품을 재구성, 창작했다.

평범한 단어와 형태로 제작된 초기 워드클라우드 모습
평범한 단어와 형태로 제작된 초기 워드클라우드 모습

‘아웃라이어를 찾아서’는 장소특정적인 작품으로 작가의 과거를 데이터로 돌아 보는 미디어 설치 작품이다. 오랜 뉴욕생활을 접고 서울로 이주해 살았던 필자의 페이스북 개인 계정글 10년치(2007-2017)를 다운로드받아 사용한 단어 종류와 횟수를 데이터 분석 툴로 도출했다.

이후 필자는 수백번씩 사용한 단어들로 워드클라우드를 제작했는데, happy, day, project, time과 같은 단어로 이뤄졌다. 의미적으로 보나 내용적으로 보나 전혀 흥미롭지 않았다. 프로세싱으로 데이터 시각화를 해도 스크린 밖에 남겨지는 단어 수는 몇 천개에 이르렀다. 워드 클라우드에서 배제된 이 단어들을 중심으로 제작한 작품이 ‘아웃라이어를 찾아서’다.

프로세싱을 이용한 데이터비주얼라이제이션 실험
프로세싱을 이용한 데이터비주얼라이제이션 실험

사용한 횟수가 높은 단어일수록 더 투명하고 화면 위에 가볍고 느리게 떠다니며, 사용 횟수가 낮은 단어는 화면 아래로 무겁게, 좀 더 빠르고 선명하게 떠다닌다. 작가 스스로도 기억하지 못한 한번 사용한 단어들, 아웃라이어와 같은 단어들은 화면 가장 앞에 선명하게, 스크린 가득 떠다니게 만들었다.

한 번 사용했던 이 단어들은 매우 다양했으며, 필자의 기억과 경험을 풍부하게 담고 있었다. 관람객 중에 필자를 아는 사람들은 필자의 인생 속에 크로스했던 단어를 찾았고, 나를 모르는 관람객들은 떠다니는 아웃라이어 단어 중 그들과 공통점을 찾을 수 있는 단어를 찾았다.

아웃라이어를 찾아서 - 서울 2007-2017(김영희, 2018)
아웃라이어를 찾아서 - 서울 2007-2017(김영희, 2018)

예를 들어 브리즈번에서 진행한 전시에서 필자를 아는 관객들은 자신들의 이름이나 지명, 공통된 지역의 단어를 찾아 셀카를 찍기 시작했다. 배제될 수 있었던 데이터를 찾아 작품을 만드는 작업을 이후 계속 이어나갔다. 무의미해보이는 데이터가 지닌 다양성은 존중돼야 하며 데이터를 보는 주관적 시각과 편견의 존재, 데이터 편향성도 인식, 존중될 필요가 있다.

브리즈번에 전시된 '아웃라이어를 찾아서' 모습. 관람객들이 자신과 관련된 단어를 몸에 비추며 셀카를 찍고 있다.
브리즈번에 전시된 '아웃라이어를 찾아서' 모습. 관람객들이 자신과 관련된 단어를 몸에 비추며 셀카를 찍고 있다.

필자는 데이터를 수학적이나 과학적 시각으로만 보지 않는다. 데이터를 예술적으로 본다면 동시대의 사회적 주제를 다룰 수 있는 중요한 소재와 주제가 된다. 경제적, 기술적 발전을 위한 시각으로 본다면 데이터는 현 시대 디지털기술인 AI와 로보틱 기술에 없어서는 안될 중요한 요소다. 이에 대해서는 누구도 의심치 않는다.

하지만 데이터는 사회, 사람, 가치관, 환경, 문화 등을 반영할 수 있는 흥미로운 예술적 소재이며 주제이다. 특히 실시간 데이터는 다이나믹하며 인터랙티브하기까지 하다. 데이터를 예술적으로 가공하면 동시대를 반영하는 초상화이자 풍경화가 될 수 있다. 물론 한 시각의 지극히 일부분을 그리게 되겠지만 말이다. 하지만 많은 사람들이 다양한 시각으로 그리다 보면 전체 형체가 점차 드러나지 않을까?

 

김영희 홍익대학교 디자인컨버전스 학부 부교수

김영희 작가는 뉴욕에서 90년대 중반 인터랙티브 미디어 영상 작업을 시작으로 미디어 아트에 입문했다. 지난 15년간 웨어러블, 키네틱, 탠저블 미디어 등 다양한 디지털미디어 플랫폼으로 작품 활동을 했다. 작품에서는 예술과 기술이 혼합돼 여러 형태로 표현되며 급변하는 우리 사회와 자신, 사람들의 관계를 고찰해 작품에 반영한다.

특히 최근에는 빅데이터 시대에 들어서면서 발생하는 데이터 편견, 데이터 투명성과 같은 사회적 이슈에 관심을 가지게 되면서 예술적 소재와 주제로 데이터는 어떻게 해석되고 활용되어야 할지에 대해 연구하고 있다.

김영희 작가는 뉴욕 파슨스 스쿨오브디자인에서 학사 학위, 뉴욕대 ITP (Interactive Telecommunication Program)에서 석사학위, 데이터아트 관련 주제로 호주 QUT에서 박사학위를 받았다. 2007년 홍익대에 부임해 후학양성에 힘쓰고 있으며, 최근 설립한 '레드어니언'은 실시간 도시데이터를 예술창작에 활용하는 프로젝트를 진행 중에 있다.

데이터쿡의 안광세 대표와 5명 참여작가들과 함께 서울 오픈데이터로 온라인 데이터 아트 프로젝트 '플러인시티'를 구상, 협업 중에 있다. 이 프로젝트는 문화체육관광부, 한국문화예술위원회, 서울문화재단 후원을 받아 진행, 12월 22일 오픈할 예정이다.

현재 국내에서 전시 중인 작품으로는 데이터 아트 ‘숨을 불어넣다(BreatheOut)’가 있다. 해당 작품은 한국디자인진흥원 주최 디자인 코리아 페스티벌 주제전 '디자인 데이터로 그리다'에서 전시되고 있다.

 

AI로 만드는 컬처

AI TIMES x NMARA 공동기획

[글 싣는 순서]

① AI, 흰수염고래와 인간 합창곡 만들다

언해피서킷 다학제 및 뉴미디어아티스트

② A.I. Atelier, 고흐 화풍으로 지금의 파리를 재현하다

이수진 중앙대학교 인문콘텐츠연구소 연구교수

③ AI와 미래의 음악

이교구 서울대 지능정보융합학과 교수

④ AI, 영화를 (리)메이크하다

정찬철 한국외국어대학교 미네르바 교양대학 조교수

유태경 중앙대학교 예술공학대학 교수

⑤ AI와 창작 : 증강과 격차

민세희 서강대학교 아트&테크놀로지 산학교수

⑥ 인간과 AI의 공생: 다원예술공연 緣의 link와 KARMA

김경미 NMARA 대표 겸 미디어아트 디렉터

⑦ 데이터 편견, 데이터아트로 승화하다

김영희 홍익대학교 디자인컨버전스 학부 부교수

⑧ 확장된 예술주체로서의 기술적 오브제 : AI 앙상블

이준 대구가톨릭대학교 디지털디자인과 부교수

⑨ AI 로봇과 인공 공감을 하다

노진아 경희대학교 미술대학 조교수

⑩ 인공생태계 Infranet, ML이 주도하는 세계 바깥을 비추다

지하루 OCADU 교수 겸 A.N. 미디어 아티스트

키워드 관련기사
  • 과기정통부, '디지털 경제ㆍ사회 미래전략 포럼' 구성
  • 주목할만한 AI행사(12.14)
  • AI가 미디어 아트로 그린 치유와 공감은?