인공지능은 이미 우리의 삶 속에 깊숙이 들어왔다. 인공지능 비서, 인공지능 물컵, 인공지능 마사지건, 인공지능 시계…. 이제는 어디에나 `인공지능`이 접두사처럼 붙어있는 제품을 볼 수 있다. 하지만 아직 웹서핑하듯, 페이스북에 글을 쓰듯 인공지능을 활용하고 나만의 모델을 만들 수는 없다. 2021에는 '모두를 위한 인공지능'이 개발될 수 있을까? 

2021년 유망한 인공지능(AI) 기술 3가지를 애널리틱스 인사이트(Analytics Insights)가 보도했다. 2일 애널리틱스 인사이트에 따르면 내년에는 인공지능이 사람보다 빠르고 더 많이 새로운 콘텐츠를 생성할 수 있게 되고 효율적인 모델 생성과 가벼운 모델 형태로 인해 활용성이 증가할 것이라고 소개했다.

생성적 AI (Generative AI)

3D나 2D 이미지를 자동으로 생성하는 알고리즘은 점점 익숙해지고 있다. 이 알고리즘을 이용한 딥페이크(Deepfake)란 모델은 가짜뉴스 생성과 초상권 문제로 화제가 된 바 있다. 이런 모델은 생성적AI (Generative AI)라고 일컫는다. 생성적AI는 사전에 훈련된 전이학습을 통해 텍스트, 오디오, 이미지 등 새로운 콘텐츠를 생성할 수 있다.

딥페이크와 같은 부정적인 활용방식 때문에 회의적 시선도 있지만 생성적 AI는 자동 프로그래밍, 오리지널 콘텐츠 개발, 시각 예술 등 분야에서 창의적 활동 범위를 넓힐 수 있다. 예를 들어 “말라리아는 없어져야 한다”는 한 온라인 캠페인은 생성적 AI를 통해 한 영상을 기반으로 모두 9개의 다른 영상을 만들었다. 말라리아에 대한 경각심을 주는 영상은 베컴(축구선수)가 9개 언어로 말을 하는 것처럼 AI를 통해 생성되었다. 적은 자원으로 효율적인 콘텐츠 제작이 가능해진다.

사진 = DeOldify.ai

디올디파이(DeOldify) 툴은 생정적 AI로 흑백 영화나 사진에 생기를 불어넣는 색을 입힐 수 있다. 디올디파이는 바다, 하늘 등 텍스쳐 위주 클래스만 성공적으로 생성하는 기존 GAN의 단점을 보완한 Self-attention GAN을 이용해 흑백사진에 알맞은 색깔을 입혔다. (Google Colab에서 사용해볼 수 있다) 흑백사진으로부터 ‘색이 있는 과거 사진’이라는 새로운 콘텐츠를 생산한다.

생성적 AI는 헬스케어 분야에서도 촉망받는 기술이다. 생성적 AI는 3D 프린팅, CRISPR 및 기타 기술로 환자에게 고유한 의족, 유기 분자 등을 미리 렌더링할 수 있다. 시뮬레이션을 통해 개인화된 의료 서비스를 제공할 수 있다. 또, 잠재적 악성 종양 발견이나 증상 예측을 식별할 수 있다. 패턴을 생성하고 해석해 의료진에게 가설을 제공하고 필요한 치료 결정에 도움을 줄 수도 있다. 최근 IBM은 생성적 AI 기술을 항균 펩타이드(AMP) 연구에 사용해 코로나 19 치료제를 찾고 있다.

연합학습 (Federated Learning)

구글의 논문 “Communication-Efficient Learning of Deep Networks from Decentralized Data”에 따르면 연합학습은 중앙 저장이 필요 없다. 사용자는 중앙저장기기 없이 대량의 데이터로 학습된 공유 모델을 함께 공유한다. 연합학습은 모델에 데이터를 주입하는 것이 아니라 데이터에 모델을 적용하는 방식이다.

연합학습은 몇 개의 계산 가능한 기기들을 연결해 데이터 취합에 사용한다. 이 방식으로 기기들은 한 번에 예측모델을 공유할 수 있게 된다. 기기가 모은 데이터는 고유하게 남아있어 데이터 프라이버시 문제를 해결하고 중앙 처리기기에 데이터가 모여 모델 생성에 어려움이 생기는 것을 방지한다.

사진 = 애플
사진 = 애플

연합학습이 쓰인 대표적인 예로는 애플의 인공지능 비서 시리(Siri)가 있다. 구글은 안드로이드 폰 키보드의 단어 추천 성능을 높이기 위해 연합학습을 사용했다. 이 방식으로 사용자들의 데이터를 중앙처리기기로 업로드하지 않고 모델을 만들 수 있었다. 구글 AI 블로그에 따르면 사용자들은 사용자들이 추천된 단어를 사용하는 빈도의 데이터를 기반으로 모델을 만들었다.

의료기관에서도 연합학습 유용하게 쓰일 수 있다. 개인정보나 의료정보같이 민감한 데이터를 다루는 데 연합학습을 사용할 수 있다.

인공신경망 압축 (Neural Network Compression)

딥러닝의 등장으로 빅데이터 분석 분야에서 빠른 발전이 이루어졌다. 하지만 인공신경망의 단점으로 많은 데이터와 고도화된 계산 방식으로 인한 거대 용량 문제를 지적한다. 이 때문에 높은 사양의 하드웨어를 보유하지 않으면 모델 생성이나 연구에 한계가 있다. 현재 마이크로소프트 애져, 아마존 웹 서비스 등 클라우드를 활용한 방안으로 모델을 생성하고 머신러닝 프로젝트를 진행한다.

2021년에는 인공신경망 경량화가 본격적으로 진행될 예정이다. 파라미터 가지치기, 데이터 공유, 양자화(quantization), 압축 합성곱 필터, 추천시스템 경량화에 쓰이는 낮은 랭크인수분해기법(low-rank factorization), 언어 모델 경량화에 쓰이는 지식 증류 기법(Knowledge Distillation) 등이 추가 연구될 것으로 분석된다.

사진 =  엔비디아
사진 =  엔비디아

최근 엔비디아는 인공지능을 이용한 비디오 압축 기술을 선보였다. 과거 코덱을 이용해 압축하던 과정을 인공신경망이 맡으면서 압축 성능이 향상됐다. 또, 엔비디아 멕신(Maxine)은 클라우드 인공지능 비디오 압축을 통해 실시간 화상회의 비디오의 질을 높였다.

제로 샷 러닝, 퓨삿러닝, 코드 가지치기, 온-디바이스 머신러닝, 원칩 등 인공지능을 쉽고 보편화한 기술로 만들려는 노력이 계속되고 있다. 17일 애플은 GPU, CPU, 램,  인공신경망이 하나의 칩에 탑재된 맥북을 발표하며 머신러닝 성능을 강조했다. 개인 PC와 랩탑에도 머신러닝 성능이 중요시되고 있다. 2021년은 모두를 위한 인공지능을 개발하는 한 해가 될 것으로 전망된다.

AI타임스 장준하 기자 juny6287@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지