(사진=셔터스톡)
(사진=셔터스톡)

인공지능(AI) 기술이 디지털 콘텐츠의 고도화를 시도하고 있다. 홀로그램과 3D 콘텐츠 등으로 콘텐츠 몰입감을 높이고 사용자 경험(UX)을 극대화하겠다는 목표다.

디지털 콘텐츠는 음성, 이미지, 문자 등의 정보를 디지털 형태로 제작한 뒤 정보통신망을 이용해 부가가치를 창출할 수 있는 서비스다. 스트리밍을 통해 음악ㆍ영화를 즐기거나 인터넷 쇼핑을 하는 등 수많은 디지털 콘텐츠가 인류 삶의 한 부분을 차지하고 있다.

기존 디지털 콘텐츠는 비교적 단편적ㆍ제한적 서비스를 제공했다. 하지만 최근 코로나19에 따른 비대면 문화 확산으로 디지털 콘텐츠 수요가 높아지면서 AI 기술을 접목한 ‘차세대 콘텐츠’로 진화하고 있다.

지난 1일 한국전자통신연구원(ETRIㆍ원장 김명준)이 발표한 '차세대 콘텐츠를 위한 AI 기술 활용 동향 및 전망'을 바탕으로 차세대 콘텐츠를 구현하는 데 필요한 AI 기술과 관련 기술의 동향ㆍ전망을 소개한다.

1. 영상기반 동작인식

사용자 동작을 인식하는 기술은 깊이 카메라와 컬러 카메라를 활용해 동작의 의미를 이해하는 기술이다. 인체 관절을 바탕으로 골격 구조를 인식, 움직임을 해석하는 접근 방식이 대표적이다.

최근 깊이 카메라없이 컬러 카메라만을 이용한 딥러닝 동작인식 연구가 활발하다. 비교적 높은 정확도로 상용 가능한 수준의 결과물을 발표하고 있다.

딥러닝 동작인식 기술은 자세 학습을 위한 데이터 확보가 중요하다. 가장 많이 활용하는 공개 데이터셋으로 마이크로소프트(MS)의 'COCO'가 있다.

보고서는 동작인식이 음성인식과 비교해 기술 정확도가 떨어진다고 평가했다. 하지만 인터페이스 측면에서 활용도가 높아 향후 비대면 환경을 구현할 핵심 기술로 자리잡을 것이라고 전망했다.

2. 콘텐츠 분석ㆍ이해ㆍ검색

이미지와 동영상 등 콘텐츠에서 2차 콘텐츠를 생성할 수 있도록 하는 기술이다. 영상이나 사진 속 사람, 동물, 건물 등 의미 있는 정보를 객체ㆍ화소단위로 이해해 분별력 있는 특징을 추출하고 검색에 활용한다.

구글은 '구글 렌즈'를 이용한 증강현실(AR) 내비게이션 기능을 출시했으며, 네이버의 경우 시각 위치추정 기술을 바탕으로 한 실내 AR 내비게이션 제품을 고정밀 지도화하고 있다.

지난 해 ETRI도 '경량 객체 검출 모델'과 '장면 분할 모델'을 개발, 이 기술을 활용해 'DeepMobileAR' 앱을 만들었다. 이 앱으로 모바일 기기를 이용해 객체를 인식하고 AR 인터랙션 기능을 제공한다.

보고서는 현재까지 기술의 실시간성을 보장할 수 없고, 인식 결과를 활용한 단순 증강 콘텐츠가 대부분이라고 짚었다. 또 향후 모바일 환경에서 실시간 서비스를 제공할 수 있도록 관련 연구가 진행될 것으로 예상했다.

이어 저작권 침해 판단 기술에도 활용할 수 있을 것으로 전망했다. 전체적인 콘텐츠 동일성과 부분적 특징 정보를 활용한 저작권 판단 기술을 연구할 경우 부분적 불법 콘텐츠 확산을 방지할 수 있다는 설명이다.

3. 스포츠 AI

AI는 데이터를 바탕으로 학습한다. 이 같은 특성으로 스포츠는 AI 기술을 도입하기 적합하다. 다양한 스포츠 분야 기록이 정량화돼 있기 때문이다.

미국프로풋볼리그(NFL) 선수의 플레이를 분석하는 '넥스트 젠 스탯(Next Gen Stats)'은 경기장에 센서를 배치해 선수의 속도, 방향, 거리 등 정보를 측정했다. 이후 아마존웹서비스(AWS) 머신러닝 기술을 활용해 선수 능력을 확률로 계산했다.

스탯 퍼폼(Stats Perform)은 축구 세트피스 상황과 전술 등을 분석, 팀별 맞춤 전술을 확보하는 데 도움을 준다.

스포츠 AI는 선수 개인 동작을 분석하고, 기량을 향상시킬 수 있도록 돕는다. 선수별 신체적 특징, 습관 등을 분석해 운동 방식과 적합한 포지션 등 다양한 코칭을 제공한다.

선수의 부상 방지를 목적으로 활용할 수도 있다. 실제 NFL에서 게임 중 머리를 부딪힌 선수의 충격량을 측정한 뒤 선수가 안정을 찾기까지 필요한 휴식 시간을 계산했다.

보고서는 향후 스포츠 AI 기술이 관련 분야에서 폭넓게 활용할 것으로 예측했다. 데이터가 쌓일수록 분석 성능을 고도화한 AI 개발이 가능하며 새로운 데이터를 지속적으로 확보할 수 있다는 이유다.

또 스포츠 AI 분석 플랫폼 활용 범위가 사회인ㆍ동호인 스포츠까지 확장할 것으로 전망했다. 고가 장비없이 스마트폰과 웹캠 등으로 대체 가능한 서비스가 등장할 것이라는 설명이다.

4. 콘텐츠 유통 플랫폼

콘텐츠 유통 플랫폼은 생산한 콘텐츠를 소비자에게 제공하는 과정을 돕는다. 이 같은 플랫폼은 사용자의 플랫폼 이용 정보를 분석해 맞춤형 서비스를 제공할 수 있도록 관련 AI 기술을 개발하고 있다.

넷플릭스와 왓챠 등 OTT 서비스가 대표적인 콘텐츠 유통 플랫폼이다. AI 알고리즘을 이용해 사용자의 영상 취미를 확인하고 맞춤형 추천 서비스를 제공한다.

샵 디렉트(Shop Direct)는 사용자, 재고, 판매 관련 데이터를 바탕으로 SAS CI 솔루션을 이용해 개인 맞춤형 추천 서비스를 한다. 또 AI를 이용한 마케팅 기업 애피어(Appier)의 경우 대용량 디지털 프로파일을 적용해 사용자 성향과 항동 방식을 학습했다.

보고서는 콘텐츠 유통에 있어 성별, 연령, 구매이력 등 단편적 데이터로는 사용자 분석에 한계가 있다고 분석했다. 이어 사람의 감성 정보를 포함한 빅데이터가 더 정밀한 의사결정을 가능하게 할 것이라고 설명했다.

또 대규모로 가상 사용자를 생성해 다양한 상황을 시뮬레이션하며 기존보다 더 고도화한 맞춤형 콘텐츠가 등장할 것이라고 전망했다.

5. 3D 콘텐츠 생성

3D 센서와 컴퓨터 비전기술 발전으로 3D 데이터 확보가 가능하다. 연구계는 이 데이터를 활용한 3D 딥러닝 기술 개발을 가속화하고 있다.

AI를 이용한 3D 콘텐츠 생성 연구 핵심은 학습 데이터 포맷이다. 2D 데이터 AI 연구의 경우 학습데이터가 격자구조 모양으로 정의돼 있어 합성곱 네트워크 적용이 가능하다. 하지만 3D 모델은 질감, 연결정보 등 다양한 데이터로 인해 합성곱 네트워크에 적이 어렵다. 이 같은 문제 해결을 목표로 데이터 포맷 연구를 진행하고 있다.

보고서는 3D 학습에 적합한 데이터 구조를 개발할 경우 기존 네트워크를 활용해 3D 콘텐츠를 생성할 수 있을 것으로 예상했다.

6. 디지털 홀로그래피

디스플레이용 홀로그램 콘텐츠 합성을 구현할 대표적 기술로 'DenseDepth' 모델을 이용한 홀로그램 계산 방법이 있다.

DenseDepth 모델은 컬러 영상을 입력으로 하는 인코더-디코더 구조를 갖고 있으며 기존 저해상도 근사 방법을 개선한 솔루션이다. 인코더-디코더 구조는 증강학습 전략과 사전 훈련한 고성능 네트워크를 사용한다.

증강학습 전략은 더 정확하고 상세하게 경계면을 나타낼 수 있도록 고품질 깊이맵 결과를 도출하는 데 도움을 준다.

 

[관련 기사] EU가 뽑은 인공지능(AI)ㆍ로봇 기술 9가지

[관련 기사] [포럼 중계] "다원적 데이터 오너십 정립하고, 데이터 독점 방지하는 법적 틀 마련해야"