수중 표본 수집을 위한 현대 해양학 장비에는 보통 정지 사진 및 영상 카메라 등의 광학 이미지 처리 장비가 있다. 이러한 장비들은 항해, 탐험, 모니터링 등의 목적으로 활용되는 가치 있는 정보를 수집한다.

데이터 수집과 관리의 중요성

해양 데이터 수집과 데이터 관리 측면에서 다양한 전략이 개발되었다. 이러한 기법에는 과학 및 산업적 목적을 위한 수중 카메라 장비 설계 및 설치, 해양학 데이터 수집 및 관리, 생태계 전체의 생물 분포 파악을 위한 모든 데이터 축적, 그리고 수동으로 수중 사진에 주석을 달기 위한 참고 자료 등이 있다.

그러나 수중 사진이 축적된 뒤에 진행할 절차는 아직 마련되어 있지 않다. 여기에는 이미지 데이터를 정리하는 일부터 기록된 데이터의 질을 확인하고, 데이터 세트를 작업 구역과 장기 보관소에 지속 가능한 방식으로 저장함으로써 관리하는 작업까지 포함된다. 수동 이미지에 주석을 다는 일이나 이미지 자동 분석 등과 같은 작업도 표준화되어 있지 않다. 이로 인해 종종 동떨어진 하드 디스크에 관리되지 않은 데이터 사본이 저장되어 있곤 하며, 불필요한 데이터가 복사되거나 접근이 어려운 경우가 발생한다. 데이터가 사라지거나 손상될 가능성도 존재한다.

자율주행 수중차량에 따른 표준화 필요성

▲대부분 장비는 바닷속의 모습과 그곳에 사는 생물체들의 사진과 영상을 촬영한다(출처= 셔터스톡)

자율주행 수중차량(AUV)의 활용이 증가함에 따라 표준화의 필요성이 증가하고 있다. 이 장비들은 이전에는 가능하지 않던 빠른 속도로 대량의 이미지 데이터를 수집할 수 있다. AUV는 특정한 데이터 처리 작업 흐름이 필요한 대규모 해저 탐사에 활용되기도 한다. 다수의 AUV를 병렬로 배치하는 경향이 증가함에 따라 효과적으로 대량의 이미지 데이터 세트를 정리하고 관리할 필요성이 더욱 늘어날 예정이다.

 

이미지 데이터 관리의 난이도는 필요한 이미지 해상도와 탐사가 필요한 영역의 넓이에 의해 정해진다. 압축되지 않은 1PX/mm 해상도의 컬러 사진으로 해저 전체를 기록하려면 약 1ZB(제타바이트, 1조1,000억GB)에 달하는 저장 용량이 필요하다. 1ZB는 2017년 한 해 동안 생산된 모든 하드 디스크 저장 용량의 10분의 1 정도에 해당하며, 시간의 흐름에 따른 반복 모니터링은 포함하지 않은 수치다. 보통 1㎢의 해저 표면을 한 차례만 탐사하더라도 약 2분의 1TB(테라바이트, 1,000GB)의 이미지 데이터가 생성된다.

이러한 규모의 문제를 해결할 수 있는 데이터 관리 기법은 기존 연구에서 찾아보기 힘들다. 의료 분야의 빅데이터의 세트 데이터 유래소와 같이 다른 분야에도 이와 관련된 응용 사례가 존재한다. 그러나 이러한 전략과 응용 사례는 해양 데이터를 정리하는데 필요한 특정 문제는 고려하지 않은 방법들이다.

 

GEOMAR의 표준화된 작업 흐름

이러한 문제는 키엘대학의 헬름홀츠 해양연구센터(GEOMAR) 연구원들에 의해 해결되었다. 사이언스 데일리의 보도로는, 연구원들은 방대한 양의 과학적 수중 이미지 데이터를 체계적이고 지속 가능하게 분석할 수 있도록 해주는 표준화된 작업 흐름을 제작하는 데 성공했다.

방대한 양의 데이터를 분석하는 작업은 해양 연구에서 점점 더 빈번하게 진행되고 있다. 잠수 로봇이나 자율주행 수중차량은 심해에서 독립적으로 측정을 수행할 수 있을 뿐 아니라 다량의 고화질 이미지를 기록할 수 있다. 이러한 이미지를 객관적으로 평가하려면 데이터 획득, 정리, 그리고 관리 절차상에서 몇 가지 기준을 만족해야 한다.

GEOMAR의 심해 모니터링 연구팀 소속인 팀 쉐닝 박사는 작업 흐름의 개발이 ABYSS 자율 주행 수중 차량을 활용한 JPIOcean의 채광 영향도 평가 프로젝트 도중에 시작되었다고 밝혔다. 자율주행 수중차량은 새로운 디지털 카메라 체계를 갖추고 있었으며, 태평양의 망간 단괴 분포를 탐사하는 임무를 수행했다. 연구진은 이러한 방식으로 수집한 데이터를 통해 작업 흐름을 설계하고 처음으로 시험해 보았다.

작업 흐름의 구성 요소

해당 작업 흐름은 세 부분으로 나눌 수 있다. 데이터 획득, 정리, 그리고 관리다. 예를 들어, 카메라가 어떻게 설치되어야 하는지, 어떤 데이터를 수집해야 하는지, 어떤 조명을 사용해야 특정 과학적 질문에 대답할 수 있는지 등을 규정하는 일은 매우 중요하다. 더 나아가 잠수 로봇의 메타데이터 역시 수집해 카메라의 이미지 데이터와 연결해야 한다.

예를 들어 자율주행 수중차량은 자동으로 자신의 위치와 잠수 깊이, 그리고 주위 해수의 환경을 기록했다. 쉐닝 박사의 설명에 의하면, 이 정보는 추후 평가에 필요한 중요한 데이터를 제공하기 때문에 해당하는 이미지와 반드시 이어져야 한다. 자율주행 수중차량은 30번의 잠수 동안 50만 장 이상의 해저 사진을 촬영할 수 있기 때문에 작업이 벅차게 느껴질 수도 있다. 데이터를 한데 모아주는 이 작업을 위해서만 몇 종류의 프로그램이 개발되었다. 움직임으로 인한 잔상 등이 포함된 불필요한 이미지는 이 과정에서 삭제되었다.

모든 과정은 표준화된 작업 흐름 내에서 자동으로 이루어지며, 많은 시간이 소요되는 여러 단계를 건너뛸 수 있게 해준다. 쉐닝 박사는 해당 작업 흐름을 수중 차량, 카메라 체계 등 어떠한 프로젝트에도 적용할 수 있다고 설명했다. 또한, 이러한 방식으로 처리된 정보는 일반 대중들에게 영구적으로 공개된다.

▲바다 연구나 데이터는 대부분 매우 방대한 규모이기 때문에 출판된 학술지에서 찾아보기 어려운 경우가 많다(출처=셔터스톡)

CoMoNoD 알고리즘

해당 작업 흐름은 특수 제작된 알고리즘의 형태로 되어 있는 인공지능을 활용한다. ‘CoMoNoD’라고 불리는 이 알고리즘은 사진 속에 망간 단괴가 있는지 여부와 크기 및 위치를 자동으로 기록할 수 있다. 각각의 이미지는 합성을 거쳐 더 큰 해저 지도를 만드는데 사용할 수도 있다. 이 작업 흐름과 새롭게 개발된 프로그램의 다음 시험대는 이미 계획되어 있다. 다음 잠수 탐사에서 망간 단괴 사진에 대한 분석이 차량 내에서 직접 이루어질 예정이다.