돌고래 의사소통을 해독하는 데 도움이 되는 인공지능(AI) 모델이 등장했다.

구글은 14일(현지시간) 국제 돌고래의 날을 맞아 조지아공과대학교 연구진 및 야생 돌고래 연구 단체인 WDP(Wild Dolphin Project)와 협력해 AI 모델 ‘돌핀젬마(DolphinGemma)’를 공개했다. 이 모델은 돌고래의 발성을 학습, 비슷한 소리를 생성할 수 있다.

돌고래는 지구상에서 가장 똑똑한 동물 중 하나로 여겨진다. 각종 연구에 따르면, 돌고래는 협동할 수 있고 서로에게 새로운 기술을 가르치며 거울 속에 비친 자신의 모습을 인식할 줄도 안다.

따라서 과학자들은 수십년 동안 돌고래들이 서로 주고받는 클릭 소리, 휘파람 소리, 그리고 짧고 강한 펄스 음 등의 의미를 이해하려고 노력해 왔다. WDP는 1985년부터 야생 대서양 점박이돌고래를 대상으로 세계에서 가장 오랫동안 연구를 진행해 온 단체다.

수십년간 이어진 연구를 통해 돌고래의 소리와 행동에 대한 방대한 양의 데이터를 축적, 세계에서 가장 큰 돌고래 커뮤니케이션 데이터셋 중 하나를 만들어냈다.

WDP는 돌고래의 사회적 상호작용을 포함한 행동을 관찰하고 분석하는 것이 목표다. 연구진은 수중에서 직접 돌고래들과 작업, 돌고래가 내는 소리와 특정 행동 간의 연관성을 실시간으로 파악할 수 있게 됐다. 클릭과 휘파람 같은 소리가 이름이나 움직임, 경고 등을 의미한다는 것을 이해하게 됐다고 밝혔다.

이런 활동을 원활하게 지원하기 위해 구글은 ‘돌핀젬마’라는 AI 모델을 개발했다. 이는 음향 기술을 이용해 돌고래 소리를 토큰화(tokenize)하는 4억개 매개변수를 가진 경량 모델이다.

특히 모바일 기기에서도 구동될 수 있도록 설계됐다. 덕분에 WDP 현장 연구원들은 이 AI 모델이 탑재된 방수 픽셀 스마트폰을 착용한 채 수중에서도 실시간 분석을 진행할 수 있게 됐다.

연구진은 “돌핀젬마는 WDP가 수십년간 축적해 온 야생 대서양 점박이돌고래의 음향 데이터베이스로 광범위하게 훈련된 모델로, 입력된 돌고래의 자연 음향 시퀀스를 분석해 그 안의 패턴과 구조를 식별하고 이어질 가능성이 높은 다음 소리를 예측하는 오디오 입력-출력 모델”이라고 밝혔다. 이는 인간 언어의 문맥 속에서 다음 단어나 토큰을 예측하는 대형언어모델(LLM)과 같은 원리다.

WDP는 이번에 개발된 AI 모델을 CHAT(Cetacean Hearing Augmentation Telemetry) 시스템과 결합, 연구를 확장할 계획이다. CHAT은 인간과 돌고래 사이의 공통 언어를 구축하기 위해 설계된 수중 컴퓨터로, 인공적인 클릭과 휘파람, 펄스음 등을 생성해 인간과 돌고래 간의 소통을 돕는다. 이 음향은 자연 돌고래 소리와는 구별되며, 특정 물체나 활동에 대한 의사소통을 유도한다.

연구진은 돌고래가 관심을 가질만한 장난감, 스카프, 사르가숨 해조류 같은 물체와 함께 CHAT의 인공 음을 사용해 소리를 학습한다. 돌고래가 인공 음을 특정 물체와 연관 지어 학습하면, 나중에는 그 소리를 사용해 물체를 요청할 수 있게 된다. CHAT은 돌고래가 낸 인공 음을 분석해 어떤 물체를 요청했는지도 식별할 수 있다.

흥미로운 점은 CHAT이 구글 픽셀 6를 기반으로 설계됐다는 것이다. 이는 맞춤형 하드웨어에 대한 의존도를 줄이고, 소형화된 상용 기기의 장점을 살려 수중에서도 휴대가 간편하며 유지·교체가 쉬운 장점이 있다. 또 구글은 향후 출시될 픽셀 9에 더욱 강력한 온디바이스 AI 처리 기능을 탑재할 계획이다.

구글은 “돌핀젬마와 같은 도구를 제공, 전 세계 연구자들이 자신들의 음향 데이터를 탐색하고 발성 패턴을 더 빠르게 찾아낼 수 있도록 지원해 돌고래에 대한 이해가 깊어지길 기대한다”라고 밝혔다.

구글은 몇달 내 돌핀젬마를 오픈 소스로 공개할 계획이다. 

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지