AI 사업전략 강화

(사진=카카오브레인)
(사진=카카오브레인)

카카오브레인(대표 김병학, 김일두)은 대형멀티모달모델(LMM) 오픈 소스 ‘허니비(Honeybee)’를 깃허브에 공개했다고 19일 밝혔다. 

허니비는 이미지와 대형언어모델(LLM)을 연결하는 오픈 소스 LMM이다. 현재 LMM은 공개 사례가 적고 학습 방법 역시 자세히 공개되지 않아, 개발이 어려운 상황이다. 모델 개발에 기여하기 위해 개발 소스 코드를 공개했다는 설명이다.

LMM은 이미지와 텍스트 프롬프트를 인식해 텍스트로 답변하는 형식이다. 텍스트 입출력 방식인 LLM에서 더 발전한 형태다.

이미지에 담긴 장면을 묘사해 입력하거나 이미지, 텍스트 혼합 자료를 입력해도 이해가 가능하다. ‘농구 경기 중인 두 선수’ 이미지와 함께 ‘왼쪽 선수는 몇번 우승했나요’라는 질문을 영어로 입력하면, 이미지 내용과 질문을 종합적으로 이해하고 답변을 생성할 수 있다.

실제 ‘MME’ ‘MMBench’ ‘SEED-Bench’ 등 벤치마크에서 모델을 공개한 타사 LMM 대비 최고 성능을 달성했다. 특히 지각 능력과 인지 능력을 평가하는 ‘MME’ 벤치마크에서는 2800점 만점 중 1977점을 받았다.

또 관련 논문 '허니비: 멀티모달 LLM을 위한 로컬리티 강화 프로젝터'는 지난해 논문 공개 사이트 아카이브에도 게재됐다. '이미지 데이터를 처리해 딥러닝 모델이 더 효과적으로 학습하고 이해할 수 있도록 돕는 기술'이라고 설명한 바 있다.

향후에는 교육 및 학습 보조 도구로도 사용할 전망이다.

김일두 카카오브레인 대표는 “허니비 모델 중 추론을 가능하게 하는 코드도 깃허브에 공개했다"라며  "이를 활용한 각종 서비스 확장을 고려 중이며 더 고도화된 AI 모델 확보를 위해 끊임없이 연구, 개발할 것”이라고 말했다.

한편 카카오는 공식 홈페이지를 통해 '2024년 카카오 AI 관련 전망'을 세부적으로 공개했다.

먼저 '서비스-드리븐 인공지능(AI)' 전략을 밝혔다. 카카오 서비스 내에 순차적으로 AI를 접목하겠다는 전략이다. 실제 카카오톡 내부에는 'AI 요약하기' 기능 등 이미 관련 서비스를 공개 중에 있다. 10개 콘텐츠를 주제로 챗봇 PoC(기술실증)도 진행하고 있다.

카카오브레인은 자체 모델을 기반으로 영역을 확장해 나갈 예정이다. 이미지 생성 모델인 칼로는 텍스트를 기반으로 고품질의 이미지를 생성, 사용자 얼굴 기반의 이미지 생성과 AI 이미지 편집, 언어 모델 기반 프롬프트 자동 생성 등 다양한 응용 기술을 포함하고 있다.

헬스케어 분야에서는 ‘치료’와 ‘진단’ 영역에서의 혁신을 목표로 한다. 의료영상을 기반으로 모든 소견, 질환, 의료장비 등 판독문 초안을 작성하는 거대 AI 판독문 생성 모델을 통해 '영상 판독 프로세스'를 혁신하겠다고 밝혔다.

아울러 카카오헬스케어는 빅데이터, 사물인터넷, AI 및 모바일 기술을 활용한 디지털 헬스케어 서비스를 제공할 계획이다. 2월에는 연속혈당측정기(CGM)와 스마트폰을 활용한 혈당 관리 서비스 '파스타'를 출시한다. 국내 출시 후 글로벌 기업과 협력해 미국, 일본, 중동 등으로 진출을 계획 중이다.

카카오엔터테인먼트도 AI 기반 CRM 기능인 ‘헬릭스 푸시’를 도입해 개별 유저들의 열람과 구매를 포함한 다양한 이용 행태 데이터를 분석, 맞춤형 작품을 추천해 주며 이용자의 플랫폼 잔존율을 높였다는 설명이다.

이처럼 카카오는 허니비 오픈소스 공개 및 AI 사업 전략으로 "사람과 사람의 연결을 넘어, 사람과 AI를 연결하고자 한다"라고 전했다.

장세민 기자 semim99@aitimes.com

키워드 관련기사
  • 카카오, CA협의체 개편…김범수-정신아 공동의장 체제
  • 카카오브레인, AI 프로필 그려주는 카카오톡 채널 ‘칼로 AI 프로필’ 오픈
  • 카카오, '정부박람회'에 공동체 혁신 기술 총집합