(사진=셔터스톡)
(사진=셔터스톡)

오픈AI가 'GPT-4 터보'보다 멀티모달 기능을 강화한 새 모델을 개발했다는 증언이 나왔다. 애플의 음성 비서 '시리'를 강화하고, 향후 출시할 '챗GPT 전용 장치' 등에 탑재할 모델이라는 설명이다.

디 인포메이션은 10일(현지시간) 새 모델을 목격한 2명을 인용, 오픈AI가 최근 일부 고객에게 새로운 LMM을 시연했다고 보도했다. 빠르면 13일 열리는 봄철 업데이트 발표에 포함될 수 있다고 전했다.

오픈AI는 이미 챗GPT에 음성으로 대화하고 이미지를 읽어내는 기능을 탑재하고 있다. 하지만 이번 모델은 이런 기능을 효과적으로 통합, 이미지와 오디오를 더 잘 이해할 수 있고 실행 속도도 빨라진 것으로 알려졌다. 일부 기능에서는 GPT-4 터보보다 우수한 성능을 보였다고도 전했다.

예를 들어 고객 서비스의 AI 상담원이 발신자 목소리의 억양이나 감정을 더 잘 이해하는 것은 물론, 학생들이 수학 문제를 풀거나 간판에 적힌 글이나 메뉴판 등을 번역하는 데 더 도움이 될 수 있다.

이 모델을 개발한 것은 사업적인 선택이라는 분석이다. 

우선 지난 1월 시작된 애플과의 계약이 별 진전을 못 보이다가 4월 말부터 급물살을 타게 된 것은 이 모델이 완성됐기 때문이라는 분석이다. 시리의 성능을 향상하기 위해 음성으로 대화하고 카메라를 통해 파악한 이미지를 읽어내는 기능이 필요하다. 

또 샘 알트먼 CEO는 조니 아이브 등과 새로운 챗GPT 전용 장치 스타트업 설립을 추진 중으로, 여기에도 LMM은 필수다.

다만 아직 온디바이스 AI로 실행할 만큼 모델 크기가 작지는 않은 것으로 알려졌다. 대신 GPT-4 터보보다 더 저렴하게 실행하는 것을 목표로 하고 있다.

이 모델 개발 때문에 다른 일정은 뒤로 밀린 것으로도 알려졌다. 대표적으로 지난 1월 발표 이후 아직 별 진전이 없는 'GPT 스토어'가 여기에 포함된다.
 
더불어 더 버지는 11일 이룹 개발자가 (트위터)를 통해 오픈AI가 챗GPT에 전화 통화와 관련된 새로운 기능 통합을 준비 중인 것으로 보인다고 보도했다.

아나내이 아로라라는 개발자는 챗GPT에 포함된 통화 관련 코드 스크린샷을 게시하고, 여기에는 오디오 및 비디오 통신용 서버 연결이 포함됐다고 밝혔다. 정확하게 어떤 기능인지는 알려지지 않았으나, 이 또한 13일 업데이트 내용에 포함될 수 있을 것으로 내다봤다.

이는 구글이 테스트 중인 'AI 통화' 기능과 흡사한 것으로 보인다. 통신사나 금융업체, 서비스 회사 등 실제 상담원과의 통화 중 '실시간 연결 대기'가 필수인 회사에 AI가 먼저 전화를 걸고, 연결시 사람에게 통화를 넘겨주는 기능이다.

이 밖에 오픈AI는 기업 사용자가 챗GPT 사용에 필요한 예약 토큰을 선불로 낼 경우, 최대 50%를 할인하는 새로운 요금 정책도 출시할 것으로 보인다고 관계자들은 전했다.

이런 할인 정책을 통해 오픈AI는 기업 고객을 확대하겠다는 전략이다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지