xAI가 '그록'에 휴대폰 카메라의 화면을 읽고 답하는 기능을 도입했다. 구글의 '제미나이'나 오픈AI의 '챗GPT'처럼 점차 다양한 기능을 추가, 인공지능(AI) 음성 비서로 업그레이드되고 있다.
xAI는 23일(현지시간) 사물에 대한 질문에 답할 수 있는 ‘그록 비전(Grok Vision)’ 기능을 그록 모바일 앱에 추가했다고 발표했다.
사용자는 휴대폰 카메라로 상품이나 간판, 문서 등을 비추고, 이에 대해 질문을 던져 답을 얻을 수 있다. 제미나이와 챗GPT에도 비슷한 기능이 있다.
현재는 iOS 버전에서만 제공되며, 안드로이드 앱에는 아직 도입되지 않았다.
동시에 xAI는 그록에 다국어 음성 인식 기능과 음성 모드의 실시간 검색 기능도 추가했다.
이 기능들은 안드로이드 사용자도 이용할 수 있지만, xAI의 월 30달러 유료 구독 서비스인 ‘슈퍼그록(SuperGrok)’ 요금제 가입자에게만 제공된다.
xAI는 최근 그록 챗봇에 다양한 기능을 꾸준히 추가하며 경쟁력을 높이고 있다. 이달 초에는 대화 내역을 기억하는 ‘메모리’ 기능을 도입해 사용자 맞춤형 응답이 가능하도록 했고, 문서나 앱을 생성할 수 있는 '캔버스'와 같은 도구도 선보였다.
이번 시각 인식 기능은 AI 음성 비서의 핵심으로 꼽히는 기능이다. 주요 AI 업체 간의 경쟁도 한층 치열해질 전망이다.
박찬 기자 cpark@aitimes.com
관련기사
