(사진=셔터스톡)
(사진=셔터스톡)

생성 인공지능(AI) 전쟁에서 구글이 검색엔진 시장의 우위를 사수하기 위해 반격에 나섰습니다. 

차세대 대규모 언어 모델 ‘팜 2(PaLM 2)’를 기반으로 한 AI 챗봇 ‘바드(Bard)’를 전격 공개했습니다. 25년만에 구글의 검색을 리모델링해 오픈AI, 마이크로소프트(MS) 등 연합군에 밀리지 않겠다는 의지를 분명히 한 셈입니다.

MS도 'GPT-4'를 탑재한 검색 '빙(Bing)'을 대기없이 완전 오픈하면서 맞불을 놨습니다. 출시 3개월 만에 AI 검색엔진 빙을 전면 개방한 것입니다.

빙의 일일 활성 사용자는 1억명을 넘어섰고, 빙 모바일 앱의 일일 설치 수는 출시 이후 4배 증가했습니다. 또 엣지 브라우저 점유율이 8분기 연속 성장했으며, 매월 5억명 이상이 사용 중인 윈도우 작업표시줄을 통해 빙의 접근성을 지속적으로 높이고 있다고 합니다. 

구글이 AI 챗봇 기능을 더한 새로운 검색엔진을 선보이면서, 오픈AI를 등에 업고 검색시장에서 왕좌를 되찾으려는 MS의 발빠른 행보에 맞서 본격적인 반격에 나서는 모양새입니다. 

구글의 검색 서비스를 위한 팜2 기반의 AI 챗봇 '바드'와 MS 검색엔진 빙에 탑재된 '챗GPT'를 비교해 보았습니다.  

바드와 챗GPT 비교표
바드와 챗GPT 비교표

◆ 언어 모델

구글은 '팜2'가 게코(Gecko), 오터(Otter), 비손(Bison) 및 유니콘(Unicorn)의 네 가지 하위 모델로 출시될 것이라고 발표했는데요. 게코는 매우 가벼워 모바일 장치에서 작동할 수 있으며 오프라인 상태에서도 장치에서 대화형 응용 프로그램을 실행할 수 있다고 합니다. 

정확한 크기는 알 수 없지만 5400억개의 매개변수를 가진 ‘팜(PaLM)’ 모델보다 훨씬 더 작은 팜2의 매개변수는 1000억개에서 3000억개 사이에 있을 것으로 추정합니다. 

이 숫자가 1000억에 가깝거나 그 이하이면 팜 2는 매개변수 측면에서 1750억개의 GPT-3.5보다 작을 가능성이 큽니다.

GPT-4도 전확한 매개변수 수는 공개하지 않았는데요. GPT-4에는 1억2500만개에서 1조개의 매개변수에 이르는 다양한 크기의 12개 하위 모델이 있습니다. 

두 모델 모두 병렬 처리 및 장거리 종속성을 가능하게 하는 신경망 설계인 ‘트랜스포머(Transformer)’ 아키텍처를 사용합니다.

◆ 데이터 세트

팜2는 100개가 넘는 언어와 수학, 과학, 프로그래밍, 문학 등과 같은 다양한 영역에서 교육했습니다. 스팸, 증오심 표현 또는 잘못된 정보와 같이 품질이 낮거나 유해한 텍스트를 필터링하는 선별된 데이터 세트를 사용합니다.

팜 2는 또한 경로 학습이라는 기술을 사용하여 여러 정보 소스에서 학습하고 일관된 방식으로 결합할 수 있습니다.

GPT-4는 인터넷에서 사용할 수 있는 거의 모든 도메인과 26개 언어를 포함해 다양한 데이터를 학습했습니다.

위키피디아, 레딧, 책, 뉴스 기사, 웹 페이지 등과 같은 다양한 소스에서 스크랩한 825테라바이트의 텍스트로 구성된 ‘파일(Pile)’이라는 데이터 세트를 사용합니다. 데이터에 필터링이나 큐레이션을 사용하지 않습니다. 즉, 마주치는 모든 텍스트에서 학습할 수 있지만 잠재적으로 편향이나 오류를 물려받을 수도 있습니다.

구글과 오픈AI는 훈련 데이터 세트의 크기에 대해 자세히 공개하지 않았지만 팜 2의 데이터 세트는 1조5600억개의 단어를 포함하는 반면 GPT-4의 데이터 세트는 1조3700억 개의 단어를 포함합니다. 이것은 팜 2가 GPT-4보다 광범위한 지식 기반을 제공하여 보다 정확하고 풍부한 텍스트를 생성할 수 있도록 합니다.

◆ 사용료

오픈AI의 GPT-4를 기반으로 하는 ‘챗GPT’ 챗봇 서비스는 월 20달러의 챗GPT 플러스 유료 가입자만 이용할 수 있습니다. 마이크로소프트의 검색엔진 ‘빙(Bing)’의 챗봇인 ‘빙 챗’을 이용하면 GPT-4를 누구나 무료로 액세스 할 수 있지만 매일 제한된 수의 질문만 받습니다.

반면에 구글의 언어 모델인 팜 2를 기반으로 하는 ‘바드’ 챗봇 서비스는 180개국에서 무료로 사용할 수 있습니다.  

◆ 인터넷 정보

길시간 인터넷 액세스 (사진=구글)
길시간 인터넷 액세스 (사진=구글)

챗GPT와 바드의 주요 차이점 중 하나는 인터넷 액세스입니다. 바드는 실시간으로 인터넷에서 응답을 가져올 수 있는 반면 챗GPT4는 2021년 말까지의 데이터 세트에 의존합니다.

이 제한은 챗GPT가 최신 정보를 제공하는 데 어려움을 겪을 수 있는 반면 바드는 질문에 대한 가장 최근의 답변 및 최신 연구 결과를 제공할 수 있습니다.

챗GPT의 경우 인터넷을 사용하려면 웹 브라우징 기능에 대한 액세스 권한이 필요할 수 있습니다.

◆ 접근성

바드는 구글 검색 및 기타 웹 서비스와 쉽게 통합할 수 있는 반면 챗GPT는오픈AI 플랫폼으로 제한됩니다. 챗GPT는 모바일 앱 버전을 제공하지 않아 접근성에 제약이 있습니다.

그러나 바드는 많은 구글 앱 및 서비스에 통합하여 스마트폰 사용자가 액세스할 수 있도록 합니다.

◆ 응답

챗GPT는 매우 포괄적인 텍스트 응답을 생성하는 데 효율적이지만 응답으로 이미지를 표시하는 데는 부족합니다.

이는 오픈AI에 이미지를 생성할 수 있는 ‘달리(Dal-E)’와 같은 다른 모델이 있기 때문일 수도 있습니다.

그러나 바드는 텍스트 응답에 이미지를 제공할 수 있습니다. 

◆ 이미지 프롬프트

이미지 프롬프트 (사진=구글)
이미지 프롬프트 (사진=구글)

바드 사용자는 이미지를 프롬프트로 사용하거나 ‘구글 렌즈(Google Lens)’를 통해 이미지를 스캔하여 프롬프트로 사용할 수 있습니다. 예를 들어, 공예 재료에 갇혀 어떻게 사용하는지 모르는 사용자는 사진을 클릭하고 Bard에게 무엇을 해야 하는지 물어볼 수 있습니다. 

GPT-4도 역시 텍스트와 함께 이미지를 입력 프롬프트로 사용할 수 있습니다. 냉장고 안을 찍은 사진과 함께 '이 사진에서 보이는 재료들로 할 수 있는 요리를 알려줘'라고 명령하면 몇 가지 요리를 추천합니다.

◆ 음성 프롬프트

챗GPT는 음성 프롬프트를 사용할 수 없습니다. 반면 바드는 사용자의 음성을 입력으로 받아들일 수 있습니다. 프롬프트를 제공하기 위해 음성을 사용하면 멀티태스킹 중에 응답을 받을 수 있는 편리한 방법이 될 수 있습니다.

바드는 텍스트, 이미지 및 음성 모두를 입력 프롬프트로 사용할 수 있습니다.

◆ 텍스트 내보내기

바드는 대화 내용을 공유하는 내보내기 옵션이 있습니다. 사용자가 공유를 선택하면  바드의 결과 텍스트를 PDF, 워드 등의 포맷으로 변경해 지메일로 내보내기할 수 있습니다. 이러한 내보내기 기능을 사용하면 이메일 작성이 번거롭지 않을 것입니다.

챗GPT에는 유사한 기능을 위한 다양한 확장 기능이 함께 제공되지만 바드에는 내보내기가 기본 기능으로 제공됩니다.

◆ 검색 옵션

바드는 사용자가 바드가 제안한 정보의 유효성을 검증하기 위한 검색 옵션을 제공합니다. 바드의 모든 응답에는 구글 검색의 작은 아이콘 ‘구글 잇(Google it)’이 있습니다. 클릭하면 관련 검색어가 들어 있는 검색 박스가 열리고 일반적인 검색 방식으로 검색 결과를 표시하는 다른 페이지로 이동합니다.

◆ 다중 응답 지원

다중 응답 지원 (사진=구글)
다중 응답 지원 (사진=구글)

바드는 응답 초안을 여러 개 제공하고 사용자가 가장 적합한 응답을 선택할 수 있는 반면챗GPT는 한 번에 하나의 답변만 제공할 수 있습니다. 

또한 바드는 프롬프트에 응답할 때마다 새로운 콘텐츠를 생성합니다. 동일한 질문을 다양한 방법으로 해결할 수 있습니다. 

대부분의 경우 챗GPT의 많은 사용자가 동일한 질문을 하면 모두 동일한 응답을 받습니다. 문구는 약간 다를 수 있지만 기본적으로는 동일합니다.

◆ 플러그인 제공

구글은 바드가 월마트, 스포티파이, 우버 잇츠, 어도비 파이어플라이 및 기타 여러 구글 앱와 같은 다양한 플러그인을 제공할 것이라고 발표했습니다. 

오픈AI는 지난 3월 챗GPT용 플러그인을 도입한 후 현재 70개 이상의 앱에 대한 플러그인을 제공합니다. 

챗GPT의 플러그인은 월 20달러의 프리미엄 서비스인 챗GPT 플러스에 가입한 사람들만 액세스할 수 있지만 바드의 플러그인은 모든 사용자에게 무료로 제공됩니다.

박찬 기자 cpark@aitimes.com

키워드 관련기사
  • 구글, 챗봇 '바드' 전면 공개...한국어 본격 지원
  • MS, '빙' 검색 전면 오픈...대기 없이 바로 사용 가능
  • 오픈AI, GPT-4 공개...MS '빙' 검색에 도입