오픈AI 'GPT-3.5'의 새 AI 챗봇기능 둘러싼 논란 가열 조짐…
기능은 매우 우수하나 진위 분간 어려운 위험도 있어

오픈AI의 AI 쳇봇 '챗GPT'
오픈AI의 AI 쳇봇 '챗GPT'

오픈AI가 지난달 말 공개한 'GPT-3.5'의 새로운 인공지능(AI) 챗봇 기능인 ‘챗GPT(ChatGPT)’ 서비스가 일주일만에 100만명 이상의 이용자를 끌어모아 화제가 되고 있다. 100만 이용자 확보는 'GPT3'와 '달리'가 24개월 가까이 걸려 이룬 성과다.

챗GPT는 질문을 하거나 명령어를 입력하면 사려 깊고 설득력있는 응답을 제공해 학계는 물론 엔지니어들 사이에서 큰 인기를 끌고 있다. 

그러나 사실과 다른 내용까지도 그럴듯하게 포장해 거짓을 사실처럼 믿게 만드는 부작용이 있다는 지적도 적지않아 실효성을 둘러싼 논란이 거세질 전망이다.  

오픈AI가 이번에 내놓은 챗봇 기능은 인간같은 답변을 내놓을뿐만 아니라 전후 맥락을 정확히 파악하는 상황 인식을 해내는 특성 덕분에 폭발적인 관심을 불러왔다. 특히 사용하기 쉬운 무료 웹 인터페이스로 대중에게 인기를 끌고 있다. 

챗GPT는 오픈AI의 대형 언어모델인 GPT-3의 뒤를 잇는 GPT-3.5를 기반으로 하는 대화형 텍스트 생성 모델이다. 아직은 프로토타입이지만 사람처럼 상세한 텍스트를 생성할 수 있다. 인터넷에서 가져온 방대한 양의 텍스트 샘플로 훈련하고, 대화형 인터페이스를 통해 정보를 제공한다.

대화 형식으로 후속 질문에 답하거나 실수를 인정한다. 또 잘못된 전제에 이의를 제기하거나 부적절한 요청을 거부하는 등 훨씬 똑똑해졌다는 평가가 이어진다. 대부분의 AI 챗봇은 모든 새로운 요청을 백지 상태로 취급하고 이전 대화를 기억하거나 학습하도록 프로그래밍되지 않았지만 챗GPT는 사용자가 이전에 말한 내용을 기억할 수 있다 .

질문 “달 기지 건설은 미국의 우주 탐사에 어떤 의미가 있습니까?”챗GPT3의 응답  “달 기지를 건설하는 것은 미국 우주 탐사에서 중요한 이정표가 될 것입니다. 그것은 우주비행사들이 달 표면에서 장기 임무를 수행할 수 있도록 해 달 환경을 더 깊이 연구하고 귀중한 과학적 데이터를 수집할 수 있게 합니다. 달 기지는 화성과 같은 태양계의 다른 목적지로의 미래 임무를 위한 발판을 제공할 것입니다. 또 장기 우주 여행에 필수적인 생명 유지 시스템 및 우주 추진과 같은 기술을 발전시키는 데 도움이 될 것입니다. 전반적으로 선형 기반을 구축하는 것은 미국 우주 탐사를 위한 주요 단계가 될 것입니다”(사진=팝사이)
질문 “달 기지 건설은 미국의 우주 탐사에 어떤 의미가 있습니까?”챗GPT3의 응답  “달 기지를 건설하는 것은 미국 우주 탐사에서 중요한 이정표가 될 것입니다. 그것은 우주비행사들이 달 표면에서 장기 임무를 수행할 수 있도록 해 달 환경을 더 깊이 연구하고 귀중한 과학적 데이터를 수집할 수 있게 합니다. 달 기지는 화성과 같은 태양계의 다른 목적지로의 미래 임무를 위한 발판을 제공할 것입니다. 또 장기 우주 여행에 필수적인 생명 유지 시스템 및 우주 추진과 같은 기술을 발전시키는 데 도움이 될 것입니다. 전반적으로 선형 기반을 구축하는 것은 미국 우주 탐사를 위한 주요 단계가 될 것입니다”(사진=팝사이)

시를 쓰거나 자세한 예제와 함께 코딩 실수를 수정하고, AI 아트 프롬프트를 생성하기도 한다. 새 코드를 작성하고, 레이아웃 문제 및 최적화 쿼리 해결 등 복잡한 질문에 대한 설명과 답변을 제공하는 것도 가능하다.

시험 문제를 보고 생성한 답이 만점을 받은 것은 물론이고 프로그래머가 제시한 프로그래밍 언어 코딩 문제를 몇 초 만에 해결하기도 했다.

이처럼 다양한 장점에 아론 레비 박스 CEO는 "챗GPT는 앞으로 모든 것이 어떻게 달라질지 희미하게나마 볼 수 있는 기술 가운데 하나"라고 평가했고, 알베르토 로메로 알고리즈믹 브릿지 저자는 "지금까지 본 세계 최고의 챗봇"이라는 찬사를 보냈다.

일론 머스크 테슬라 CEO도 "챗GPT가 무섭게 좋다"며 "위험할 정도로 강력한 AI"라고 트윗했다.

챗GPT의 파이썬 코드 예제를 사용한 버블 정렬 알고리즘의 최악의 경우 시간 복잡도를 설명(사진=트위터)
챗GPT의 파이썬 코드 예제를 사용한 버블 정렬 알고리즘의 최악의 경우 시간 복잡도를 설명(사진=트위터)

그러나, 다른 한편으로는 많은 사용자가 챗GPT의 기능에 깊은 인상을 받은 반면 챗GPT에 숨겨진 문제가 있다는 지적도 나온다.

챗GPT가 정확하지 않은 잘못된 답변인 경우에도 그럴듯하고 사실처럼 들리도록 설득력 있는 응답을 신속하게 내뱉는다는 것이다. 또 존재하지도 않는 책을 인용해 신뢰가 있는 것처럼 꾸민 답변을 내놓는 등 사실이 아닌 내용을 합리적으로 들리게하는 데 매우 능숙한 것으로 드러났다.  

오픈AI가 2020년에 GPT-3를 출시했을 때도 GPT-3가 특정 질문에 대한 잘못된 답변을 자신 있게 주장하거나 때로는 인종 차별적이거나 공격적인 텍스트를 생성해 비판을 받기도 했다.

챗GPT는 존재하지 않는 책 ‘Dynamic Canonicity’를 이용해 그럴듯한 응답을 만들었다.(사진=트위터)
챗GPT는 존재하지 않는 책 ‘Dynamic Canonicity’를 이용해 그럴듯한 응답을 만들었다.(사진=트위터)

더 문제가 되는 것은 사용자가 질문에 대한 답변을 이미 알고 있지 않다면 챗GPT의 답변이 사실인지 아닌지 알기 어렵다는 것이다. 

아르빈드 나라야난 프린스턴대학 교수는 "사람들은 학습에 챗GPT를 사용하는 것에 흥분하고 있지만 답을 미리 알지 못한 상황에서는 틀린 답이 나오더라도 알 수 없는 것이 문제"라며 "몇 가지 기본적인 정보 보안에 대한 질문을 시도해보니 대부분의 경우 대답은 그럴듯하게 들렸지만 사실은 잘못된 것이었다"고 지적했다.

박찬 위원 cpark@aitimes.com

키워드 관련기사
  • 오픈AI, 'GPT-3.5' 모델 공개
  • 구글, AI 챗봇 ‘람다(LaMDA) 2’ 테스트 앱 출시
  • "블렌더봇 형편없다!"...메타 챗봇에 혹평 이어져