다빈치-003, 더 복잡한 명령 처리하는 모델
챗GPT, 부적절한 요구 거부 가능한 대화형 모델

(사진=셔터스톡)
(사진=셔터스톡)

오픈AI가 대형 언어모델인 'GPT-3'의 뒤를 잇는 'GPT-3.5' 시리즈 모델을 선보였다. 자연어처리 모델 ‘다빈치-003’과 대화형 모델인 ‘챗GPT’다.

다빈치-003은 인간의 피드백을 통한 강화학습을 이용해 이용자의 지시에 더 잘 정렬하도록 훈련된 모델이라고 기술매체 벤처비트가 1일 보도했다.

이전 모델인 다빈치-002가 사람의 미세조정된 지시를 통한 지도학습 기법을 사용한 것과는 다르게 강화학습 기법을 적용했다. 기존 모델보다 더 복잡한 명령을 처리할 수 있고 더 길고 고품질인 결과물을 생성한다.

챗(chat)GPT는 대화를 이어가며 후속 질문에 대답하고 실수를 인정하며 잘못된 전제에는 문제제기를 할 수 있다.

특히 부적절한 요구는 거절할 수 있다. 오픈AI는 자사 블로그에서 챗GPT가 안전하고 효율적인 AI시스템을 구축하려는 노력의 결과라면서 유해하고 신뢰할 수 없는 결과물을 걸러낼 수 있다고 밝혔다.

실제 이 모델은 반유대주의 농담을 아느냐고 묻자 “모른다”면서 “공격적이거나 해로운 내용을 생성 또는 반복하지 않도록 프로그램돼 있다”고 답했다고 벤처비트는 전했다.

챗GPT는 또 지각을 갖고 있느냐는 질문에는 "기계학습 모델로서 사람과 같은 방식으로 생각하거나 느낄 수 있는 능력이 없다"고 답했다.

오픈AI는 그러나 블로그에서 챗GPT가 지속적인 개발 과정에 있기 때문에 때때로 해로운 내용을 담은 지시에 응답하거나 편향된 행동을 보일 수 있다면서 주의와 피드백을 당부했다. (챗GPT 해보기)

챗GPT를 시험해 볼 수 있다. 한국영화에 대해 물었더니 즉각 답을 달면서 올드보이, 괴물, 설국열차를 댔다. (사진=ChatGPT 대화 화면)
챗GPT를 시험해 볼 수 있다. 한국영화에 대해 물었더니 즉각 답을 달면서 올드보이, 괴물, 설국열차를 댔다. (사진=ChatGPT 대화 화면)

GPT-3는 지난 2020년 출시된 이후 역대 가장 뛰어난 대형언어모델이라는 평가를 받아왔다. 광고 문구 자동 생성에서부터 단백질 구조 파악까지 다양한 영역에서 광범위한 혁신을 촉발했다. 따라서 AI 업계에선 차세대 GPT에 대한 기대가 높고 관련된 소문도 무성하다.

특히 GPT-3를 내놓을 때 오픈AI측이 매개변수의 크기(1750억개)가 성능 향상에 기여했다는 입장이어서 GPT-4의 매개변수가 1조 개까지 많아질 것이라는 추측도 한 때 나왔다. 그러나 이에 대해 샘 알트만 오픈AI CEO는 “큰 것이 항상 더 나은 것은 아니다”라고 말했다.

GPT-4의 출시에 대해서는 알트만CEO가 올해로 예정돼 있다고 말한 적이 있으나 구체적인 일정이나 내용과 관련된 정보는 내놓지 않고 있다.

정병일 위원 jbi@aitimes.com

키워드 관련기사
  • 탄소배출 지적받은 대형 AI 언어모델..."에너지 효율 높여야"
  • 유발 하라리를 놀라게 한 인공지능 'GPT-3'
  • 오픈AI, GPT-3 API 가격 최대 2/3까지 인하