초거대 AI로 대표되는 파운데이션 모델, 각종 소규모 AI 개발 효율화
의도했던 기능 이외 다양한 부가 기능 보이는 발생 효과 덕분
두 번의 AI 겨울, 세 번째는 걱정 없어...파운데이션 모델 시대는 달라

김경민 네이버 클로바 리더(사진=이스트소프트·네이버, 편집=박성은 기자)
김경민 네이버 클로바 리더(사진=이스트소프트·네이버, 편집=박성은 기자)

초거대 인공지능(AI)이 AI 상용화 속도를 대폭 높일 것이라는 주장이 나왔다. 연구 단계에 머무는 최첨단 기술을 넘어 우리 실생활 내 AI 활용을 돕는 중요한 열쇠라는 것.

김경민 네이버 클로바 리더는 6일 이스트소프트가 주최한 ‘AI PLUS 2021’ 행사에서 실제 산업 현장에서의 초거대 AI 역할에 대해 발표했다.

그는 초거대 AI로 대표되는 파운데이션 모델을 각종 요리의 기본이 되는 육수에 비유했다.

김 리더는 “찌개 요리에 육수는 필수적이다. 하지만 김치찌개, 된장찌개 등 각 요리를 할 때마다 매번 육수를 만들 필요는 없다. 파운데이션 모델이 곧 육수”라고 강조했다.

초거대 AI 모델은 개발 시 원래 의도했던 기능 이외 부가적인 기능을 창출하는 발생(Emergence) 효과를 보인다. GPT-3가 시 쓰기, 코딩하기, 마케팅 문구 작성하기 등 다양한 활용 예시를 보이는 이유다.

초거대 AI로 나온 부가기능은 전이학습(Transfer Learning) 과정을 거쳐 소규모 모델 개발에 사용 가능하다. 이러한 방식을 활용하면 시장에 필요한 AI 모델을 보다 빠르게 개발할 수 있다는 것.

파운데이션 모델 등장 배경과 활용 방향을 설명 중인 김경민 리더(사진=행사 캡처)
파운데이션 모델 등장 배경과 활용 방향을 설명 중인 김경민 리더(사진=행사 캡처)

파운데이션 모델 등장 전 AI 모델 개발 어려움에 대해 김경민 리더는 “기존에는 AI 모델을 만들기 위해 데이터를 로딩한 후 분석하고, 분석 결과를 바탕으로 임베딩을 만들거나 피처 엔지니어링을 하고, 모델 아웃풋 분포로 사용자 메모리를 업데이트했다. 이후 클러스터링 빈도, 배치 사이즈 설정과 같은 학습 과정 디자인을 했다”고 설명했다.

그러면서 “이 모든 과정은 AI 모델을 만드는 모델러 역할이었는데 할 수 있는 사람을 찾기 어려웠다. 분석에 모델러 주관이 많이 들어가기도 했다. 업무를 진행하다가 아닌 것 같으면 처음부터 다시 해야 해서 시간도 많이 걸렸다”고 말했다.

파운데이션 모델을 활용하지 않는 기존 AI 모델 개발 과정(사진=행사 캡처)
파운데이션 모델을 활용하지 않는 기존 AI 모델 개발 과정(사진=행사 캡처)

초거대 AI와 같은 파운데이션 모델을 활용하면 개발자가 아닌 어플리케이션 사용자가 시장에 맞는 AI 모델을 만들 수 있다.

김 리더는 “파운데이션 모델은 새로운 AI 모델링 파이프라인을 제시한다. 입력 프롬프트 수정만으로도 쉽게 AI 모델 개발이 가능하다”고 전했다.

파운데이션이 곧 육수라는 말은 모든 기업이 초거대 AI 개발에 나설 필요가 없다는 의미이기도 하다.

김경민 리더는 “모두가 육수를 끓일 필요는 없다. 식당에서 파는 것은 김치찌개, 된장찌개지 육수가 아니다. AI에 두 번의 겨울 시기가 왔던 이유는 (파운데이션 모델에는 있는) 발생 효과가 없었기 때문”이라고 전했다.

 

AI타임스 박성은 기자 sage@aitimes.com

[관련기사]'AI 최고위 전략대화' 출범...초거대 AI 활성화에 민관이 크게 손잡는다

[관련기사]네이버 초대규모 AI 하이퍼클로바, 네이버쇼핑에 들어왔다

키워드 관련기사
  • 네이버, 음성인식 AI 엔진에 ‘하이퍼클로바’ 적용...클로바노트 정확도 30% 향상
  • [분석]초거대 AI 연구 가속화할 한국어 자연어이해 평가 데이터셋 ‘KLUE’, 어떻게 나왔나
  • 네이버, 한국어판 GPT-3 ‘하이퍼클로바’ 최초 공개