발표 중인 강인호 네이버 서치 CIC 책임리더(사진=행사 캡처)
발표 중인 강인호 네이버 서치 CIC 책임리더(사진=행사 캡처)

네이버가 GPT-3와 같은 대용량 생성 언어모델을 검색 서비스 전 분야에 적용한다. 모델 가동을 가능하게 하는 슈퍼컴퓨팅 인프라로는 엔비디아 DGX 슈퍼팟(SuperPod)을 사용 중이다.

개인정보 보호를 위한 AI 기술로는 연합학습(Federated Learning)을 활용해 정보를 원천 보호할 수 있는 기계학습(ML) 방법론을 개발 중이다.

글로벌 R&D 네트워크 확보는 미국 실리콘밸리를 중심으로 이뤄질 예정이다. 해당 업무를 담당할 인재로 마이크로소프트(MS)와 스냅(Snap) 출신 김진영 책임리더를 새로 영입했다.

네이버는 국내외 검색·AI 연구자에게 기술 트렌드와 노하우를 소개하는 ‘2021 네이버 검색 콜로키움 Global Re:Search’을 7일 온라인 개최했다.

이날 행사에서는 네이버 서치(Search) CIC 강인호 책임리더가 키노트를 통해 연구개발 성과와 글로벌 연구 네트워크 강화 계획을 발표했다.

먼저 GPT-3와 같은 대용량 생성 언어모델을 네이버 검색 서비스 전체 분야에 적용한다는 계획이다. 강 리더는 “BERT로 대표되는 딥러닝 모델과 대용량 생성 언어모델 GPT-3를 검색 서비스 전 분야에 적용한다”고 밝혔다.

한국어 외 다양한 언어도 대상에 포함해 의미 기반 이해를 실현, 성능을 향상시킨다는 방침이다. 강인호 리더는 “대용량 말뭉치로부터 사전훈련한 언어모델인 버트(Bert), 일렉트라(Electra), GPT3, 콜버트(ColBert) 등으로 문서와 지리 매칭하고 이해하는 기술이 어느 언어에 대해서도 우수하게 동작하는 것을 확인했다”고 강조했다.

현재 네이버가 사용 중인 엔비디아 DGX 슈퍼팟 모습(사진=행사 캡처)
현재 네이버가 사용 중인 엔비디아 DGX 슈퍼팟 모습(사진=행사 캡처)

상용화되어 사용 중인 AI 검색도구도 텍스트 이외 이미지, 음성, 동영상 등 다양한 형태 데이터를 활용하는 멀티모달 방식으로 고도화하는 단계에 있다.

강 리더는 “AI 검색도구의 경우, 지속적인 사용성 개선을 통해 올 1월 대비, 4월 이용량이 24% 이상 증가했다”며 네이버 AI 검색도구 활용성을 강조했다.
 

◆작년 탑티어 AI 학회에 40편 논문 발표...미국 실리콘밸리서 인재 영입

네이버 AI 검색 서비스 기반이 되는 AI 연구도 급속도로 발전 중이다. 작년 글로벌 탑티어 AI 학회에 채택된 네이버 AI 논문 수는 40편이다. 이는 네이버 검색 콜로키움 행사를 시작한 2016년 대비 11배 증가한 수치다.

글로벌 탑티어 AI 학회에 게재한 네이버 논문 수(사진=행사 캡처)
글로벌 탑티어 AI 학회에 게재한 네이버 논문 수(사진=행사 캡처)

올해 성과로는 음향 음성 신호처리 분야의 세계 최대 규모 학회인 ‘ICASSP 2021’에서 14편 논문이 채택된 것을 꼽을 수 있다.

강인호 리더는 “컴퓨터 비전과 딥러닝 분야 학회인 ‘CVPR 2020’에서는 7편, 자연어처리 분야 학회인 ACL과 EMNLP에서는 6개의 논문을 작년 발표했다. 이외 대표적인 AI 학회인 SIGIR, ICML, NeurIPS에서도 성과를 냈다”고 강조했다.

네이버 AI 연구 역량이 급속도로 성장하게 된 배경에는 서치 CIC, 클로바 CIC, 네이버랩스유럽 등 네이버 내 각 연구개발 조직 간 끊임없는 기술 교류가 있다. 특히 2019년 조성한 기술연구 네트워크인 ‘글로벌 AI 연구벨트’를 통해 일본, 프랑스, 베트남 등 해외 연구자들과 협력을 이어오고 있다.

최근 합류한 김진영 책임리더는 미국 실리콘밸리를 중심으로 국내외 우수 개발 인력을 영입해 북미 지역에서의 R&D 네트워크를 강화할 계획이다. 김 책임리더가 이끄는 조직은 국적에 관계없이 지원 가능하며, 한국과 미국 등 근무지를 선택할 수 있다.

채용과 관련된 보다 자세한 문의는 글로벌 채용 사이트를 통해 하면 된다.

한편, 네이버 검색 콜로키움은 2016년 네이버 연구진이 학계와의 연구 협력 현황을 공유하기 위해 마련한 학술 행사다. 지난 3년 간 ‘AI 콜로키움’이라는 행사명으로 진행하다가 올해부터 다시 ‘검색 콜로키움’ 이라는 이름을 사용하게 됐다.

이날 발표 세션에서는 검색 및 AI 기술 분야에서 가장 주목받는 6개 분야 ▲비전AI ▲언어 AI ▲순위 학습(Learning to Rank) ▲사용자 모델링 ▲이커머스 ▲플랫폼별 각 4개, 총 24개 발표가 진행됐다.

AI타임스 박성은 기자 sage@aitimes.com

[관련기사]네이버, 웹툰에 신규 AI 기능 적용...의료계 클라우드 보급에 집중

[관련기사]화웨이, 중국판 GPT-3 개발‥ 현존 최대 파라미터 보유

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지