마이크로소프트(MS)가 기업 내부 데이터 유출을 우려하지 않아도 되는 프라이빗 챗GPT 서비스를 출시했다.
MS는 기업 내부 데이터를 챗GPT 및 GPT-4와 같은 오픈AI 모델에서 활용할 수 있는 새로운 애저 오픈AI 서비스를 출시했다고 23일(현지시간) 블로그를 통해 발표했다.
내부 기밀 유출을 우려해 챗GPT 도입을 꺼리는 기업들을 위한 기업 전용 클라우드 서비스를 내놓은 것이다.
MS에 따르면 이 서비스는 기업 데이터가 저장된 위치에 관계없이 모든 소스에서 데이터를 수집하고 연결한다. 데이터가 로컬에 저장되든 클라우드에 저장되든 관계없이 데이터를 효율적으로 처리, 구성하고 최적화할 수 있다. 기업 데이터에서 직접 오픈AI 모델을 실행하기 때문에 별도의 훈련이나 미세 조정이 필요하지 않다.
이 서비스는 사용자가 애저에 쿼리를 실행하면 클라우드는 애저 코그니티브 서치(Azure Cognitive Search)를 이용해 사용자 입력 및 대화 기록을 토대로 지정된 데이터 소스에서 검색할 데이터를 가져온다. 질문과 검색된 데이터는 새로운 쿼리로 결합되어 애저 내에서 선택된 오픈AI 모델로 전달되고 모델은 답변을 예측해 사용자에게 다시 전송된다.
애저 코그니티브 서치는 사용자 소유의 데이터를 색인화해 필요한 정보를 검색하고 검색 결과 데이터를 지정된 별도의 공간에 가져오는 클라우드 검색 서비스다.
(영상=MS)
프라이빗 챗GPT 서비스에 사용되는 모델은 MS가 클라우드에서 관리하며 오픈AI는 모델에 액세스할 수 없으며 고객 데이터, 쿼리 및 출력에 접근할 수 없다.
또한 이 정보는 다른 서비스를 훈련하는 데 사용되지 않으며 고객은 다른 고객의 모델 및 데이터에 액세스할 수 없다.
기본적으로 기업이 오픈AI GPT 모델에 대한 독점적인 인스턴스를 사용하기 때문에 가능하다. 프라이빗 챗GPT 서비스를 위해 별도로 만든 프라이빗 인스턴스를 제공하는 것이다. 인스턴스는 클라우드에서 만드는 서버와 같은 가상 컴퓨터를 말한다.
프라이빗 챗GPT 서비스는 애저 코그니티브 서치(Azure Cognitive Search)를 이용해 사용자 입력 및 대화 기록을 토대로 지정된 데이터 소스에서 검색할 데이터를 가져온다.
이를 통해 사전 훈련된 지식을 활용할 뿐만 아니라 특정 데이터 소스에서 액세스할 수 있는 최신 정보를 이용할 수 있다.
기업은 문서 수집 및 인덱싱, 소프트웨어 개발, HR 절차, 셀프 서비스 데이터 요청, 고객 서비스 작업, 수익 창출, 고객 및 기타 비즈니스와의 상호 작용과 같은 프로세스를 간소화할 수 있다.
이 서비스는 로컬, 클라우드 또는 에지에 저장되어 있는지 여부에 관계없이 선택한 소스 및 위치에 있는 고객의 내부 데이터를 가져올 수 있고 해당 정보를 처리하고 구성하기 위한 도구를 제공한다. 또한 MS의 API 및 소프트웨어 개발 키트(SDK)를 통해 기업의 기존 스토리지와 통합할 수 있다.
이 서비스를 이용하기 위해서는 승인된 애저 오픈AI 서비스 애플리케이션이 필요하다. 그런 다음 애저 AI 스튜디오를 통해 필요한 데이터를 연결하고 오픈AI 모델과 질문하고 대화할 수 있다.
한편 지난해 말 엔비디아는 기업 내부 데이터로 LLM을 훈련하기 위해 AI 엔터프라이즈 플랫폼 내의 프레임워크인 ‘니모(NeMo)’를 출시한 바 있다.
오픈AI도 챗GPT를 이용자의 채팅 내용을 외부에 노출하지 않는 '비공개 모드'를 내놓기도 했다. 사용자가 공개 여부를 선택하도록 한 기능이다.
박찬 기자 cpark@aitimes.com
