구글이 생성 인공지능(AI) 모델이 작성한 텍스트를 감지하고 워터마크를 삽입하는 기술인 '신스ID 텍스트(SynthID Text)'를 오픈소스로 공개했다.
테크크런치는 23일(현지시간) 구글 딥마인드가 X(트위터)를 통해 이런 사실을 밝히며 "개발자와 기업이 무료로 사용할 수 있고 AI에서 생성한 콘텐츠를 식별하는 데 도움이 될 것"이라고 전했다는 사실을 보도했다.
신스ID 텍스트는 AI 모델이 생성한 텍스트에 보이지 않는 워터마크를 삽입하는 기술이다. AI 제작 이미지에 눈에 띄지 않는 워터마크를 삽입하는 기존 '신스 ID' 기술을 텍스트에 확대 적용한 것이다. 현재 신스ID 텍스트는 구글의 '책임감 있는 생성 AI 툴킷(Responsible Generative AI Toolkit)'과 허깅페이스에서 다운로드할 수 있다.
이는 대형언어모델(LLM)이 텍스트를 문자, 단어, 구문 등 토큰으로 분해한 다음 특정 토큰 뒤에 나올 가능성이 높은 토큰에 대해 예측한다는 데에서 비롯된 기술이다.
각 토큰은 문장의 다음 단어로 선택될 가능성에 대한 확률 점수를 받는다. 확률이 높을수록 출력 텍스트에 포함될 가능성이 높다. 이때 신스ID 텍스트는 토큰 선택 점수 패턴과 조정 확률 점수를 합쳐 출력된 텍스트를 생성 AI 모델이 작성한 것인지 구분한다.
이 방식은 텍스트의 품질, 정확성, 창의성, 속도를 저하시키지 않으면서도 효과적으로 워터마크를 삽입할 수 있다.
그러나 신스ID도 한계가 있다. 예를 들어, 짧은 텍스트나 번역된 텍스트에서는 워터마킹이 잘 작동하지 않는다. 또 사실적 프롬프트에 대한 응답에서는 정확성을 해치지 않기 위해 워터마킹을 적용하기가 어렵다.
푸쉬밋 콜리 구글 딥마인드 AI 연구 부사장은 "이제 AI 개발자는 신스ID 텍스트를 사용해 텍스트 출력이 LLM에서 나왔는지 감지할 수 있다"라며 "더 많은 개발자가 책임감 있게 AI를 사용하기 더 쉬워질 것"이라고 말했다.
박찬 기자 cpark@aitimes.com
