과학적·윤리적 문제도 노출

메타가 과학 언어모델 ‘갤럭티카’를 출시한지 3일만에 폐쇄했다.
메타가 과학 언어모델 ‘갤럭티카’를 출시한지 3일만에 폐쇄했다.

메타가 과학 언어모델 '갤럭티카(Galactica)'를 출시한지 3일만에 폐쇄했다.

MIT 테크놀로지리뷰는 19일(현지시간) 메타가 지난 15일에 출시한 과학문헌 생성 인공지능(AI) 도구 '갤럭티카'를 인종차별적이고 부정확한 과학 문헌을 작성했다는 이유로 폐쇄했다고 보도했다.

메타의 갤럭티카는 과학 기사, 웹 사이트, 교과서, 강의 노트 및 백과사전 등에서 추출한 4800만 가지 사례를 훈련한 대규모 과학 언어 모델이다.

메타는 이를 "학술 논문을 요약하고, 수학 문제를 풀고, 위키 기사를 생성하고, 과학 코드를 작성하고, 분자와 단백질에 주석을 다는 등의 작업을 수행할 수 있다"면서 "연구원과 학생을 위한 지름길"이라고 홍보했었다.

그러나 많은 사람들이 갤럭티카가 사실과 허구를 구분할 수 없을 뿐 아니라  매우 편향되고 부정확한 결과를 생성한다고 지적했다. 

검색 기술을 연구하는 칼 버그스트롬 워싱턴 대학 생물학 교수는 갤럭티카를 "환상적이고, 마술적이고, 지적으로 보이지만 결국은 무작위 헛소리 생성기"라고 비꼬았을 정도다. 

갤럭티카의 근본적인 문제는 과학적 텍스트를 생성하도록 설계된 언어 모델의 기본 요구 사항인 거짓과 진실을 구별할 수 없다는 것이다. 

결과 중 일부는 부정확하거나 잘못 생성된 결과지만 사용자는 올바른 것으로 인식할 수 있기 때문에 문제가 될 수 있으며 과학적 측면에서 매우 위험할 수 있다는 지적도 나왔다.

마이클 블랙 독일 막스 플랑크 지능형 시스템 연구소 딥 러닝 연구 책임자는 "과학적인 방법에 근거하지 않으면서 권위 있는 것처럼 들리기만 하는 과학을 제공한다"면서 "과학 글쓰기의 통계적 속성을 기반으로 사이비 과학을 생산한다"고 꼬집었다.

또 개리 마커스 뉴욕대 신경과학 교수는 "현실은 GPT-3 및 갤럭티카와 같은 대규모 언어 모델이 강력하지만 무모하다는 것"이라면서 "그들은 잘못된 정보의 도전을 크게 증가시킬 가능성이 있다"고 말했다.

박찬 위원 cpark@aitimes.com

키워드 관련기사
  • [찬이의 IT교실] 이미지 생성 AI ⑥…편향성과 저작권 이슈
  • 메타, 과학 논문 생성 가능한 AI도구 출시
  • "품질이 형편없네"...메타가 만든 AI챗봇, 이대로 괜찮나