과학논문용 언어모델 ‘갤럭티카’ 발표

(사진=갤럭티카 홈페이지)
(사진=갤럭티카 홈페이지)

메타가 과학논문을 생성할 수 있는 오픈소스 AI 도구를 내놨다. 프롬프트 입력만으로 논문을 만들어낼 수 있어 전문가들에게 도움이 될 수 있으나 오남용 우려도 제기된다.

메타가 15일(현지시간) '갤럭티카(Galatica)'라는 과학논문용 대규모 언어모델(LLM)을 선보이면서 소스코드를 공개했다고 소셜미디어투데이가 전했다.

갤럭티카는 간단한 텍스트 프롬프트을 입력하면 학술 문헌 요약과 수학 문제 해결, 위키용 기사 생성 등을 해준다. 인용할 만한 글을 제안하고 관련 논문의 검색도 제공한다.

과학 논문을 쓰는데 필요한 데이터들을 찾아 연구자들을 돕는데 주안점이 있지만 이 도구로 아이디어를 계속 확장시키면 참고 문헌이나 공식등이 포함된 전체 연구 논문을 생성할 수도 있다. 이 도구는 최근 나온 여러 텍스트나 이미지 생성 AI도구와 본질적으로 같은 기능을 하지만, 과학 논문에 특화된 것이다.

메타측은 갤럭티카 홈페이지에서 "정보가 폭발적으로 증가하면서 연구자들이 논문에 파묻혀 의미있는 글을 찾아내지 못하게 됐다"면서 이 문제를 해결하기 위해 이 도구를 개발했다고 설명했다. 이어 갤럭티카는 "4800만개 이상의 논문과 교과서, 참고자료, 화합물이나 단백질 등에 관한 과학 지식 소스들로 훈련된 강력한 LLM"이라고 밝혔다.

메타는 또 오남용을 경계하기 위해 이 도구의 한계도 알리고 있다. 갤럭티카 홈페이지에서 언어모델은 환각을 일으킬 수 있다면서 검증되지 않은 모델의 조언은 따르지 말라고 권했다. 또 이 모델은 빈도수에 대한 편향성이 있다면서 잘 언급되지 개념이나 아이디어는 제시하지 않을 수 있다고 경고했다.

특히 고도의 기술적 내용에 대해선 생성된 텍스트가 확실하고 제대로 된 것처럼 보여도 미묘하게 틀릴 수 있다고 강조했다. 메타의 최고과학자 얀 르쿤도 트위터에 이 도구가 보조적인 것이라면서 논문을 자동으로 만들어 주지는 않는다고 썼다.

메타 측의 이런 설명에도 불구하고 이 도구는 학생들이 남용할 가능성이 있다는 지적이 나온다.

소셜미디어투데이는 "AI 시스템을 사용해 학교 과제를 하거나 일부 학생의 경우 AI로 만든 과제물을 돈받고 파는 경우가 이미 알려져 있다"면서 "갤럭티카와 같은 도구는 이런 추세를 부추길 가능성이 있다"고 논평했다.

정병일 위원 jbi@aitimes.com

키워드 관련기사
  • "'깃허브 코파일럿'이 5년 내 프로그램 코드 80% 생성할 것"
  • 생성 AI가 향후 5년간 영업 변화시킬 것...가트너 예측
  • '생성 AI' 높아진 인기만큼 난맥상도 즐비