로앤컴퍼니 "빅케이스GPT'로 변호사시험 정답률 53.3% 달성" < 보도자료 < AI 기업 < AI산업 < 기사본문

'환각 0%'의 변호사향 B2B AI 비서 서비스 출시 예고

이주영 기자
업데이트 2023.10.18 19:58
입력 2023.10.18 17:54
댓글 0

이 기사를 공유합니다

로앤컴퍼니(대표 김본환)가 제12회 대한민국 변호사시험 객관식 문제에서 53.3%의 정답률을 달성한 '빅케이스GPT'의 성과를 18일 발표했다. 이는 현재 최고 대형언어모델(LLM)로 인정받는 'GPT-4'의 정답률 34%를 56.8%나 개선한 결과라고 강조했다.

빅케이스GPT는 인공지능(AI) 기반 통합 법률정보 서비스인 빅케이스와 법률 종합 포털 로톡의 운영사인 로앤컴퍼니가 만든 자체 AI 시스템이다. 앞선 3월 로앤컴퍼니는 오픈AI의 'GPT-3.5'와 GPT-4를 활용해 변호사시험 객관식 문항을 풀도록 하는 자체 실험을 실시, 각각 28.7%와 34%의 정답률을 확인했다고 밝혔다.

변호사시험 객관식 문항은 공법 40문항, 민사법 70문항, 형사법 40문항 등 총 150문항으로 구성된다. 빅케이스GPT는 이 중 각 19개, 40개, 21개 등 총 80개의 정답을 맞혔다.

GPT-4와 빅케이스GPT의 국내 변호사시험 평가 결과 (사진=로앤컴퍼니)

로앤컴퍼니는 빅케이스GPT에 GPT-4를 기반으로 RAG(증강검색생성기법) 모델과 자체 고안한 프롬프트 엔지니어링을 적용했다. 또 빅케이스가 확보하고 있는 국내 최다 판례 329만건 중 정보 가치가 높은 판례를 중심으로 벡터화된 데이터베이스를 구축함으로써 법률 분야 질의에 최적화된 답변을 내놓도록 설계했다.

빅케이스GPT에 판례뿐 아니라 빅케이스가 보유한 법령 14만5000건, 결정례 7000건, 유권해석 7000건 등 총 16만건의 법률정보도 추가로 학습했다.

특히 빅케이스GPT는 생성 AI의 가장 큰 문제인 환각(할루시네이션)을 ‘제로’에 가깝게 통제해 데이터의 신뢰성을 대폭 강화한 것이 특징으로 꼽았다. 반복적인 테스트를 통해 빅케이스GPT가 가짜 판례나 법령을 제시하지 않는 수준에 이른 것에 대한 검증을 마쳤으며, 향후 지속적인 QA를 거쳐 이를 완벽하게 제거할 예정이라고 밝혔다.

로앤컴퍼니는 향후 빅케이스GPT에 다수의 언어 모델을 실험·적용하고, 자체 개발한 언어 모델을 추가로 적용해 시스템을 고도화할 계획이다. 이를 통해 내년 상반기 중 '슈퍼로이어(Super Lawyer, 가칭)'라는 AI 기반의 변호사향 B2B SaaS 서비스를 신규 출시하려고 한다. 지난 6월 톰슨로이터에 6억5000만달러(약 8450억원)에 인수된 케이스텍스트의 코카운슬 서비스와 유사하게 ▲법률 메모 생성 ▲법률서면 요약 ▲법률 질의응답 등의 기능을 제공해 변호사의 업무 효율 제고에 기여하는 것이 목표다.

김본환 로앤컴퍼니 대표는 "한국어와 대한민국 법률에 최적화된 언어 모델로 개발될 슈퍼로이어는 변호사를 돕는 ‘AI 법률 비서’와 같이 구동되며 변호사의 업무효율을 극대화하는 역할을 맡게 될 것"이라며 "법률AI연구소를 중심으로 변호사님들의 성과를 높이기 위한 서비스 출시에 집중해 더 많은 변호사님들의 업무환경 개선에 도움을 드리고 싶다"고 말했다.

이주영 기자 juyoung09@aitimes.com