오픈AI가 12일 연속 발표 이틀째를 맞아 추론 모델 'o1'를 활용한 '강화 미세조정(Reinforcement Fine-Tuning)' 미리보기 버전을 선보이고, 내년 정식 출시한다고 밝혔다.

오픈AI는 6일(현지시간) 진행된 스트리밍을 통해 특정 도메인의 작업에 적합하도록 미세조정된 전문가 모델을 만들 수 있는 강화 미세조정 기능을 시연했다.

마크 첸 오픈AI 연구 담당 수석 부사장은 "강화 학습 알고리즘을 고등학교 수준에서 전문가 박사 수준까지 끌어올린 것"이라며 "오늘은 내년에 정식 출시할 제품을 프리뷰하는 것"이라고 설명했다.

지난 주 'o1' 최초로 기업용 맞춤형 모델을 구축한 톰슨 로이터에 바로 이 기술을 적용했다고 밝혔다. 법률 AI 어시스턴트에 o1 맞춤형 모델을 적용한 톰슨 로이터는 "추론 능력 향상으로 이전에 'GPT-4'와 같은 매우 유능한 모델에서도 놓쳤던 미묘한 사례를 찾아내는 주목할 만한 능력을 보여줬다"라고 전한 바 있다.

이 기술은 o1의 향상된 추론 능력으로 법률과 금융, 엔지니어링, 보험 분야 등 환각을 피해야 하는 분야에 적합하다는 설명이다.

홈페이지에는 강화 미세조정 연구 프로그램도 공개했다. '알파 버전'의 API에 접속, 도메인별 작업에서 기술을 테스트할 수 있다고 전했다. 현재 신청서를 접수 중이다.

한편 오픈AI는 12일 발표 이벤트를 열고 첫날 'o1 프로' 및 'o1 풀버전', '챗GPT 프로' 요금제를 공개했다. 주말은 쉬고 다음 주 월요일 3일차를 진행할 예정이다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지