국내 연구팀이 시간에 따라 데이터의 분포가 변화됐을 때에도 인공지능(AI) 모델의 성능을 안정적으로 유지할 수 있는 AI 학습 프레임워크를 제안했다.
한국과학기술원(KAIST, 총장 이광형)은 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 AI가 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다.
이 기술을 사용하면 환경 변화에 따라 데이터 자체를 직접 전처리해 학습에 최적화한 데이터로 변환, AI 모델 종류에 상관없이 쉽게 확장될 수 있다고 설명했다.
연구진은 최근 AI가 벤치마크에서 높은 성능을 보여주지만, 대부분 좋은 결과는 AI 모델을 훈련하고 성능을 테스트할 때 데이터의 분포가 변하지 않는 정적인 환경을 가정한다고 지적했다.
하지만 SK 하이닉스의 반도체 공정 과정에서 관측된 바에 따르면, 시간에 따른 장비의 노화와 주기적인 점검으로 인해 센서 데이터의 관측값이 지속적으로 변하는 드리프트 현상이 나타나고 있다.
이 경우 AI 모델의 판단이 부정확해지는 등 성능이 점차 악화될 수 있다.
이 문제를 해결하기 위해 연구팀은 데이터 학습시 AI 모델의 업데이트 정도와 방향을 나타내는 '그래디언트' 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있다는 것을 입증했다. 이런 효과적인 학습 데이터 선택 기법을 이용, 데이터 분포와 결정 경계가 변해도 모델을 지속적으로 학습할 수 있게 됐다는 설명이다.
제1 저자인 김민수 박사과정은 "이번 연구를 통해 AI를 한번 잘 학습하는 것도 중요하지만, 변하는 환경에 따라 계속 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있으면 좋겠다ˮ라고 말했다.
연구에는 김민수 KAIST 전기및전자공학부 박사과정이 제1 저자, 황성현 박사과정이 제2 저자, 황의종 교수가 교신 저자로 참여했다.
이번 연구는 SK 하이닉스 인공지능협력센터의 지원을 받았으며, 2월 캐나다 밴쿠버에서 열린 ‘국제 인공지능 학회(AAAI)’에서 발표됐다.
박수빈 기자 sbin08@aitimes.com
- KAIST, GPU 대규모 출력데이터 난제 해결..."생성 AI·메타버스 적용 기대"
- KAIST, 생성AI·가상현실 결합한 3D 스케칭 연구 본격화
- KAIST-현대차, 자율주행 '차세대 라이다 시스템' 공동연구
- KAIST, 곤충 시신경과 유사한 비전 AI 반도체 개발..."초고속·저전력 엣지 AI 기대"
- KAIST, 100큐비트 양자컴퓨터 계산데이터 전격 공개
- KAIST, 뉴로모픽 신경망으로 경계선 인식·그래프 색칠 문제 해결 시스템 구축
- KAIST, 소비 전력 15배 줄이는 뉴로모픽 반도체 메모리 소자 개발
- KAIST, 질병 유발 단백질에만 작용하는 분자 만드는 생성 AI 기술 개발
