(사진=셔터스톡)
(사진=셔터스톡)

당근마켓 개발팀은 8일 미디엄 팀 블로그를 통해 올해 3분기 구글 클라우드 AutoML을 활용, 이미지 분류 모델 개발 사례를 소개했다.

지역 커뮤니티 서비스 선두업체인 당근마켓(대표 김용현ㆍ김재현)은 AutoML을 이용한 이미지 분류를 시도한 뒤 긍정적인 평가를 내렸다. 모델 평가ㆍ배포ㆍ개발 단계에서 코딩이 필요하지 않아 편리함을 극대화할 수 있다는 이유다.

AutoML(Automatic Machine Learning)은 데이터 과학자 도움없이 기계 스스로 머신러닝(ML) 개발 과정에 필요한 분석ㆍ수정 행위를 반복하며 고품질 ML 모델을 자동 생성하는 인공지능(AI) 기술이다.

AutoML 활용 시 개발자가 ML 파이프라인을 제작하는 데 소요하는 수많은 비용ㆍ시간을 단축할 수 있다. ML 파이프라인은 도메인ㆍ데이터 이해부터 데이터 전처리, 모델 개발ㆍ평가ㆍ배포로 정의되는 ML 개발 과정이다.

당근마켓 개발팀은 이미지 분류를 위한 ML 모델 설계에 AutoML 적용하는 프로젝트를 수행했다. 사용자 선호도에 적합한 이미지를 추천해야 서비스 만족감을 높일 수 있다고 판단, AutoML로 설계한 이미지 분류 ML 모델의 효용성을 확인하겠다는 취지다.

류경윤 당근마켓 ML 엔지니어는 "구글 발표에 따르면, AutoML을 활용해 개발한 ML 모델이 전문가가 직접 개발한 ML 모델의 수준을 뛰어 넘었기 때문에 팀 내부에서 AutoML을 이용한 모델 개발에 신뢰가 있었다"고 이번 프로젝트 수행 배경을 설명했다.

이어 "구글의 'AutoML Vision Edge' 서비스를 이용해 이미지 라벨링 도구부터 모델 훈련ㆍ평가 등 다양한 기능을 별도 개발없이 해결할 수 있어 구글의 AutoML 서비스를 활용하기로 했다"고 덧붙였다.

이에 당근마켓은 구글 클라우드에서 제공 중인 AutoML Vision Edge를 적용해 이미지 분류를 위한 ML 모델을 개발, AutoML 기술 활용을 긍정적으로 평가했다.

개발팀은 AutoML 서비스의 장점으로 ▲편리한 데이터세트 관리 ▲훈련 전 모델 속도와 패키지 크기 예상 가능 ▲모델 평가를 위한 편리한 UI(User Interface) 등을 꼽았다.

개발팀에 따르면, AutoML에서 기본적인 이미지 라벨링 기능을 모두 제공하고 있기 때문에 별도 이미지 라벨링 도구를 개발ㆍ운용하지 않아도 서비스 활용에 지장이 없다. 또 중복 이미지를 자동 필터링하는 기능이 있어 데이터세트 관리에 용이하다.

모델 훈련 시작 전에 예상 패키지 사이즈와 지연 시간(Latency)도 확인할 수 있고 트레이드오프(Trade-off)에 따라 학습 모델을 결정할 수 있다. 훈련 예산을 설정할 수 있으며, 이에 맞춰 적당한 훈련 시간을 공지한다. 당근마켓 개발팀은 약 4만3000장의 이미지 데이터를 ML 훈련에 사용했으며, 구글AutoML로부터 약 8시간 가량의 훈련을 추천받았다고 설명했다.

개발팀은 모델 평가 UI도 편리했다고 언급했다. 모델의 신뢰도 점수(Confidence Score)를 변경하면서 정확도와 재현율을 확인할 수 있으며, 제공받은 혼동행렬(Confusion Matrix)을 이용해 알고리즘의 성능을 시각적으로 탐색할 수 있다.

류경윤 엔지니어는 AutoML의 최대 장점으로 편리함을 꼽았다. 그는 "ML 모델 개발 시 데이터 전처리, 모델 훈련ㆍ평가, 하이퍼파라메터 튜닝 등 다양한 단계를 거치며 많은 시간과 비용을 필요로 한다"며 "AutoML 서비스를 활용해 앞선 개발 과정의 상당 부분을 자동화할 수 있고 시스템 유지ㆍ보수도 단순하다"고 짚었다.

하지만 "AutoML 활용 시 모델 개발 과정에 관리자의 직접적 개입이 불가능하다"며 "자동 학습ㆍ개발한 모델 성능에 문제가 발생할 경우 특정 기법을 적용해 문제를 완화하는 데 한계가 있다"고 설명했다.

당근마켓 개발팀은 AutoML 활용을 두고 적극적인 입장을 보이고 있다.

류경윤 엔지니어는 "이번 프로젝트에서 AutoML 사용 경험이 상당히 만족스러웠다"며 "향후 당근마켓 서비스 ML 모델에 적합한 AutoML 서비스가 있다면 적극 검토할 예정"이라고 말했다.

이어 "AutoML 활용 시 당근마켓 ML팀은 전문가만이 해결 가능한 분야에 더욱 집중할 수 있을 것"이라고 예상했다.

 

AI타임스 김재호 기자 jhk6047@aitimes.com

[관련 기사]"로봇이 위험을 감수하게 한다" 로봇 동조 압력...인간 판단에 영향 미친다

[관련 기사]AI를 만드는 AI, 'AutoML'…데이터 과학자 부족 해소하나

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지