AI 탑재 제품, 믿고 사용할 수 있는지 검증하는 제도 시작
한국표준협회·와이즈스톤, 신뢰성 인증 민간 사업자로 선정
민간 활용도와 윤리 발생 가능성 큰 제품 시범 테스트 진행
삼성전자 AI 식기세척기·교육용 챗봇·가상인간 시범 테스트
시범인증 후 AI가 적용된 전 제품 대상으로 인증 수행 예정

삼성전자 가전제품에 탑재된 AI 기술과 딥브레인AI의 가상인간, 클라썸의 교육용 챗봇이 AI 신뢰성 시험인증을 시작한다. (사진=셔터스톡)
삼성전자 가전제품에 탑재된 AI 기술과 딥브레인AI의 가상인간, 클라썸의 교육용 챗봇이 AI 신뢰성 시험인증을 시작한다. (사진=셔터스톡)

삼성전자 가전제품에 탑재된 인공지능(AI) 기술과 딥브레인AI의 가상인간, 클라썸의 교육용 챗봇이 AI 신뢰성 검증을 시작한다. AI 상용화 과정에서 윤리적인 문제는 없는지 확인하고 발생할 수 있는 위험에 대응하기 위함이다. 이번 검증은 한국표준협회와 와이즈스톤이 진행할 예정이다.

AI 신뢰성 검증은 AI 기술이 탑재된 제품과 소프트웨어(SW)가 윤리적으로 문제가 없는지, 사용해도 괜찮은지 점검하는 장치다. 해당 검증을 통과하면 신뢰성 검증에 들어간 항목에 한에선 제품을 사용해도 문제가 되지 않는다는 것이 인증된다.

AI 신뢰성 검증, 왜 필요할까?

AI 기술은 다양한 산업군과 제품에 탑재되면서 사용자 편의성을 높이고 있다. 하지만 이 기술이 만능은 아니다. 공정성을 깨뜨리는 편향성 문제를 발생시키거나 개인정보 침해, 유해 콘텐츠 제작 등의 문제를 일으킬 수 있다.

AI 신뢰성은 사람중심 AI를 위해 필요한 부문으로 꼽힌다. (출처=사람이 중심이 되는 AI 위한 신뢰할 수 있는 인공지능 실현 전략(21'))
AI 신뢰성은 사람중심 AI를 위해 필요한 부문으로 꼽힌다. (출처=사람이 중심이 되는 AI 위한 신뢰할 수 있는 인공지능 실현 전략(21'))

대표적인 사례가 안면인식에서 발생하는 편향성 문제다. 2018년 MIT 미디어랩은 마이크로소프트(MS), IBM, 메그비의 안면인식 기술을 비교한 결과 피부색이 검을수록 인식 오류율이 높다는 것을 찾아냈다. 피부색이 검은 여성의 경우 인식 오류율은 무려 35%로 나타났다. 

미국 표준기술연구소(NIST)는 2019년 99개 개발 그룹이 만든 190개의 안면인식 알고리즘에 대한 성능평가를 실시한 결과, 아시아인과 흑인의 얼굴이 백인보다 10배에서 100배 이상 잘못 인식된다고 발표했다.

이미 사용자들에게 친숙한 챗봇도 마찬가지다. MS는 2016년 트위터에 '테이(Tay)'라는 AI 챗봇을 소개했지만, 16시간 만에 서비스를 중단했다. 테이가 사람들과 트윗을 주고받는 과정에서 "정말 페미니스트가 싫다", "히틀러는 옳았고, 나는 유대인을 증오한다"는 등의 인종차별적이고 성차별적인 글을 남겨서다.

국내 스타트업 스캐터랩이 개발한 챗봇 '이루다'도 여러 사전 테스트를 거쳤음에도 불구하고 성희롱과 성 소수자에 대한 차별 글을 남기면서 서비스가 폐쇄된 바 있다.

AI 신뢰성 확보, 무엇이 필요한가

이번 삼성전자 가전제품과 AI 가상인간, 교육용 챗봇에 대해 AI 신뢰성 검증을 하는 이유는 이러한 AI가 가져올 수 있는 문제점을 사전에 차단하고 바로잡기 위해서다. 

AI 신뢰성은 AI 기술에 내재한 위험과 한계를 해결하고 해당 기술을 확산하는 과정에서 부작용을 방지하기 위해 준수해야 하는 가치 기준을 뜻한다. AI 신뢰성을 확보하기 위한 필수 요소로는 ▲안전성 ▲설명 가능성 ▲투명성 ▲견고성 ▲공평성 등이 있다. 

 AI 신뢰성을 확보하기 위한 필수 요소로는 ▲안전성 ▲설명 가능성 ▲투명성 ▲견고성 ▲공평성 등이 있다. (자료=와이즈스톤)
AI 신뢰성을 확보하기 위한 필수 요소로는 ▲안전성 ▲설명 가능성 ▲투명성 ▲견고성 ▲공평성 등이 있다. (자료=와이즈스톤)

과기정통부는 국내 AI 기술의 신뢰성 확보를 위해 '민간 인공지능 신뢰성 시범인증'을 시작했다. AI 신뢰성 인증은 객관성과 전문성을 강화·확보하기 위해 '제3자 검토위원회'의 검증을 거치는 것을 원칙으로 한다. 검토위원회는 AI와 윤리, 기술투자 전문가 등이 참여한다. 

한국표준협회와 와이즈스톤은 이번 검토위원회 민간 사업자로 임명됐다. 양사는 지난 26일 시범인증 착수보고회를 마치고 올해 12월까지 인증체계를 구축하기로 했다. 인증체계는 정부가 고시한 '신뢰할 수 있는 인공지능 개발 안내서’의 59개 검증 요구사항과 관련 표준 등을 기반으로 구축한다. 

한국표준협회와 와이즈스톤은 지난 26일 시범인증 착수보고회를 진행했다. (왼쪽부터) 엄신웅 한국표준협회 국제인증센터 연구원, 이장욱 한국표준협회 국제인증센터 센터장, 박진성 한국표준협회 인증본부장, 박지혜 정보통신산업진흥원 수석연구원,이영준 와이즈스톤 ICT시험인증연구소 소장, 정세린 와이즈스톤 ICT시험인증연구소 수석연구원. (사진=와이즈스톤)
한국표준협회와 와이즈스톤은 지난 26일 시범인증 착수보고회를 진행했다. (왼쪽부터) 엄신웅 한국표준협회 국제인증센터 연구원, 이장욱 한국표준협회 국제인증센터 센터장, 박진성 한국표준협회 인증본부장, 박지혜 정보통신산업진흥원 수석연구원,이영준 와이즈스톤 ICT시험인증연구소 소장, 정세린 와이즈스톤 ICT시험인증연구소 수석연구원. (사진=와이즈스톤)

NLP·음성인식·비전 등 다양한 분야 신뢰성 검증 가능

와이즈스톤은 AI 신뢰성 검증 구축을 위해 우선 4개 제품에 시범인증을 수행한다고 밝혔다. 상세 품목은 ▲삼성전자 '홈케어 시스템' ▲삼성전자 'AI 식기세척기' ▲클라썸 '교육용 챗봇' ▲딥브레인AI의 '가상인간'이다. 회사는 시범인증인 만큼 많은 사용자를 보유하고 있고 윤리적 발생 가능성이 높은 제품 위주로 선정했다고 밝혔다.

시범인증 제품으로 선정된 것 외에도 신뢰성 검증을 받을 수 있는 분야는 다양하다. 현재까지 구축된 신뢰성 검증 품목은 ▲지식기반 ▲자연어처리(NLP) ▲음성인식 ▲지능로봇 ▲컴퓨터 비전이다. 한국표준협회와 와이즈스톤은 시범인증 후 AI가 적용된 전 분야 제품을 대상으로 인증을 수행할 예정이라고 밝혔다.

이영준 와이즈스톤 ICT시험인증연구소 소장은 "AI는 우리 주변 어디에서나 볼 수 있게 되었지만 'AI를 얼마나 신뢰할 수 있는가'라는 의문은 끊이지 않고 있다"며 "이번 시범인증 사업은 편향적이지 않은 데이터와 알고리즘, 설명할 수 있는 AI를 실현하는 첫걸음이 될 것"이라고 말했다.

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사][김동원의 Eye-T] AI가 편향성 문제를 극복하는 방법

[관련기사]국내 첫 '민간 AI 신뢰성 인증' 등장, 그 의미는?

키워드 관련기사
  • [인터뷰] 유창동 카이스트 교수 "AI, 빠른 발전 속도만큼 안전장치 마련 시급"
  • AI가 공정한지 진단하는 시스템, 국내서 개발...IBM·MS·구글 모델보다 성능 우수
  • 딥브레인AI, 소매업용 신개념 키오스크 'AI 점원' 공개