둘째날은 '대화형 AI'가 주제다. 업계 전문가들이 온라인으로 대화형 AI 분야에서 가상 에이전트의 공정성ㆍ설명 가능성ㆍ성별 중립성 등 다양한 의제를 다뤘다. 

< 둘째날 세미나 영상 >
 

◇아마존과 구글이 바라본 AI 비서 미래 트렌드 

프렘 나타라얀 아마존 알렉사 AI 부사장은 워크숍 둘째날 버락 투롭스키 구글AI 제품이사와 AI 비서의 미래 트렌드를 이야기했다.

"비지도 학습이 실현될 때까지 기다리지 마십시오. 어느정도 수준에서는 비지도 학습을 사용해야 한다고 생각하고 개발하세요."

아마존은 비지도 학습을 AI비서 개발에서 우선적으로 활용해야 하는 트렌드로 봤다. 다양한 사람을 포용하는 대화형 AI를 만드려면 비지도 학습이 필수라는 얘기다.  비지도 학습은 라벨링 작업 이전의 비가공 데이터를 사용, 분류되지 않은 비가공 데이터로부터 추론 모델을 만들어 낸다. 아마존 알렉사와 대화하는 사람과 상호 작용해 수집한 신호를 기반으로 적응할 수 있는 자율 학습 시스템을 구축한다.
아마존 머신러닝(ML)팀은 지난해 자율학습과 비지도학습이 AI 비서의 자연스런 대화의 핵심으로 봤다. 또 순환신경망(RNN)을 활용해 대화 경로를 예측하는 '알렉사 AI'를 사전 공개한 바 있다. 

나타라얀과 투롭스키는 멀티모달 체험법이 또 하나의 미래 트렌드라고 입을 모았다. 멀티모달 모델은 문자, 사진, 영상 등을 결합해 입력한다. 문자와 사진을 결합한 모델의 예로는 구글의 비주얼BERT와 오픈AI의 이미지GPT가 있으며 이는 최근 열린주 국제기계학술회의(ICML)에서 호평을 받았다.

투롭스키는 음성만으로도 제공하는 제한된 수의 곡면 처리 기술의 발전을 이야기했다. 화면이 없으면 구글 검색 결과의 무한 스크롤이나 첫 페이지가 없기 때문에 응답은 세가지 잠재적 결과로 제일 위에 있는 것으로 제한되어야 한다는 내용이다. 아마존과 구글 모두에게 스마트 디스플레이를 구축하고, 비주얼 콘텐츠를 공유하고, 음성 응답하는 AI비서를 강조한 것이다.

투롭스키는 번역 모델 기술이 발전함에 따라 스마트 어시스턴트의 접근성이 증가한다고 말했다. 구글 어시스턴트는 현재 44개국어를 지원하고 있다.
또 구글은 언어 모델에서 성차별 요소를 제거하기 위해 비지도 학습을 활용하고 있는데 올해 초에 추가로 신경기계 번역모델을 도입한바 있다고 밝혔다.

실제로 올해 초 조지타운대, 스탠퍼드대 소속 연구진은 아마존과 구글을 포함 인종 자동 음성 탐지 시스템이 흑인보다 백인에게 더 효과가 있다는 것을 발견했다.

어도브 (사진=벤처비트 유튜브 채널)
신시아 스토다드 어도비 CIO(사진=벤처비트 유튜브 채널)

◇어도비 CIO, AI 챗봇은 힘든 일과 IT 관련 질의를 줄여줘 

일반적으로 어도비를 포토샵, 프리미어 등 그래픽 어플리케이션 소프트웨어 제조사로 알고 있지만, 어도비 앱에서 이용가능한 디지털 콘텐트와 인쇄물 수요는 헤아릴 수 없을 만큼 많다. 인공지능(AI) 기반 크리에이티브 클라우드 애플리케이션 덕이다.  
신시아 스토다드 어도비 최고정보관리책임자(CIO)는 벤처비트 트랜스포메이션 2020 디지털 컨퍼런스에서 16일 하리 시바라만 벤처비트 인공지능(AI) 부서장과 AI를 비즈니스에 통합하는 모범 사례에 관해 논의했다. 어도비는 AI가 초미의 관심사가 되기 전부터 매끄럽게 어도비 사업 포트폴리오에 결합하고 있었다. 
그는 코로나19를 계기로 재택근무를 사내에 도입했을 당시, 직원들이 사측에 문의한 수많은 IT 관련 질의 내용을 처리하는 데 AI가 큰 도움이 됐다고 언급했다. 
어도비는 자연어 처리(NLP)를 할 수 있는 AIᆞML챗봇을 도입하여 임직원의 질문에 답하거나 관련 기술 내용이 상세히 적혀져 있는 웹페이지 링크를 제공했다. 어도비는 사내 내부 고객이 기술 부서에 전화 하는 대신 이메일, 챗봇을 하도록 유도함에 따라, 챗봇 도입 전 10시간 걸렸던 응답 시간을 1시간으로 줄여서 응대 소요시간이 90% 감소했다.
스토다드 CIO는 “하드웨어용 AI 카탈로그 주문 시스템을 사용하면 76%에 달하는 발주서 작성 작업이 불필요 해지며 계약 작성 시스템을 사용할 경우 이전 작업량의 약 82%가 감소했다”고 말했다. 
이제 어도비가 스마트 자동입력 AI 시스템을 이용해 내부 직원들의 시간을 얼마나 많이 절약했는지 가늠할 수 있다. 유료 고객에 대한 유사한 솔루션을 구축 가능성은 더 말할 나위가 없다. 
 

켄 도들린 캐피탈원 부팀장(사진=트랜스폼2020 강연 영상 스크린샷)

◇ 캐피탈원의 자랑 AI 비서 ‘에노’

벤처비트 트랜스폼 2020이 한창인 지난 16일(현지시간), 맷 마샬 벤처비트 CEO가 미국내 최대 은행 캐피탈원의 인공지능(AI)와 자연어이해(NLU) 기반 문자서비스에 대해 켄 도들린과 대담을 가졌다.

켄 도들린은 캐피탈원에서 ‘대화용 AI 개발’ 부팀장을 맡고 있다. 이 부서가 생기기 전까지 고객들은 은행에서 보내는 문자서비스를 ‘스팸’으로 여길 뿐이었다. 문자 응답률은 평균 15%에 불과했다. 그러나 대화용 AI 개발팀이 출시한 Eno(에노)의 등장으로 새로운 트렌드를 개척했다. 

캐피탈원은 현재 에노를 앞세워 상품설명 및 자산관리를 간단히 해결하고 있다. 고객이 문자를 통해 묻는 질문을 99% 이해해 필요로 하는 답을 내놓는다. 자동이체 에러나, 출처가 불분명한 곳으로 지출이 빠졌을 경우에도 곧바로 문자알림 서비스를 제공한다. 도들린 부팀장은 마샬 CEO에게 “에노가 문자를 보내 질문하면 고객들은 간단한 대답이라도 꼭 보낸다”며 “에노를 통해 AI와 사람 사이 새로운 관계가 형성되고 있다”고 말했다.

캐피탈원은 에노를 개발하기 위해 IBM 왓슨 연구소에서 전문인력을 영입했다. 사내 인재양성에 장기간 투자하기보다 빠른 방법을 택한 것이다. 도들린 부팀장은 “오히려 외부 전문가를 영입한 것이 결과적으로 최고의 선택이었다”며 “사내 개발자들이 고착화되어 생각지 못한 부분에 아이디어를 냈을뿐 아니라 일반 은행 업무를 능가하는 트렌디한 AI 비서를 개발할 수 있었다”고 말했다.

현재 캐피탈원은 에노 개발 외에도 클라우드 서비스 구축에도 투자하고 있다. 해마다 컴퓨팅 업계가 빠르게 진화하면서 캐피탈원도 클라우드 확장에 여념이 없다. 

도들린 부팀장은 “에노는 위젯을 만드는 것과 다른 개념”이라고 말했다. PC를 켜면 작동되는 단방향 응용플랫폼인 위젯과 달리 에노 같은 AI 비서는 상대방의 반응에 따라 자연스러운 답을 할 줄 아는 양방향 프로그램이라는 것이다. 이어 도들린은 “에노의 성공은 향후 캐피탈원이 고객정보 및 운영에 필요한 빅데이터를 형성하는 데 큰 도움이 될 것”이라며 “에노 외에도 더 많은 AI 비서 모델을 개발해 고객과 1:1 관계를 완벽하게 만들겠다”고 말했다.   
 

버락 투로프스키 구글AI 프로덕트 책임자
버락 투롭스키 구글AI 프로덕트 책임자(사진=벤처비트 유튜브 채널)

◇ 구글이 AI알고리즘의 편향성 문제를 해결해나가는 방법

버락 투롭스키는 'VB 트랜스폼 2020' 컨퍼런스를 통해 “구글은 인공지능(AI) 분야에서 선도적인 지위에 있다”며 “리더십을 발휘해 AI알고리즘의 편향성 문제를 해결해야할 책임이 있다”고 강조한다. 이번 발표에서 투롭스키는 AI의 편향성과 관련해 구글이 직면하고 있는 도전과제와 이를 해결하기 위한 노력에 대해 공유하는 시간을 가졌다.

AI알고리즘이 의존하고 있는 기계학습(ML) 훈련 데이터는 성별이나 인종 등에 따른 편견을 내포할 수 있다. 그 결과 음성·대화, 이미지 인식, 번역을 비롯한 다양한 영역에 걸쳐 편향된 AI솔루션이 나오고 있는 것이다. 특히 구글이 AI알고리즘 편향성 문제로 고심하고 있는 제품 가운데 하나가 바로 구글 번역(Google Translate) 서비스다.

구글 번역의 결과는 잠재적으로 전 세계에 큰 영향을 미칠 수 있다. 그는 “인터넷 콘텐츠 가운데 약 50%가 영어로 돼 있으나 전 세계에서 겨우 20%만이 영어를 구사할 수 있다”고 말했다. 미국 외 지역 95%를 포함, 약 1500억 명에 달하는 사용자들이 구글 번역을 이용해 매일 대략 1400억 개의 단어를 번역하고 있다고 한다.

투롭스키는 “전 세계 정보에 접근할 수 있으려면 번역이 필요하다”면서도 “문제는 번역을 실행하는 알고리즘이 여러 언어에서 가장 기본적인 요소 가운데 하나인 (문법적) 성 구분 즉 성별 인식을 하지 못한다는 점”이라고 지적한다. 게다가 더욱 문제가 되는 것은 기계학습 시스템에 입력된 원 자료 그 자체가 성 편견에 기초하고 있다는 점이다. 예를 들어 투로프스키는 “구글이 사용하는 가장 중요한 번역 자료 중 하나가 바로 성경”이라고 말했다. 

투롭스키는 “이 같은 성 편향성은 역사적·사회적 자료에서 비롯된다”며 “많은 훈련 데이터가 수천 년까지는 아니더라도 수백 년은 됐다”고 설명한다. 이와 관련해 역사적으로 여러 문화권에서 의사는 주로 남성이고 간호사는 주로 여성인 경향이 있다는 점을 예로 들었다. 그래서 알고리즘이 성별 구분에 관한 어떤 측면을 파악한다고 해도 결국 ‘그는 의사다’나 ‘그녀는 간호사다’라는 디폴트(default) 즉 기본 값으로 되돌려 영어 번역을 할 가능성이 높다. 이러한 내재적인 편향이 번역에서 많이 일어난다는 설명이다.

구글이 채택한 AI원칙들을 살펴보면 구글은 자사의 알고리즘을 통해 부당한 편견을 심어주거나 키우는 일이 없도록 하는 데 주력할 것으로 보인다. 하지만 이러한 번역상의 성 편향성 문제를 해결하기 위한 몇 가지 방법이 거론되고는 있으나 매우 만족스러운 방안은 현재로서 없다. 그 가운데 구글은 알고리즘이 여러 답을 제시함으로써 사용자에서 선택권을 넘기는 방안을 택했다. 

즉 구글 번역이 사용자에게 여러 선택 가능한 옵션을 제시하고 사용자가 그중 하나를 선택하게 하는 것이다. 예를 들어 영어로 ‘간호사(nurse)’를 입력해 스페인어로 번역할 경우 ‘enfermera(여성명사)’와 ‘enfermero(남성명사)’ 두 가지로 표시된다. 

투롭스키는 “매우 간단하게 들리겠지만 이를 위해 구글은 새로운 세 가지 기계학습 모델을 만들어야만 했다”고 전했다. 이 세 가지 모델은 성 중립적인(gender-neutral) 질의를 감지해 한쪽 성에 국한된(gender-specific) 번역을 생성한 후 정확한지 확인하는 작업을 한다. 첫 번째 모델은 어느 단어가 성별을 표현할 수 있고 그렇지 않은지 알고리즘을 훈련한다. 두 번째 모델을 통해 훈련 데이터는 남성 또는 여성으로 태그가 지정돼야 한다. 그런 다음 세 번째 모델은 잠재적으로 속뜻을 바꿔버릴 수 있는 제안들을 걸러낸다. 

예를 들어 이러한 기계학습 모델을 기반으로 성 중립적인 언어인 영어의 한 구절을 한쪽 성에 국한된 스페인어로 번역할 때 기존에는 편향된 한 가지 결과만 주어졌다면 이제는 여성형과 남성형 번역 옵션으로 제공된다는 말이다. 투로프스키는 구글이 향후 지속적으로 이 세 가지 모델을 세밀하게 조정하고 그 결과물들을 개선하기 위해 각기 어떻게 상호작용하는지에 대해 세심하게 살필 것이라고 밝혔다. 

파락 아그라왈 트위터 CTO(사진=벤처비트 유튜브 채널)

◇트위터 CTO, "오보 많이 놓쳐 아쉬워"

트위터는 스스로를 글로벌 대화의 허브로 여긴다. 트위터는 다양한 이슈를 다룰 수 있도록 머신러닝(ML) 투자를 지속하고 있지만, 트위터 경영진은 회사가 갈 길이 멀다는 것을 알고 있다.
트위터는 적들의 손에서 대화형 인공지능(AI)과 같은 기술이 사회적 대화 문제를 빠르게 진화 시키기 때문에 이 싸움에서 승리할 수 없을 것 같았다. 이에 아그라왈 CTO는 트위터가 그 잠재력을 긍정적인 방향으로 충족시킬 수 있도록 흐름을 바꾸기로 결심했다.

아그라왈은 "세상에서 우리의 역할은 사회적 대화를 제공하는 것이다”라고 말하며 “지난 몇 달 동안 코로나19 관련 공중 보건 시사점이나, 미국의 인종적 문제 등 공공 대화 역할을 강조해왔다"고 설명했다.

벤처비트의 ‘트랜스폼(Transform) 2020’ 컨퍼런스 인터뷰에서, 아그라왈은 트위터가 긍정적이고 생산적인 대화를 강조할 수 있도록 많은 투자를 했다고 전했다. 
아그라왈은 긍정적인 사회적 대화의 장을 만드는 데 초점을 맞추고 있다. 사회적 대화를 조종하려는 사람과 그들이 새로운 기술을 어떻게 사용하는지 등에 집중, 업무를 처리하고 있다. 
아그라왈은 "대화 내용의 긍정성•부정성을 떠나 이슈로 떠오르면, 몇 분 안에 영향을 미칠 것이다"라며 “ML 모델이 오보를 따라잡을 수 있을 때까지 기다릴 수 없으며, ML 모델은 실시간으로 배워야한다”고 강조했다.

이어 “최근 몇 달 동안, 코로나19 팬데믹과 블랙 라이브즈 매터(흑인 민권 운동) 등 이슈가 전 세계적인 대화를 촉발하면서 플랫폼 감시 작업이 더욱 어려워지고 있다”고 토로했다.
하지만 아그라왈은 트위터가 오보 색출에 진전을 보이고 있다고 믿는다. 그는 코로나19 관련 오보를 중심으로 다양한 정책을 빠르게 추진했다.
아그라왈은 "우리 전략은 모든 오보를 다루는 것이 아니며, 우리의 노력은 진실과 거짓을 판별하는 데 초점을 맞추지 않는다”고 말했다. 

트위터는 오보 의심 트윗에 라벨 및 주석을 제공하는 데 중점을 둔다. 대중이 신뢰할 수 있는 정보를 쉽게 접근할 수 있도록 하고, 주제를 둘러싼 사회적 대화를 통해 다양한 결정을 내릴 수 있게 한다는 설명이다.

현재까지 약 50%는 서비스 약관 위반으로 표시된 내용을 포함하고 있으며, ML 시스템이 이를 잡아내고 있다. 아그라왈은 트위터가 계속해서 ML을 확장해 나쁜 내용을 알릴 것이라고 강조했다. 하지만 ML 시스템을 확장할 수 있도록 프로세스를 개발하고 정책 집행 자동화를 갖추는 데 시간이 걸린다.

아그라왈은 “자동화 시스템을 구축하지 못해 많은 오보를 놓친 것이 자랑스럽지 않다”고 말했다.
[AI & 산업] [VB 트랜스폼 2020] ①사례로 본 AI 기술과 자동화

[AI & 산업] [VB 트랜스폼 2020] ③사례로 본 '에지&컴퓨터 비전 AI'

키워드 관련기사
  • MS 애저로 英 SC은행 '디지털 트랜스포메이션' 앞당겨