코로나19 팬데믹이 전 세계를 휩쓸고 있는 가운데서도 인공지능(AI) 기술에 대한 관심이 뜨겁다. 미국 IT전문매체인 벤처비트는 15일(현지시간)부터 17일까지 주요기업과 AI를 주제로 다양한 사례와 연구내용을 공유하는 워크숍 'VB 트랜스폼 2020'을 온ㆍ오프라인에서 동시에 개최하는 하이브리드 행사로 진행했다.

첫날은 'AI 기술과 자동화'가 주제였다. 다양한 업계 대표와 온라인으로 AI, 오토MNL, RPA 등 다양한 의제를 놓고 평소 생각을 나눴다. 

          < 첫날 세미나 영상 >

◇ AI 프로젝트를 확장할 때 미래를 예측하려 하지 마라

기업용 AI 솔루션 기업 데이터이쿠의 커트 무어멜은 기업이 AI 프로젝트를 확장하려면 광범위하고 포괄적인 조직을 만드는 것이 가장 좋다고 조언했다. 규모에 맞게 데이터 과학자와 머신러닝 엔지니어 및 비즈니스 분석가, 마케팅 담당자, 작업장 기술자 등을 고루 갖춰야 한다는 얘기다.

또 코드 또는 시각적인 인터페이스를 통해 팀 구성원이 AI 도구를 가장 적합하게 사용하게 하려면 데이터를 공개해 더 많은 직원이 동일한 데이터에 접근할 수 있도록 해야 한다고 강조했다. 

그는 2012년 AI 기술을 도입한 글로벌 제약 회사를 예로 들었다. 초기에 필요한 데이터를 파악ㆍ공개하고, 광범위하게 확장함으로써 병렬로 실행하고 있는 서로 다른 프로젝트 3000개와 데이터셋 수십만개를 공유해 성공사례를 만들었다는 것이다.

이렇게 규모를 확장한 후에는 임베딩이 중요하다고 언급했다. 그는 "결국 목표는 모든 것을 포함시키는 것이니 분석을 포함해 AI 프로세스를 애플리케이션, 대시보드, 조직 전체에 직접 포함시켜야 한다"면서 "그래야 데이터를 사용하는 모든 사람이 필요한 데이터에 접근해 작업할 수 있다"고 설명했다.

찰스 엘칸 골드만삭스 ML 책임자가 기술을 설명하는 모습(사진=벤처 비트 유튜브 채널)
찰스 엘칸 골드만삭스 ML 책임자(사진=벤처 비트 유튜브 채널)

◇ AI 툴은 금융에 잠재력을 가지고 있다

"대량의 데이터를 기반으로 AI로 실행 가능한 지침을 제공할 수 있습니다."

찰스 엘칸 골드만삭스 머신러닝(ML) 책임자는 금융권에서 사용하는 AI에 대한 구체적인 지침을 발표했다.

그는 프로덕트 매니져(PM)로써 사용자 입장에서 개발자와 대화한 뒤 개발자 입장에서 사용자와 대화하는 방식으로 일을 한다고 소개했다. 

최종 개발 단계에서 PM은 ML솔루션의 어떤 기능이 기업에 유용할지 결정하고, ML에 유용한 품질과 데이터를 구축해야 한다는 설명이다. 

또 솔루션의 대기 시간, 처리 작업량, 시스템 요구 사항 수준을 정량화해야 하고, UI설계를 지원하고 지속적인 사용을 위해 보호 난간을 작성하고 모니터링 해야 한다는 설명도 덧붙였다.

리치로스 커먼스피릿헬스 임원(사진=벤처비트 유튜브 채널)
리치로스 커먼스피릿헬스 임원(사진=벤처비트 유튜브 채널)

◇코로나19 바이러스가 헬스케어 AI 영상 재구축에 어떤 도움을 주었나

미국에서 규모가 가장 큰 비영리 의료 단체 '커먼스피릿헬스'의 임원 리치로스가 코로나19 치료에 도움을 주고 있는 AI 사례를 발표했다. 

그는 AI를 사용해 치료의 우선순위를 정할 수 있다고 했다. 예를들어 병원 직원에게 '4호실보다 7호실로 먼저 가라'고 말하는 것이다. 이는 AI가 환자를 분석해 7호실 환자를 적시에 치료하도록 도와 장기화를 막는 것이다. 로스 박사는 "AI는 진료 시간을 단축해 주고 어떤 데이터가 중요한지에 대한 임상적 조언을 명확하게 보여준다"고 말했다.

센서 데이터를 연결한 흡입기도 설명했다. 특히 어린이 환자의 흡입기 사용 장소, 시기, 빈도 등을 추적하는 것이 어려운데 센서 데이터 흡입기를 사용하면 이를 파악하기 쉽다는 내용이다.  

리치 로스 박사는 "AI의 역할은 코로나19 바이러스 치료에 매우 중요하다"면서 "AI는 매우 다양한 치료 요소를 넘나들 수 있다"고 말했다. 또 "데이터가 간병인, 사회복지사, 가족에게 치료에 도움을 주는 정보를 줄 수 있다"고 덧붙였다.

멜리사 맥셰리 Visa 수석 부사장
멜리사 맥셰리 Visa 수석 부사장(사진=벤처비트 유튜브 채널)

◇Visa가 데이터 및 AI를 활용하여 250억 달러의 부정 행위를 방지하는 방법

AI와 ML의 실용화에 있어서 금융권이 프로젝트를 주도해 왔다. AI 투자 수익률이 큰 기업 중엔 Visa가 있다.

비자의 수석 부사장이자 글로벌 데이터 책임자 멜리사 맥셰리는 회사가 개발한 AI 덕분에 연간 250억 달러의 사기를 막을 수 있다고 말했다. 맥셰리는 "AI를 위해서 AI를 배치하지 않는다"며"문제를 해결하는 가장 효과적인 방법이기 때문에 배치한다"고 말했다.

주요 AI 활용 분야는 Visa 고급 인증 플랫폼이다. VAA가 네트워크를 가로지르는 모든 거래에 점수화 하고 사기일 가능성에 기초해 등급을 매긴다고 설명했다. 이 시스템은 좋은 거래와 나쁜 거래의 분리를 개선해 승인 시간을 단축 한다.

이 시스템은 1993년에 처음 구축한 부정행위 탐지 서비스의 진화를 보여준다. 오늘날 이 시스템은 순환신경망(RNN)을 사용한다. 맥셰리는 사기를 감지해 Visa가 AI와 ML이 서비스 개선에 어떻게 도움이 될 수 있는지에 집중할 수 있었다고 말했다.

이러한 도구를 어떻게 구현하는지도 중요하다고 말했다. Visa의 경우 대기시간이 늘어나지 않도록 주요 거래처리망 외부의 시스템에 새로운 AI와 ML 툴을 레이어드 방식으로 도입한다고 설명했다.

또 이 시스템은 밀리초 안에 채점해야 하기 때문에 네트워크에 들어가는 모든 트랜잭션의 점수를 실시간으로 채점한다고 말했다.

맥셰리는 "Visa는 AI와 ML을 활용해 최소 20~30%의 효율성을 높여줄  수 있는 방법을 지속적으로 연구하고 있다"고 밝혔다. 

제드 도허티 다카이쿠 부사장, 제이미 델랑헤 슬랙 제품 담당 이사, 디미트리 세센시즈 골드만삭스 수석 정량 연구자,왕 후이 페이팔 부사장, 제이콥 윌슨 PwC(사진=벤처비트 유튜브 채널)

◇Transform Session 전문가 패널이 논의해본 ‘올바른 데이터’ 

데이터는 AI와 ML의 핵심 기반이다. 데이터 유형 및 값에 따라 AI와 ML의 연산 결과값은 크게 달라질 수 있다. 올바른 AIㆍML 연산을 위해 올바른 데이터가 중요하다.
이에 Transform Session2020는 AIㆍ데이터 분야 전문가 패널을 초대해 ‘올바른 데이터’란 무엇인지 논의했다. 또 데이터를 어떤 방식으로 식별ㆍ분석하고 있는지 들어봤다.

패널로 제드 도허티 다카이쿠 부사장과 제이미 델랑헤 슬랙 제품 담당 이사, 왕 후이 페이팔 부사장, 디미트리 세센시즈 골드만삭스 수석 정량 연구자가 참석했다.

더거티는 데이터 라벨링을 강조했다. 그는 "우리는 AI의 새로운 예측 알고리즘을 자주 논의하고 있다"면서 "데이터의 주기적 경향을 파악해 수정하고 데이터 라벨을 정확하게 표시하도록 한다"고 말했다.

델랑헤는 자신의 팀이 주로 검색 맥락(Context of Search)에서 행동 데이터를 검토한다고 설명했다.
그는 “사용자의 행동이 실제로 무엇을 의미하는지 이해하는 데 꽤 복잡할 수 있다”며, “우리는 이 같은 모호함을 퇴치하는 데 초점을 맞추고 있다”고 전했다. 이어 “전통적인 문자 기능뿐 아니라 행동적 특징이나 메시지의 다른 속성을 바탕으로 예측하려고 한다”고 덧붙였다. 

세센시즈는 “데이터는 자주 비정상적이다”라며 “데이터 과적합 위험이 발생해 모델링 오류가 발생할 수 있다”고 조언했다. 과적합(Overfitting)은 ML에서 데이터 학습을 너무 과하게 수행하는 현상이다. 
보통 학습 대상 데이터는 실제 데이터의 일부다. 과적합이 일어나면, 학습 데이터 오차는 감소하지만 실제 사례에 적용할 경우 오차가 증가하는 문제가 있다.

저스틴 노만 Yelp (사진=벤처비트 유튜브 채널)
저스틴 노만 Yelp (사진=벤처비트 유튜브 채널)

◇Yelp: Bunsen은 우리가 규모에 맞게 제품을 테스트할 수 있도록 해준다.

지역 검색 서비스 옐프는 새로운 기능이 주요 비즈니스 지표와 일치할 수 있도록 다양한 실험을 수행한다. 이 회사는 이 같은 실험 결과를 개시ㆍ관리ㆍ분석할 수 있도록 독점 플랫폼 ‘분센’을 이용한다.

15일 트랜스포메이션 2020 정상회의에서 저스틴 노먼 옐프 데이터과학 책임자는 분센의 필요성을 설명했다. 기존 옐프 엔지니어는 다양한 실험을 직접 담당했는데, 서로 다른 버전 제품 성능을 비교할 수 있도록 사용자 정의 코드를 작성해야 하기 때문이다. 

하지만 옐프는 회사가 성장하며 이 방법의 비효율성을 느꼈다.  이에 2018년 옐프는 엔지니어 실험 도구 및 공정을 단일 솔루션으로 통합한 ‘분센’을 만들었다. 

현재까지 옐프가 생산하는 제품과 AIㆍML 기술은 모두 분센 플랫폼을 거친다. 총 700개 이상의 실험을 한 번에 진행한다. 분센은 옐프의 고객층 중 규모가 크면서 세분화된 부분을 실험하는 데 도움을 준다.

분센 기능 중 ‘스코어 카드’는 실험 결과 분석을 쉽게 하고, 분센 실험 분석 도구 ‘BEAT’는 기초적 통계 모델을 패키징한다. 사용자 행동을 추적하고 AIㆍML 모델 로깅 시스템도 있다. 

저스틴 노먼 옐프 데이터 과학 책임자는 "분센을 배치 및 테스트 도구로 활용해 제품과 모델이 비즈니스 메트릭스 성장에 부정적인 영향을 미치는지를 확인할 수 있다”며 “실제로 우리가 달성하기로 결정한 목표를 충족할 수 있는지도 판단할 수 있다"고 말했다. 
 

◇170년간 쉬운 길을 걸은 화이자, 집단지성 갖춘 기업으로 변모

크리스 카카낫 화이자 데이터부문 상무는 정보 공유가 막혀 있는 유형의 사일로(silo) 조직 내부 벽을 허물고 하부조직들을 협력적으로 통합한다는 회사 목표를 위해 관련 업무를 10년 이상 했다.
머신러닝과 데이터과학의 발전으로 인해 화이자만의 목표가 아니라 모든 기업의 목표가 됐다.
미국 기술전문 매체 벤처비트의 콘퍼런스인 ‘트랜스폼 2020’에서 카카낫은 다음과 같은 내용을 공유했다. 170년간 문제의 본질을 해결하는 대신 손쉬운 해결책을 고수했던 화이자가 조직 전반에 걸쳐 어떻게 집단 지성을 덧입혔는지를 설명했다. 이 비전을 달성하는 방법론을 세 영역으로 나눌 수 있다.
첫 번째 과제는 전 세계 동료들이 데이터 세트 학습을 끝마칠 수 있도록 ‘어떻게’ 권한을 주는 지를 굉장히 많이 강조 했다. 기술 능력과 관계 없이 조직 내부 데이터에 접속하고 내용을 편집할 수 있도록 모든 기능을 사용하기 위해서는 조직내 ‘병목 현상’을 제거해야 한다.  
사일로를 없애는 단계이기도 한 두 번째 과제는 다른 분야의 사업 동료와 교류하는 방식을 바꾸라는 것이다. 신종 코로나 감염증(코로나19) 발발 전에는 사람들을 한 공간에서 실시간으로 의사결정을 하기 위해 데이터분석을 했으나, 이제는 비대면으로 동료에게 “데이터 흐름을 살펴보고 있습니까? 요청하셨던 데이터 측정 방법들 전달 드립니다”고 언택트로 소통할 수 있다. 

앞의 두 과제들의 근간이 되는 세 번째 과제는 신속성과 더 현명한 결정을 내리기 위해 AI와 ML을 활용하는 것이다. 단, 모든 프로젝트에 머신러닝과 AI를 이용하려고 하지는 마라.  

이온 스토이카 UC 버클리 교수(사진=벤처비트 유튜브 채널)
이온 스토이카 UC 버클리 교수(사진=벤처비트 유튜브 채널)

◇지도형 기계학습이 강화학습보다 왜 더 일반적인가? 

지도형 기계학습은 강화학습보다 더 일반적으로 사용되는 머신러닝 유형이다. 지도형 기계학습이 더 빠르고, 저렴한 기계 학습 형태이기 때문이다. 

이온 스토이카 UC버클리 교수는 “서비스 사용자가 데이터 세트를 사용하면 지도형 기계학습 모델을 입출력에 덧입혀서 이미지인식 또는 기계번역 모델을 만들 수 있다”며 “강화학습 알고리즘 유형의 경우 지속적으로 관찰해야 하며 시간이 걸릴 수 있다”고 말했다. 스토이카 교수는 UC버클리의 라이즈 연구소에서 로봇 공학과 강화학습을 연구하고 있다. 

강화 학습은 기계 학습의 하위 분야이다. 강화 학습에서는 보상을 극대화하기 위한 방법을 배우는 AI에이전트가 등장한다. AI에이전트가 보상요건을 달성하면 서비스 사용자는 AI에이전트가 따라야 할 규칙을 강화할 수 있다. 딥마인드 알파 고와 스타 크래프트 2를 하는 알파 베타와 같은 게임을 즐기는 AI가 대표적인 AI에이전트다.

강화 학습은 언어 모델을 설계하거나 심지어 세금 정책을 만들기 위해 제조업과 같은 분야에도 적용된다. 스토이카 교수는 강화 학습을 위한 ‘레이 프레임워크’를 만들었다. 
그는 머신러닝 알고리즘을 확장하고 싶어서 레이 프레임워크를 만들었다고 한다. 

레이 프레임워크로 분산 학습을 시작했을 때, 스토이카 연구진은 강화 학습에 집중하기 시작했다. 그는 “왜냐하면 이것은 매우 장래성이 있을 뿐만 아니라매우 어려운 작업이기 때문입니다"고 말했다.

 

[AI & 산업] [VB 트랜스폼 2020] ②사례로 본 대화형 AI

[AI & 산업] [VB 트랜스폼 2020] ③사례로 본 '에지&컴퓨터 비전 AI'

키워드 관련기사
  • LG유플러스, AI·빅데이터 역량 강화 위해 클라우드 전문가 양성