인공지능(AI) 기술의 기초와 기본개념을 쉽게 알려주는 'AI 설명서'가 나왔다.

미국 첨단매체 벤처비트는 구글이 옥스포드 인터넷연구소(OII)와 협력해 AI가 무엇인지 알려주는 AI 설명서 'A-Z of AI' 포털을 개설했다고 25(현지시간)일 전했다.

구글과 옥스포드대가 공개한 AI 설명서 'A-Z of AI'
구글과 옥스포드대가 공개한 AI 설명서 'A-Z of AI'

A-Z of AI 가이드에는 기후 과학과 윤리, 기계 학습, 생성적 대립 신경망(GAN : Generative Adversarial Network) 등 26개 주제에서 AI가 어떻게 활용되는지를 다뤘다. 구글의 피플 앤 AI 리서치팀(PAIR)이 지나 네프 OII 부교수 연구팀과 협력해 AI의 역할을 이해하는 데 중요한 역할을 했다고 느끼는 주제를 선정해 제작했다.

구글은 설명서 가이드 FAQ 섹션에 "선정한 26개 주제는 완벽하진 않지만, 초심자들이 출발하기에 좋을 것"이라며 "AI에 대한 기술적인 이해와 사용 사례, 사회적 의미 및 윤리적 고려사항 등에 걸쳐 신중히 주제를 선택했다"고 전했다.

다음은 ‘A-Z of AI’ 전문.

A: Artificial intelligence(인공지능)

AI의 핵심은 배우고 적응하는 컴퓨터 프로그래밍이다. 인공지능은 지적인 인간의 행동을 흉내내도록 가르치는 컴퓨터 시스템에도 붙여진 이름이다. 보드게임을 하고 언어를 번역하는 법을 가르치는 프로그램에서부터 인간다운 대화를 나누고 주식시장을 분석하거나 건강상태를 진단하는 데 도움을 줄 수 있는 복잡한 시스템에 이르기까지 모든 것을 말한다.

B : Bias(편견)

불완전한 데이터는 AI를 편견으로 이끌 수 있다. AI 시스템의 결과는 현실 세계에서 발견되는 기존 편견의 영향을 받을 수 있다. 일반적으로, AI는 학습하기 위해 주어진 데이터가 완전히 포괄적이지 않을 때 편견을 형성한다. 따라서 특정 결과로 이어지기 시작한다. 데이터는 AI 시스템의 유일한 학습 수단이기 때문에 기존 정보 내에서 발견된 불균형이나 편견을 재현할 수 있다.

C : Climate(기후)

AI는 지구 기후 문제에 대처하는 데 이용되고 있다. 전 세계 사람들은 지구가 직면하고 있는 전례 없는 위기를 해결하기 위해 AI를 이용한다. 기후 변화를 모니터링하려면 광범위하고 지속적으로 진화하는 데이터셋이 필요하다. AI 시스템은 환경 정보를 수집ㆍ분석하고, 기후 조건의 실시간 변화를 추적하며, 비효율성을 줄여 인류가 지구에 긍정적인 영향을 미칠 수 있는 해결책을 더 빨리 찾을 수 있도록 도와준다.

D : Datasets(데이터셋)

정보는 AI에게 세계를 가르치기 위해 사용됐다. 데이터셋은 AI 훈련을 위해 사용되는 대규모 디지털 정보 모음이다. 데이터셋은 기압과 온도 등 날씨 데이터에서부터 사진과 음악처럼 AI 시스템이 주어진 임무를 수행하는 데 도움이 되는 다른 어떤 정보도 포함된다.

데이터셋은 컴퓨터용 교과서다. 아이가 예를 통해 배우듯이 기계도 마찬가지다. 데이터셋은 기계 학습 과정의 기초가 된다.

E : Ethics(윤리)

AI의 구축 및 활용 방법을 규정하는 지침이다. 사회를 지배하는 윤리적 규범과 법률처럼 윤리적 지침은 AI가 발전하는 방식을 형성하는 데 도움을 준다. 따라서 행동 규범과 지침은 AI 사용의 문제점을 보완하는데 도움을 줄 수 있다.

AI는 다양한 윤리적 고려를 가져왔다. 게다가 일부 AI 시스템들은 계산이 너무 복잡해 인간이 어떻게 생산량에 도달했는지 확인하기가 쉽지 않을 수도 있다. 이처럼, 사회는 AI를 배정하는 것이 불편할 수 있다. 일부 기업들은 AI 프로젝트를 지도하는 윤리적 틀을 지속적으로 점검ㆍ개정하고 있으며, AI 윤리 탐구를 위해 지역사회는 발전하는 기술과 함께 새로운 대화를 열어 나가고 있다.

F : Fakes(가짜)

AI를 이용해 만든 가짜 영상, 오디오, 비디오가 있다. AI는 초현실적인 '딥페이크' 기술로 이미지와 음성, 음악, 비디오 등을 만드는 새로운 방법을 찾아냈다. 딥페이크는 실생활의 이미지나 오디오를 연구해 상세히 매핑한 후, 이를 조작해 당황스러울 정도로 진실된 픽션 작품을 만들어낸다.

이 기술은 할리우드 영화의 CG부터 음악 제작과 포르노에 이르기까지 모든 면에서 매우 다양한 응용 프로그램을 제작했다. 대부분 많은 사람들의 재미를 위해 제작되지만, 이를 부적절하게 사용하면 사회에 해로울 수 있는 잘못된 정보를 만들어낼 수 있다.

G : GAN(생성적 대립 신경망)

서로 경쟁하면서 배우는 두 개의 AI 시스템을 말한다. GAN(Generative riverical networks)은 한 시스템이 단독으로 작동하는 것보다 더 빨리 콘텐츠를 만들고 작업을 수행하도록 훈련된 AI 시스템 쌍이다.

피카소의 예술적 스타일에 영감을 받은 이미지를 만들어낸다고 상상해 보라. AI 디자인팀은 피카소의 모든 그림들을 모아 그의 작품을 독특하게 만드는 색깔과 특징, 개별 붓글씨를 찾기 위해 GAN을 훈련시킬 수 있었다.

한 AI 시스템은 피카소의 작품을 모방하려고 시도하는 반면 다른 AI 시스템은 피카소의 시도를 판단한다. 그림을 모방하는 AI는 피카소 스타일의 수천 개 이미지를 만드는 데 지식을 적용하고, 다른 AI 시스템은 이 작품들이 피카소의 스타일과 얼마나 유사한지 판단하고 등급을 매긴다.

H : Human- in-the-loop(인간 참여형)

휴먼 인 더 루프(Human-in-the-loop)는 AI 시스템을 훈련, 테스트 또는 튜닝하여 보다 신뢰할 수 있는 결과를 도출하도록 돕는다.

해양 생물을 식별하기 위해 가르치는 시스템은 문어의 독특한 모양 때문에 다른 생물과 문어를 빨리 구별하는 법을 배울 수 있지만, 유사한 모양을 가진 물고기의 차이를 구별하는데 어려움을 겪을 수 있다. 휴먼 인 더 루프(Human-in-the-loop)는 시스템에 개입해 주의할 특징을 구분하고 보다 정확한 답을 유도하도록 시스템을 가르칠 수 있다.

I : Image recognition(이미지 인식)

이미지 인식은 AI가 우리 주변 세계의 물체를 인식하고 분류할 수 있게 하는 기술이다. '컴퓨터 미래'로 알려진 이미지 인식 시스템은 제공되는 다양한 기준 이미지를 연구함으로써 각각의 개인부터 유명한 랜드마크, 심지어 애완동물까지 모든 것을 AI가 인식하도록 가르칠 수 있다.

예를 들어, 이 시스템은 여행 후 자동으로 휴가 사진을 위한 새 앨범을 제안하는 것과 같은 일상적인 일에 도움을 줄 수 있다.

J : Journalism(저널리즘)

기자들은 뉴스 산업을 변화시키기 위해 AI를 이용하고 있다. 뉴스룸의 경우 실시간으로 데이터 볼륨을 처리할 수 있는 AI 시스템이 유용한 툴이다. 전 세계 기자들은 AI가 어떻게 뉴스 출처를 감시하고, 정보를 정리하며, 예상치 못한 연결고리를 찾는 등을 탐구하고 있다.

K : Knowledge(지식)

AI 시스템은 인간과 근본적으로 다른 방식으로 지식을 쌓는다. AI가 획득하는 지식은 인간이 일생 동안 발전하는 복잡한 지식과는 매우 다르다.

인간은 주변의 모든 것을 문맥화하기 위해 자동적으로 지난 경험을 끌어냄으로써 세상을 이해한다. 그러나 AI 시스템에는 요구할 수 있는 배경 지식이나 본능이 없다.

AI 시스템이 경험을 쌓을 수 있도록, 조직된 데이터 형태의 광범위한 정보를 상호 참조하고 분석하는 방법을 분명히 가르쳐야 한다. 그들이 배울 수 있는 것에는 AI 디자인팀이 제시한 매개변수에 따라 결정된다..

L : Learning(학습)

여러 방법들이 AI를 가르치기 위해 사용됐다. AI 설계팀이 기계학습 시스템을 훈련시키기 위해 사용하는 가장 일반적인 두 가지 기법은 지도 및 비지도 학습이다.

지도 학습은 AI가 새로운 데이터에서 유사한 패턴을 찾는 데 사용할 수 있는 참조 데이터를 받는다. AI는 시행착오라는 반복 과정을 통해 배운다.

비지도 학습은 AI가 개발자들에 의해 면밀히 관찰되지만, AI 스스로 데이터 자체에서 관계를 찾는 법을 배울 수 있다. 어떤 과일인지 말하지 않고도 다양한 과일들의 시스템 이미지를 보여줄 수 있고 그것들 사이의 유사점과 차이점을 찾도록 요구할 수 있다.

M : Machine Learning(기계 학습)

AI가 데이터와 경험을 통해 스스로 배운다. 기계학습은 AI 시스템이 일련의 해답을 미리 프로그래밍하는 것이 아니라 자신만의 해결책을 제시할 수 있게 한다.

전통적인 프로그래밍에서, 당신이 컴퓨터에게 고양이를 그리는 법을 가르치고 싶다면, 여러분은 그림 그리는 과정을 정밀하게 설명해야한다. 하지만 기계 학습을 이용해 당신은 AI 시스템에 수천 개의 고양이 스케치를 주입, 컴퓨터가 스스로 분석해 패턴을 찾도록 한다.

N : Neural networks(신경망)

AI는 인간의 뇌에서 영감을 얻었다. 신경망은 전통적인 AI와는 다른 종류의 학습을 가능하게 한다.

인간의 생각에서 영감을 받지만, 매우 다른 것이다. 신경망은 하나의 팀으로 작용하는 정보 처리집합체로 구성돼 있다. 이들 사이에 뉴런이 뇌 안에서 하는 방식과 유사한 정보를 전달한다. 이러한 네트워크는 기존의 프로그래밍이 처리할 수 있는 것보다 더 복잡하고 세부적인 문제를 해결할 수 있다.

O : Open source(오픈 소스)

오픈 소스란 코드나 프로그램 등이 누구와도 자유롭게 공유 가능한 것을 의미한다. 이러한 관행은 소프트웨어 개발에서 흔히 볼 수 있다. 누구나 기존의 코드와 데이터, 연구 등을 다운로드하거나 연구하며 학습할 수 있다. 자신의 프로그램 문제에 적응하고, 원하는 방식으로 새로운 변형을 만들 수 있다.

오픈 소스는 효과적인 시스템을 구축하기 위해 아이디어를 공유하고 개발하는 모든 것이다.

P : Predictions(예측)

컴퓨터 과학자들은 미래와 뚜렷한 관계가 없을 때에도 종종 AI 시스템의 출력을 예측이라고 언급한다. 예를 들어 AI가 권하는 책은 마음에 들 것이라는 예측이다.

예측 시스템은 이전의 취향을 바탕으로 당신이 좋아할 만한 영화나 비디오를 제안하거나, 이전의 기후 패턴을 조사해 일기 예보의 정확성을 높이는 것을 말한다.

예측 시스템은 오늘날 사회 어디에나 나타난다.

Q : Quantum computing(양자 컴퓨팅)

양자컴퓨터는 기존 컴퓨터로 처리하기에 오랜 시간이 걸리는 문제를 해결하기 위해 AI를 사용할 수 있는 가능성을 가진 새로운 기계의 물결이다.

양자 컴퓨터는 현재 AI 시스템에 전력을 공급하는 컴퓨터와 전혀 다른 방식으로 정보를 처리한다. 기존의 컴퓨터는 정보를 0 또는 1(이진법)의 연속으로 처리하는 반면, 양자 컴퓨터는 0과 1을 동시에 사용할 수 있다.

R : Robotics(로봇 공학)

로봇 전문가들은 로봇으로 알려진 프로그램 가능한 기계를 만드는데 전념하고 있다. 오늘날, AI는 로봇들이 새롭고 많은 일을 할 수 있게 해주고 있다. 엘리베이터에서 세탁기, 자동 진공 청소기, 공장 생산 라인의 거대한 기계 팔 등이 대표적이다. '로봇'이라는 용어는 디지털 활동을 자동화하는 데 이용하는 소프트웨어의 일부를 포함한다. 단순히 육체 노동만을 '봇'이라고 부르는 것이 아니다.

역사적으로 로봇은 사람들의 작업 부하를 완화하기 위해 기본적인 활동을 수행하도록 설계됐다. AI의 도입으로 로봇은 이전에 자동화하기 어려웠던 작업을 즉각적으로 분석하고 탐색할 수 있게 됐다.

S : Speech recognition(음성 인식)

음성 인식 시스템은 인간이 말하고 있는 것을 인식하도록 훈련됐다. 이 시스템은 받아쓰기 소프트웨어부터 언어 번역 도구, 음성 작동 스마트 스피커에 이르기까지 모든 것의 중심 역할을 한다.

T : Turing test(튜링 테스트)

튜링 테스트는 간단한 전제가 있다. 인간이 기계와 대화하고 있다는 것을 깨닫지 못한 채, 5분 동안 대화를 나눌 수 있다면 컴퓨터는 테스트를 통과한 것이다.

1950년 컴퓨터 과학자 앨런 튜링(Alan Turing)이 발명한 이 실험은 기계가 인간의 사고를 흉내 내는 것이 가능한지 물음으로써 현재 우리가 AI라고 부르는 것의 기초를 닦았다.

U : Uses(사용)

AI는 연구실을 벗어나 일상 생활로 빠르게 진입하고 있다. 우리 집의 스마트 스피커에서 우주 탐험과 농업에 이르기까지, 이러한 AI 시스템은 컴퓨팅의 힘을 이용해 인간의 능력을 증강시키고 있다.

V : Virtual assistants(가상 도우미)

가상 조수는 명령과 질문에 응답하는 AI의 보편적인 사용이다. 가상 도우미는 본질적으로 인간의 조수를 디지털로 받아들이는 것이다. 가장 잘 알려진 예는 사람들이 스마트폰과 스마트 스피커를 이용해 말하는 음성 비서들이다. 매일, 이 보조자들은 사람들이 온라인에서 정보를 검색하는 등 기본적인 질문에 답하는 것을 돕는다.

W : Watson(왓슨)

2011년 IBM은 두 사람에게 미국 퀴즈쇼 '제퍼디!' 게임에 도전하는 AI 시스템을 만들어 승리한 바 있다. 왓슨은 수백만 권의 책, 사전, 백과사전의 내용에 근거하여 그 답을 만들었다.

왓슨은 제퍼디의 독특한 구조를 배웠다. 왓슨은 이전에 나온 질문들을 찾아 1초 안에 새로운 질문에 대한 답을 찾을 수 있는 방법을 개발했다. 프로그래머들은 AI가 콘텐츠 내에서 키워드를 검색하는 것뿐만 아니라 키워드 주변의 문장을 분석하고 해독하도록 훈련시켰다. 그렇게 하면, 왓슨은 '차'가 단지 음료수일 뿐만 아니라 1940년대의 옷의 한 종류라는 것을 알아내기 위해 서로 다른 문맥적 출처를 상호 참조할 수 있다.

X : X-ray(X-선)

현재 많은 방사선 전문의들은 X선을 연구하며, 사람들의 질병을 더 빠르고 정확하게 진단하기 위해 AI로 작동되는 도구를 사용하고 있다. 생체검사에서 암세포를 찾거나 뇌 스캔으로 알츠하이머의 징후를 찾는 등 이미지에 대한 검토를 바탕으로 환자를 진단하는 의사라면, 누구나 AI를 이용해 일을 효율적으로 수행할 수 있다.

Y : You(당신)

기계에게 인간이 무엇을 의미하는지를 가르치는 것은 불가능하다. 전 세계의 모든 데이터를 AI 시스템에 제공할 수 있지만, 그것은 여전히 지구상의 모든 인간을 반영하지 못할 것이다. 인간은 기계가 사물을 이해하는데 사용하는 2차원 데이터의 영역 밖에 있는 다차원적인 존재다.

AI 시스템은 인간에 의해 훈련되며, AI를 만드는 개발자와 프로그래머로부터 이를 사용하는 개인에 이르기까지 지도받는다.

Z : Zeros & ones(이진법)

0s와 1s(이진법)는 컴퓨터의 기본 언어다. 바이너리 코드로 알려진 이것은 AI 시스템이 정보를 처리하는 수단이다.

예를 들어 점자는 시각장애인들에게 정보를 전달하기 위해 상승된 범프와 역방향 범프의 패턴을 사용한다. 모스 코드는 일련의 길고 짧은 신호를 사용한다. 컴퓨터가 하는 모든 것은 정보를 전송하기 위해 함께 배열될 수 있는 0s와 1s로 변환된다.

01001000 01100101 01101100 01101100 01101100 011011 00100001은 당신에게 별 의미 없을 수 있지만, 이 이진 시퀀스는 "안녕"을 의미한다.