인공 신경망, AI 시스템 내부에서 핵심 역할 수행
사람의 뇌 작동 방식 모방...RNN은 글씨·음성 인식, CNN은 얼굴 인식 담당
기술 복잡해 접근 어려웠던 인공 신경망, 지금은 다양한 분야서 기술 활용
신경망 프레임워크 개발로 다양한 제품에서 고수준 AI 가능

요즘에는 어디를 가든 인공지능(AI)이 화제의 중심으로 떠오르고 있다. AI는 사회 전반에 근본적인 변화를 가져오고 있으며 알게 모르게 생활 곳곳에 사용되고 있다. AI 시스템의 내부를 들여다보면 인공 신경망(artificial neural network, ANN)이 핵심을 이룬다는 것을 알 수 있다.

인공 신경망이란?

인공 신경망은 생물학적 신경망으로서 사람의 뇌가 작동하는 방식을 모방한 것이다. 사람의 신경계는 뉴런이라는 특수 세포가 신경 자극을 운반하고, 축삭돌기가 세포체에서 다른 세포들로 뉴런을 전달하고, 가지돌기가 가지 모양으로 다수의 세포들을 연결한다. 뉴런이 시냅스에 입력으로서 작용한다. 시냅스는 세포들 사이를 연결한다. 시각 뉴런이나 피부 뉴런 같은 외부 자극에 따라서 시냅스들이 연결되고, 이러한 연결이 학습을 가능하게 한다.

생물학적 신경망. (사진=마우저 일렉트로닉스)
생물학적 신경망. (사진=마우저 일렉트로닉스)

ANN은 생물학적 구조를 모방해서 뉴런 입력으로서 연산 장치를 사용하고 시냅스 연결 강도를 지시하는 가중치를 부여한다. 각각의 입력으로 부여되는 가중치를 조절해서 학습이 일어난다. 사람의 뇌와 마찬가지로 ANN도 배우는 과정이 필요하다.

이 프로세스를 '학습(training)'이라고 한다. 학습을 위해서 신경망으로 일련의 입력 및 출력 쌍을 노출시킨다. 이것은 예를 들어서 컴퓨터 비전 애플리케이션으로 수백 개의 동물 사진(입력)과 각 사진에 해당하는 동물 이름(출력)일 수 있다.

학습 프로세스는 가중치를 조절해서 특정한 동물 사진으로 신경망의 예측 결과가 높게 나오도록 만든다. 높은 예측 결과를 달성하기 위해서는 각 동물 유형마다 대량의 사진을 사용해서 신경망을 학습시켜야 한다. 이 방법으로 신경망이 처음 보는 사진을 접했을 때 그 사진이 어떤 동물인지를 높은 정확도로 예측할 수 있다. 인공 신경망이 이렇게 식별하는 것을 추론(inference)이라고 한다.

인공 신경망의 수학적 해석. (사진=마우저 일렉트로닉스)
인공 신경망의 수학적 해석. (사진=마우저 일렉트로닉스)

순환 신경망(RNN)과 컨볼루션 신경망(CNN)

인공 신경망 아키텍처는 여러 종류가 있으며, 사람의 뇌가 부위별로 다른 역할을 하듯 저마다 다른 용도에 적합하다. 순환 신경망(RNN)과 컨볼루션 신경망(CNN)은 가장 널리 사용되는 두 가지 신경망 아키텍처이다.

손글씨 인식이나 음성 인식에 적합한 RNN은 연속된 여러 레이어들로 이루어진 노드 아키텍처를 사용한다. RNN은 영어에서 독일어로 번역하는 것과 같은 컴퓨터 번역에도 흔히 사용된다. 메시징 애플리케이션으로 메시지를 입력할 때 다음 단어를 예측해서 보여주는 것도 RNN을 사용한 것이다.

CNN은 컴퓨터 비전, 얼굴 인식, 차량 번호판 식별 같이 이미지를 해석하는 다양한 애플리케이션에 사용된다. 이 아키텍처는 동물의 시각 피질과 유사한 것으로서, 연속적이고 반복적인 안구 영역이 겹쳐져서 전체적인 시각적 이미지를 구축한다. 단일 입력 및 출력으로 다중 레이어 신경망이며 다수의 숨은 컨볼루션 레이어를 포함할 수 있다.

인공 신경망은 매우 복잡한 주제이며, 데이터 과학과 신경과학의 전문지식을 결합하고 있다. 기술의 복잡성 때문에 대부분의 상업적 애플리케이션으로는 접근하기가 어려웠으며 오래 동안 대학이나 연구 기관의 영역으로만 남아 있었다.

하지만 컴퓨팅 성능이 높아지고 커넥티비티가 보편화되고 소비자 요구가 높아짐에 따라서, 다양한 분야들로 신경망 기술을 활용할 수 있게 됐다.

신경망 프레임워크들이 개발됨으로써 머신 러닝 기반 애플리케이션을 좀더 수월하게 개발할 수 있게 되었으며 다양한 제품들에서 고수준 AI가 가능하게 됐다.

인공 신경망 개발을 위한 프레임워크

텐서플로우(TensorFlow)는 오픈 소스 소프트웨어 라이브러리 프레임워크로서, 원래는 구글(Google)이 자체적인 연구와 제품화 시스템에 사용하려고 개발한 것이었는데 2015년부터 공개적으로 사용할 수 있게 했다.

일련의 신경망 타입에 중점을 두고 있는 텐서플로우는 신경망을 개발하고 학습시키기 위해서 필요로 하는 포괄적인 라이브러리, 워크플로우, 모델, 툴을 제공한다.

파이썬(Python)에서부터 자바스크립트(JavaScript)까지 프로그래밍 언어들을 선택할 수 있으며, 중앙처리장치(CPU)에서부터 그래픽처리장치(GPU)까지 다양한 하드웨어 환경을 지원한다. 엣지 기반 추론을 위해서 안드로이드와 iOS 디바이스나 라즈베리 파이(Raspberry Pi) 같이 처리 성능이 낮은 디바이스로도 모델을 구축할 수 있다.

카페(Caffe)는 또다른 딥 러닝 프레임워크로서, 신경망 개발, 학습, 구축을 위해서 다양한 컴퓨팅 플랫폼 타입, 프로그래밍 언어, 기능을 지원한다. 버클리 대학에서 개발한 카페는 자체 웹사이트에서 다양한 코드 예제를 제공하며, 하루에 6천만 개 이상의 이미지를 처리함으로써 업계에서 가장 빠른 이미지 분류 CNN을 구현할 수 있는 것으로 알려져 있다.

생활 속에 스며든 신경망 애플리케이션

신경망은 우리 생활 곳곳에 쓰이고 있으며, 스마트폰과 스마트홈 디바이스에도 다수가 사용되고 있다. 하지만 이러한 디바이스들은 컴퓨팅 자원이 넉넉하지 않아서 재빨리 응답할 수 없으므로 추론을 위해서 클라우드에 의존한다. 그러므로 신뢰할 수 있는 무선 커넥티비티가 중요하다는 것을 알 수 있다.

향후 스마트폰 음성 비서에게 질문을 할 때는 우리 눈에 보이지 않는 장막 뒤에서 얼마나 복잡한 일들이 처리되고 있으며, 우리의 질문에 대답하기 위해서 신경망이 어떤 역할을 하는지 한번쯤 생각해 보길 바란다.

마크 패트릭(Mark Patrick) 마우저 일렉트로닉스 EMA 기술 마케팅 관리자 mark.patrick@mouser.com 

편집 : AI타임스 김동원 기자 goodtuna@aitimes.com

마우저 일렉트로닉스는 파트너사들의 신제품을 신속히 공급하는 반도체 및 전자부품 공인 유통기업이다. 세계적인 투자자 워렌 버핏이 소유한 버크셔 해서웨이의 계열사이기도 하다. 현재 1100개 이상의 제조사에서 생산되는 5백만 종 이상의 제품을 판매하고 있다. 전 세계에 27개 서비스 센터를 운영하면서 223개 이상 국가의 63만 명 이상 고객에게 상품과 서비스를 제공 중이다.

마크 패트릭은 마우저 일렉트로닉스에서 유럽·중동·아프리카(EMEA. Europe, Middle East, and Africa) 기술 마케팅 관리자로 근무하고 있다. EMEA 지역에서 기술 콘텐츠의 개발과 유통을 담당하고 있다.

[관련기사] [박정현의 데이터사이언스 시작하기] ⑧ 알고리즘 (2) - 분류

[관련기사] 글 쓰는 상상만으로 글쓰기 가능하다 ...AI기반 텍스트 변환 장치 개발

키워드 관련기사
  • 인간보다 효율 93% 좋은 '인공 시냅스' 개발…더 가까워진 '뉴로모픽 컴퓨터'
  • 의료 인공지능에 숨은 편향 데이터를 지워라
  • ‘차원의 저주’를 경계하라...효율적 알고리즘 구축 위한 ‘차원 축소’란 무엇일까?