머신러닝에 대해 잘못 알고 있는 5가지
상태바
머신러닝에 대해 잘못 알고 있는 5가지
  • 입력 2020-05-18 16:44
  • 댓글 0
이 기사를 공유합니다

인공지능(AI)과 머신러닝(ML)은 떼려야 뗄 수 없는 관계다. 인공지능이 미래를 여는 핵심기술로 각광받는 데에는 머신러닝의 역할이 크다. 하지만 인공지능과 머신러닝에 대해서 헷갈리는 경우가 많다. 머신러닝에 대해 흔히 잘못 알고 있는 것들을 미디엄 등 관련 외신들을 통해 정리해본다.

1. 머신러닝은 인공지능과 같다.

인공지능과 머신러닝은 다르지만 연관된 개념이다. AI와 ML의 관계를 생각하는 한 가지 방법으로, 전자는 문제인 반면 후자는 이를 해결하려는 일종의 해결책이다. 컴퓨터가 인간의 인지 능력으로 문제를 해결할 수 있도록 하는 것을 최종 목표로 한다면, 새롭고 더 큰 상황에 적용하기 위해 데이터 기반 알고리즘 프로세스는 거기에 도달하는 하나의 방법이다.

AI를 컴퓨터 비전처럼 사람이 쉽고 기계가 하기 어려운 문제를 다루는 것으로 생각해보자. 도넛과 베이글을 구별하는 것을 컴퓨터에 가르쳐야 한다고 가정하자. 이는 인간에게는 매우 간단한 것이지만, 컴퓨터에게는 어렵다. 여기서 AI는 베이글 대 도넛(문제)을 인식하는 기계의 성공적인 능력인 반면, ML은 새로운 사진(해결책)을 보여주면 컴퓨터가 결론에 도달하는 것을 배울 수 있는 방법이다.

ML은 복잡한 수학적 알고리즘을 실행하거나 확률론적 계산을 사용하는 것과 같이 인간보다 기계가 더 쉬운 상황에 종종 사용된다. 기계들의 계산력은 도전적인 작업을 빠르게 실행하거나, 인간이 놓칠 수 있는 패턴을 발견하는 데 도움이 된다.

2. 기계는 경험으로부터 배운다.

일반적인 믿음과는 달리, 머신러닝은 경험에 의존하는 것이 아니라 데이터에 의존한다. 문제를 해결하기 위해 컴퓨터를 느슨하게 만들 수는 없다. 기계는 학습할 데이터가 필요하며, 다음 사항을 포함하는 알고리즘을 생성해야 한다.

  • 세트의 구성 요소를 분류하거나 나타내는 방법
  • 성공 시 점수를 매기거나 평가하기 위한 측정 방법
  • 데이터에 대한 모델 매개변수 최적화

현실적으로 머신러닝의 주된 목적은 미래를 예측하는 것이다. 과거에 봤던 영화를 아는 것은 다음에 어떤 영화를 보고 싶은지 알아보는 수단일 뿐이다. 신용 카드 기록은 제 시간에 대금을 지불할 것인지의 여부를 알려주는 지침이다. 로봇 과학자들처럼 학습 알고리즘은 가설을 공식화하고, 이를 다듬고, 그들의 예측이 실현될 때에만 가설을 믿는다. 학습 알고리즘은 아직 과학자들만큼 똑똑하지는 않지만, 수백만 배 더 빠르다.

 

사진=셔터스톡
사진=셔터스톡

 

3. 머신러닝은 인과관계가 아니라 상관관계만 발견할 수 있다.

가장 인기 있는 머신러닝 유형 중 하나는 여러 행동들을 시도해보고 그 결과를 관찰하는 것으로 구성된다. 바로 인과관계의 핵심이다. 예를 들어, 전자상거래 사이트는 상품을 제시하는 다양한 방법을 시도할 수 있고 최대 구매를 유도하는 방법을 선택할 수 있다. 사람들은 아마 모르고 수천 번의 실험에 참여했을 것이다. 실험이 불가능한 일부 상황에서도 인과관계가 발견될 수 있고, 컴퓨터가 할 수 있는 것은 과거의 데이터를 보는 것뿐이다.

만약 어떤 일이 한 번도 일어나지 않았다면, 그 예측 확률은 0이 되어야 한다. 그러나 머신러닝은 높은 정확도로 희귀한 사건을 예측하는 기술이다. 우리가 전에 그런 일이 일어나는 것을 본 적이 없다 해도, 만약 A가 B의 원인 중 하나이고 B가 C의 원인 중 하나라면, A는 C로 이어질 수 있다. 메일 스팸 필터는 새로 조작된 스팸 전자 메일을 정확하게 표시한다. 2008년의 금융위기와 같은 검은 백조들은 사실 널리 예측되었다. 단지 대부분의 은행들이 그 당시에 사용했던 결함 있는 위험 모델들이 못했을 뿐이다.

4. 머신러닝은 기존의 지식을 무시하고, 데이터가 많을수록 패턴에 환각을 일으킬 가능성이 높아진다.

많은 전문가들은 그들이 알고 있는 학습 알고리즘을 아무 것도 없는 초기 상태에서 시작하고자 한다. 실제 지식은 데이터베이스에서 일반 알고리즘을 실행시켜 오랫동안 추론과 실험한 과정의 결과물이다. 모든 학습 알고리즘이 백지 상태에서 시작되는 것은 아니다. 어떤 사람들은 기존의 지식의 본체를 다듬기 위해 데이터를 사용한다. 만약 컴퓨터가 이해할 수 있는 형태로 암호화되어 있다면, 이것은 상당히 정교할 수 있다.

국토안보부가 더 많은 통화 기록을 볼수록, 테러리스트 탐지 규칙에 우연하게 일치되어 무고한 사람이 잠재적인 테러리스트가 될 가능성이 커진다. 동일 개체 속성을 더 많이 채굴할수록 실제로 환각의 위험을 증가시킬 수 있지만, 머신러닝 전문가들은 환각을 최소한으로 유지하는 데 매우 능숙하다.

동일 속성 개체를 더 채굴하는 것은 위험을 감소시킨다. 이들로부터 배운 규칙들이 더 강력한 지지를 받을 것이기 때문이다. 어떤 학습 알고리즘은 여러 개체가 관련된 패턴을 찾아낼 수 있다. 뉴욕 시청을 비디오로 촬영하는 사람이나 질산암모늄을 대량 구입하는 사람은 의심하지 않는다. 그러나 만약 두 사람이 가까운 전화 접촉을 하고 있다면, 아마도 FBI가 살펴봐야 할 것이다.

5. 머신 러닝은 딥 러닝과 차이가 없다

머신러닝은 원하는 결과를 얻기 위해 사람의 개입 없이 스스로를 바꿀 수 있는 데이터 기반 알고리즘을 만드는 인공 지능의 하위 집합이다. 딥 러닝은 머신 러닝과 유사하게 알고리즘을 생성하고 작동하는 머신 러닝의 하위 집합이다. 각 단계마다 알고리즘이 전달하는 데이터에 대해 다른 해석을 제공한다. 이 알고리즘 네트워크를 인공 신경망이라고 한다. 간단히 말해 인간 두뇌에 존재하는 신경 연결과 유사하다.

딥 러닝과 머신 러닝의 주요 차이점은 시스템에 데이터가 표시되는 방식이다. 머신 러닝 알고리즘은 구조화된 데이터를 필요로 하지만, 딥 러닝 네트워크는 인공 신경망 계층에 의존한다.

머신 러닝 알고리즘은 레이블이 지정된 데이터를 이해해 학습시킨다. 이를 사용해 더 많은 데이터 세트로 새로운 결과를 생성한다. 그러나 결과가 부정확할 경우“가르쳐야” 한다.

딥 러닝 네트워크는 사람의 개입이 필요 없다. 신경망의 다단계 계층이 다른 개념의 수직계층 구조 내에 데이터를 배치한다. 그 데이터는 궁극적으로 자신의 실수를 통해 스스로 학습한다. 데이터 품질이 충분하지 않으면 잘못될 수도 있다. 데이터가 모든 것을 결정한다. 그래서 데이터 품질이 중요하다.

이정태 기자
이정태 기자 mica1028@aitimes.com 다른기사 보기
기자 프로필
이정태 기자
이정태 기자 mica1028@aitimes.com 다른기사 보기


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
유용한 리스티클
  • 올해 주목할 머신러닝 스타트업 25사
  • 머신러닝에 대해 잘못 알고 있는 5가지
  • 버락 오바마가 가장 좋아하는 AI 도서는?
  • 컴퓨팅 성능 최대 20배 향상...엔비디아 새 GPU 아키텍처 공개
  • 유럽 경제활동 재개...사회적 거리두기 조건
  • 팬데믹이 바꿔 놓은 지식작업 변화 3가지