데이터는 같아도 분석 결과는 다를 수 있다...스탠포드 실험 결과
상태바
데이터는 같아도 분석 결과는 다를 수 있다...스탠포드 실험 결과
  • 입력 2020-05-28 16:01
  • 댓글 0
이 기사를 공유합니다

70개 연구팀, 동일한 데이터로 9가지 가설 연구
5가지 가설에서 분석결과 다르게 나와
(사진=셔터스톡)
(사진=셔터스톡)

 동일한 데이터를 가지고 분석해도 각기 다른 분석결과가 나올 수 있다는 실험결과가 나왔다. 빅데이터 분석이 만능은 아니고, 인공지능(AI)도 다른 선택을 할 수 있다는 사실을 보여주는 사례여서 주목된다.

빅데이터 및 솔루션 전문매체인 데이터나미는 최근 스탠포드 대학이 전 세계 70개 연구팀에 동일한 데이터를 제공한 뒤 9가지 가설을 제시해 연구토록 한 결과 이 가운대 5가지 가설에서 결과가 다르게 나왔다고 27일(현지시간) 보도했다.

스탠포드대학은 데이터 분석의 재현성을 확인하기 위해 이번 실험을 진행했다. 재현성은 같은 시험 재료를 완전히 상이한 조건에서 측정했을 때 같은 결과가 나오는 정도를 말한다.

실험에 참여한 70개 팀에는 공통  분석 과제를 제시했다. 의 사결정 업무를 수행하는 자원 봉  자의 뇌를 찍 은 기능적 자기공  영상(fMRI) 데이 터를 동일하게 제공한 뒤 9개의 가설을 분석할 것을 요청했다.

 이터 분석법은 알려주지 않았다. 연구팀은 fMRI 영상을 분석하기 위해 자체 방법을 고안했다 . 를 토대로 데이터를 분석해 감정 경험이나 기억 저장의 복잡성 등 여러 특정 작업에 뇌가 얼마나 활성화 됐는지를 판단했다. 그 결과 9개 가설 가운데 5개 가설에서 연구팀마다 극명한 차이를 보였다.

데이터나미는 데 이터 분석에 있어 관련 용어 및 측정 항목을 정의하는 것은 데이터 웨어하우징(흩어져 있는 데이터를 쉽게 접근 ㆍ활용할 수 있도록 하는 기술) 초기부터 지금까지 중요한 문제로 남아있다고 설명했다.

이어 과학이 공정성과 경험적 사고를 필요로 하지만, 이번 연구로 여전히 인간의 판단이 편견과 함께 연구 과정에서 큰 역할을 한다고 분석했다.

연구 논문 공동 저자인 러셀 폴드락은 스탠포드뉴스 인터뷰에서 "이번 연구에서 가장 중요한 점은 동일한 데이터와 가설을 제시했지만 연구팀마다 매우 다른 결론에 도달했다는 점"이라고 말했다. 그는 "원시 데이터에서 fMRI로 결과를 처리하는 과정은 매우 복잡하다"며 "분석 작업 과정에서 선택해야 할 것이 많다"고 그 이유를 설명했다.

그는 또 "이번 연구를 바탕으로 향후 데이터 분석 품질을  평가하고 개 선하는 데 도움을 얻을 수 있을 것"이라며 "잠재적 해결책은 데이터를 다방면으로 분석할 수 있도록 하고 데이터 분석 과정을 투명하게 해 이를 연구원간 공개적으로 공유하는 것 등이 있다"고 설명했다.

[관련 기사] AI에도 '한계'가 있다

[관련 기사] AI로 만드는 '옴니채널'...진화하는 전자상거래

기자 프로필

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
유용한 리스티클
  • AI를 활용한 10가지 좋은 예
  • MIT 테크리뷰가 선정한 젊은 AI혁신가 7인
  • 포스트코로나 이끌 AI 스타트업 'TOP 10'
  • 주목할 중국·일본 로봇 스타트업 '베스트 10'
  • 포브스 선정 유망 AI기업 베스트 50
  • 코로나19와 싸우는 테크기업 '베스트 15'