▲이제 막 학교를 졸업한 남자가 직장을 찾고 있다(출처=셔터스톡)

최근 데이터 과학자에 대한 수요가 높다. 구직 사이트인 글라스도어(Glassdoor)에서 발표한 목록에 따르면, 데이터 과학자는 최근 3년간 미국에서 가장 필요로 하는 일자리로 나타났다. 또한 알맞은 기술을 지닌 데이터 과학자의 평균 급여는 11만달러에 달했다.

IT 전문가를 위한 온라인 출판사 테크리퍼블릭(TechRepublic)은 이러한 현상에 대해 최근의 거의 모든 회사에서 데이터를 수집하며, 그 데이터 양은 매일 계속 커지고 있기 때문이라고 설명했다.

데이터 과학자란

데이터 과학자는 문제를 해결하기 위한 기술적 능력을 보유하고 있거나 해결할 문제를 탐색할 수 있는 분석 전문가다. 컴퓨터 소프트웨어 회사인 SAS는 데이터 과학자가 트렌드 분석가, 컴퓨터 과학자 그리고 수학자를 조합한 직업이라고 설명했다. 말하자면, 데이터 과학자가 되기 위해서는 IT와 비즈니스의 두 세계에 모두 관여해야 한다.

데이터 분석가 또는 통계학자

비즈니스 이해, 데이터 관리 및 분석을 전문으로 하는 회사로서, SAS는 많은 데이터 과학자들이 실제로 데이터 분석가 또는 통계학자로서의 경력을 시작했다고 말했다. 그러나 처리기술과 대용량 데이터의 저장이 발전하고 성장함에 따라, 데이터 과학자의 역할도 마찬가지로 진화했다. 데이터는 IT 부서가 처리해야 할 부차적인 의무가 아니다. 핵심 데이터는 창조적인 호기심, 아이디어를 수익으로 변환하는 요령 및 분석을 필요로 한다.

데이터 과학자인 알렉스 헤링턴 (Alex Herington)은 미국의 주요 소매점에서 근무하며 SAS로부터 업무의 특징에 대한 질문을 받았다. 그가 이야기하길, 그의 하루 일과는 같을 수 있지만, 주마다 일들이 매우 다양하다고 했다. 텍스트 마이닝 프로젝트에 몇 주간 집중하고, 다른 몇주 동안은 회사 고객을 위한 예측 모델을 만드는 데 시간을 할애한다.

전형적인 직업 의무

▲보고 중인 과학자(출처=셔터스톡)

데이터 과학자의 일반적인 임무

1. 다루기 힘든 대용량 데이터 수집과 그것의 사용 가능한 형식으로 변환

2. 데이터 중심 전략을 사용해 비즈니스와 관련된 문제 해결

3. 파이썬(Python), 알(R) 및 SAS를 포함한 다양한 프로그래밍 언어로 작업

4. 배포 및 통계 테스트와 같은 통계에 관한 확실한 이해

5. 비즈니스 및 IT와의 공동작업 및 의사소통

6. 데이터의 패턴 및 순서 찾기

7. 비즈니스에 이점이 될 수 있는 트렌드 파악

8. 텍스트 분석, 심층학습 및 기계 학습과 같은 분석기술에 대한 장악

고용에 필요한 기술

아래는 교육기관 우다시티에서 자세히 설명한, 직장을 얻기 위한 데이터 과학 기술이다.

1. 프로그래밍 기술 - 인터뷰 대상 회사와는 상관없이, 작업 도구를 사용할 수 있는지 없는지에 대한 질문을 받을 가능성이 있다. 프로그래밍 언어의 예로는 파이썬(Python), R 또는 SQL을 들 수 있다.

2. 기계 학습(Machine Learning) - 많은 양의 데이터와 데이터 중심의 제품 또는 서비스를 가진 대기업들은 구직자가 기계 학습 방법에 익숙하길 원한다.

3. 데이터 논쟁 - 데이터 과학 프로젝트에서 종종 불완전하거나 정돈안된 데이터를 처리해야 한다. 따라서 이같은 불완전성을 데이터에서 처리하는 방법을 아는 것이 필수적이다. 데이터 불완전의 예는 문자열 형식의 불일치, 누락된 값 그리고 데이터 서식 등이 있다.

4. 데이터 시각화 및 의사소통 - 데이터를 시각화하고 의사소통하는 것이 중요한데, 특히 처음으로 데이터 중심의 의사 결정을 내리는 작은 회사인 경우는 더 그렇다. 데이터를 의사소통한다는 것은 비기술적, 기술적 연구 성과나 작업을 청중들에게 이야기해야한다는 것을 뜻한다. 또한 데이터를 잘 전달하고 시각적으로 데이터를 암호화하는 원리를 하는 것은 대단히 도움이 된다.

5. 데이터 직관력 - 회사는 직원이 데이터 중심의 문제 해결자가 되기를 원한다. 따라서, 구직자는 인터뷰 중 일부 수준 높은 문제에 대해 질문을 받을 수 있다. 예를 들어, 회사가 개발하고 싶은 데이터 중심 제품이거나 실행해보고 싶은 테스트에 관한 것일 수 있다.

6. 소프트웨어 엔지니어링 - 데이터 기록과 데이터 중심 제품을 창조하는 것을 처리하는 기술은 중소기업 구직의 성공을 보장하기 때문에, 강력한 소프트웨어 엔지니어링 배경을 가진 사람이 유리하다.

그러나 단기간에 전문가로 거듭나 고액 연봉을 노리고 있다면 생각을 바꾸는게 좋을 것 같다. 우다시티의 한 교육자는 데이터 과학 기술 또한 단계가 있고 실력의 높낮이가 분명한 영역이라며, 회사가 미래를 위해 데이터 과학 전문가에게 투자하듯, 데이터 전문가가 되고 싶은 사람 또한 장기적인 안목으로 기술을 접근해야 한다고 충고했다.