박정현의 데이터사이언스 총 12건의 기사가 있습니다.
-
[박정현의 데이터사이언스 시작하기] ⑫ 데이터사이언스 전문가 인터뷰...신세계I&C 이환기 AI Lab장
지난 시간에는 분류 문제를 해결하는 모델을 어떻게 평가할지에 대해 살펴봤다. 이번 시간에는 데이터사이언스 전문가로 신세계아이앤씨(I&C) AI LAB 이환기 랩장의 인터뷰를 통해 인재채용과 관련된 내용을 중점적으로 살펴보고자 한다. [글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어③ 데이터 분석 문제④ 데이터 탐색 및 데이터 시각화⑤ 데이터 피처 엔지니어링 (1)⑥ 데이터 피처 엔지니어링 (2)⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2) - 분류⑨ 알고리즘 (3) - 클러스터링⑩ 성능평가 (
박정현2021-04-07 -
[박정현의 데이터사이언스 시작하기] ⑪ 성능평가 (2) - 분류
지난 시간에는 회귀 모델을 어떻게 평가하는지에 대해 살펴봤다. 회귀의 경우 예측한 값이 수치로 표현되기 때문에 예측값과 실젯값의 차이를 사용해 오류(잔차)를 구하는 방식이었다. 이번 시간에는 분류 문제를 해결하는 모델을 어떻게 평가할지에 대해 살펴보고자 한다.[글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어③ 데이터 분석 문제④ 데이터 탐색 및 데이터 시각화⑤ 데이터 피처 엔지니어링 (1)⑥ 데이터 피처 엔지니어링 (2)⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2) - 분류⑨ 알고리즘 (3)
박정현 서울대 EPM 연구원2021-03-19 -
[박정현의 데이터사이언스 시작하기] ⑩ 성능평가 (1) - 회귀
지난 시간에는 클러스터링의 대표적인 알고리즘인 K-Means가 어떻게 작동하는지와 이름이 유사한 K-NN과의 차이점은 무엇인지 살펴봤다. 이번 시간에는 지금까지 살펴본 알고리즘이 회귀와 분류 문제를 적절하게 해결했는지, 검증을 위해 사용하는 모델 성능 평가 방법에 대해 살펴보고자 한다.[글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어③ 데이터 분석 문제④ 데이터 탐색 및 데이터 시각화⑤ 데이터 피처 엔지니어링 (1)⑥ 데이터 피처 엔지니어링 (2)⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2)
박정현 서울대 EPM 연구원2021-03-04 -
[박정현의 데이터사이언스 시작하기] ⑨ 알고리즘 (3) - 클러스터링
지난 시간에는 회귀 분석에 이어 분류 문제를 해결하는 방식에 대해 살펴봤다. 이번 시간에는 클러스터링의 대표적인 알고리즘인 K-Means가 어떻게 작동하는지와 이름이 유사한 K-NN과의 차이점은 무엇인지 살펴본다.[글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어③ 데이터 분석 문제④ 데이터 탐색 및 데이터 시각화⑤ 데이터 피처 엔지니어링 (1)⑥ 데이터 피처 엔지니어링 (2)⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2) - 분류⑨ 알고리즘 (3) - 클러스터링⑩ 성능평가 (1) - 회귀 ⑪ 성
박정현 서울대 EPM 연구원2021-02-18 -
[박정현의 데이터사이언스 시작하기] ⑧ 알고리즘 (2) - 분류
지난 시간에는 회귀분석에 대해 살펴봤다. 이번 시간에는 회귀 분석에 이어 분류 문제를 해결하는 방식에 대해 살펴본다. 계속해서 다음 시간에는 분류하는 방식 중 한 가지인 군집화(Clustering)에 대해 일반적인 분류와 어떻게 다른지 살펴보고 예시와 함께 설명해본다.[글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어③ 데이터 분석 문제④ 데이터 탐색 및 데이터 시각화⑤ 데이터 피처 엔지니어링 (1)⑥ 데이터 피처 엔지니어링 (2)⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2) - 분류⑨ 알고리즘
박정현 서울대 EPM 연구원2021-01-29 -
[박정현의 데이터사이언스 시작하기] ⑦ 알고리즘 (1) - 회귀
지난 시간에 피처의 스케일을 변환하는 방법을 알아봤다. 이번 시간은 회귀분석에 대해 간략하게 살펴본다. 회귀분석은 가장 쉽게 접근할 수 있는 데이터 분석 방법이지만 제대로 사용하려면 살펴볼 부분이 많은 분석 방법이다. 다음 시간에는 데이터 분류 문제를 해결하는 방법에 대해 살펴본다.[글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어③ 데이터 분석 문제④ 데이터 탐색 및 데이터 시각화⑤ 데이터 피처 엔지니어링 (1)⑥ 데이터 피처 엔지니어링 (2)⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2) -
박정현 서울대 EPM 연구원2021-01-15 -
[박정현의 데이터사이언스 시작하기] ⑥ 피처 엔지니어링 (2)
지난 시간에 피처를 다양한 방식으로 변환하는 방법을 알아봤다. 이번 시간은 피처의 스케일을 변환하는 방법에 대해 이야기해 보고자 한다.[글 싣는 순서]ⓛ 데이터사이언스, 머신러닝 그리고 인공지능② 데이터 종류 및 관련 용어 ③ 데이터 분석 문제 ④ 데이터 탐색 및 데이터 시각화 ⑤ 데이터 피처 엔지니어링 (1) ⑥ 데이터 피처 엔지니어링 (2) ⑦ 알고리즘 (1) - 회귀⑧ 알고리즘 (2) - 분류⑨ 알고리즘 (3) - 클러스터링⑩ 성능평가 (1) - 회귀 ⑪ 성능평가 (2) - 분류 ⑫ 데이터사이언스 전문가 인터뷰이미 살펴본 것처
박정현 서울대 EPM 연구원2020-12-16 -
[박정현의 데이터사이언스 시작하기] ⑤ 피처 엔지니어링 (1)
지난 글에서 데이터를 이해하고 분석하는 방법에 대한 아이디어를 얻을 수 있는 데이터 시각화와 데이터 탐색 과정을 살펴봤다. 이번 시간은 데이터 사이언스의 꽃이라 할 수 있는 '피처 엔지니어링'을 알아보자.피처 엔지니어링에 대해 데이터사이언스 관련용어에서 설명한 내용을 다시 떠올려보자. 데이터는 이전 글에서 설명한 것처럼 데이터 값의 형태에 따라 수치형 데이터와 범주형 데이터로 구분할 수 있다.이때 우리가 해결하고자 하는 문제를 컴퓨터가 잘 이해할 수 있도록 변수(피처)들의 형태를 변형하거나 적절하게 처리하는데, 이러한 과정을 피처
박정현 서울대 EPM 연구원2020-11-30 -
[박정현의 데이터사이언스 시작하기] ④데이터 탐색 및 데이터 시각화
지금까지 글을 통해 데이터 종류와 데이터를 기반으로 한 문제 및 해결 방법을 살폈다. 이제부터 조금 더 실제적인 분석에 대한 설명을 진행하고자 한다. 실제 데이터 분석에 앞서 데이터 분포나 특성을 살피는 과정이 필요한데, 이 과정을 '데이터 탐색 분석(Exploratory Data Analysis, EDA)'이라 한다. EDA는 주로 데이터의 기초 통곗값과 여러 형태의 그래프를 활용한 시각화로 진행된다.데이터 탐색데이터 분석에 있어 가장 중요한 부분은 데이터 전처리와 피처 엔지니어링이라고 할 수 있다. EDA 과정으로 데이터를 정확
박정현 서울대 EPM 연구원2020-11-02 -
[박정현의 데이터사이언스 시작하기] ③ 데이터 분석 문제
지난 두 번의 글을 통해 데이터 사이언스와 관련 용어를 살펴봤다. 앞으로는 어떤 문제를 어떤 방식으로 풀어보고 어떻게 평가하는지 다룰 예정이다. 이번 글은 데이터 분석에서 다루는 문제 분석 유형과 특징을 소개한다. 기본적으로 데이터 분석을 통해 해결하고자 하는 문제는 회귀(regression)와 분류(classification)다. 우리가 해결하고자 하는 문제가 어떤 형식의 문제인지 혹은 얻고자 하는 결과가 어떤 형태의 값인지를 파악해야 문제해결에 적합한 방법(알고리즘)을 선택할 수 있다. 결과 평가도 정확히 할 수 있다.조금 어색
박정현 서울대 EPM 연구원2020-10-15 -
[박정현의 데이터사이언스 시작하기] ②데이터 종류 및 관련 용어
지난 글에서는 데이터 사이언스와 머신러닝 그리고 인공지능이란 무엇인가에 대해 간략하게 정리해 봤다. 이번 글에서는 본격적으로 데이터 사이언스 맛보기를 시작하기 전에 데이터란 무엇인지 그리고 이 분야에 관련된 용어들을 살펴보면서 데이터 사이언스 배울 준비를 해보자.데이터 분석 파이프라인(pipeline)그런데 우리는 왜 데이터를 분석하는 것일까? 기본적으로는 데이터 분석은 의사결정의 근거를 파악하기 위해 수행한다고 볼 수 있다. 예를 들어 제조 기업 경우 과거 판매 데이터와 경제 지표 등의 데이터를 수집해서 가공해 분석하고 미래 수요
박정현 서울대 EPM 연구원2020-09-21 -
[박정현의 데이터사이언스 시작하기] ⓛ데이터사이언스, 머신러닝 그리고 인공지능
들어가며...'인공지능' '머신러닝' '데이터사이언스'는 더이상 공상과학 영화나 책에서만 보고 듣는 용어가 아니다. 이미 알게 모르게 우리 실생활에 들어와 있다. 이세돌 9단과 알파고의 바둑 대결에 이어 최근 OpenAI가 공개한 대화형 GPT-3와 같은 대형 프로젝트 형태 뿐만 아니라 인공지능 스피커나 쇼핑 추천 시스템 등이 그 예다. 앞으로도 뜨거운 관심을 받을 수 밖에 없는 분야다.때문에 이 분야를 공부하고 싶어하는 분이 많다. 이들 분야로 이직을 고려하는 분도 많다. 데이터 과학자는 가장 섹시한 직업 가운데 하나이고, 인공지
박정현 서울대 EPM 연구원2020-08-27