[KT AIVLE] DX트랙 데이터 분석(4주차) 복습(데이터 분석 방법론, EDA&CDA, 시각화라이브러리, 단변량 분석, 숫자형·범주형 변수)
데이터 분석 복습 1. 데이터 분석 방법론 CRISP-DM(Cross-Industry Standard Process for Data Mining) 1) 비즈니스 이해(Business Understanding) 문제를 정의하고 요인을 파악하기 위한 가설 수립 비즈니스 이해하는 단계 업무 목적 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립 2) 데이터 이해(Data Understanding) 데이터 수집 및 속성 이해 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인 데이터 분석 도구 EDA(Exploratory Data Analysis) 개별 데이터의 분포, 가설이 맞는지 파악 NA, 이상치 파악 CDA(Confirmatory Data Analysis) 탐색으로 파악하기 애매한..