728x90
728x90
7, 8주차 (4월 1일 ~ 5일, 4월 8일 ~ 12일) 3차 미니프로젝트(4월 4일 ~ 9일) 4월 4일부터 9일까지 3차 미니프로젝트가 진행되었습니다! 이번 미니프로젝트는 두 번에 걸쳐 나누어서 진행되었는데 4, 5일에는 스마트폰 센서 데이터 기반으로 행동을 분류하는 주제, 8, 9일에는 신규 임대 아파트의 주차 수요를 예측하는 주제였습니다. 첫 번째 주제에서는 데이터에 대한 이해가 많이 부족한 상태에서 주어진 문제들 풀기에 급급하다 보니 내용도 제대로 파악하지 못하고 체계가 잘 잡혀있지 않아 많이 헤맸던 거 같습니다. 이에 조원들과 얘기 나눠본 결과 두 번째 주제 진행 전에 데이터에 대한 이야기를 먼저 적극적으로 나누어 도메인 지식을 쌓은 후 프로젝트를 진행하는 방향으로 결정이 되었습니다! 확실히..
머신러닝 복습비지도학습레이블이나 명시적인 결과 없이 입력 데이터의 구조나 패턴을 발견하고 모델링하는 방법비지도 학습만으로 끝나지 않고 후속 작업 필요차원 축소: 고차원 데이터를 축소하여 새로운 feature 생성Clustering: 고객별 군집 생성이상탐지: 정상 데이터 범위 지정 1. 차원 축소고차원 데이터는 많은 특성(feature)을 가지고 있기 때문에 데이터를 시각화하거나 분석하기 어려움또한, 차원이 증가함에 따라 데이터의 복잡성도 증가 및 학습 알고리즘의 성능이 저하됨(차원의 저주)따라서 차원 축소는 데이터의 복잡성을 줄이고 효율적인 분석을 가능하게 함ex) 주성분 분석(PCA), t-SNE 주성분 분석(PCA)데이터를 새로운 축으로 변환하여 가장 많은 분산을 보존하는 주성분을 찾아내는 방법스케..
머신러닝 복습K-Fold Cross Validation(교차 검증)머신러닝 모델의 성능을 평가하는 방법 중 하나데이터를 여러 개로 나눈 뒤, 각각의 나눈 것들을 사용하여 모델을 학습하고 나머지로 모델을 검증하는 과정을 반복하는 것과소적합 문제 방지 가능좀 더 일반화된 모델을 만들 수 있음반복 횟수가 많아서 모델 학습과 평가에 많은 시간이 소요된다는 단점 K-분할 교차 검증 사용 방법# 1단계: 불러오기from sklearn.tree import DecisionTreeClassifier # KNN, Logisticfrom sklearn.model_selection import cross_val_score# 2단계: 선언하기model = DecisionTreeClassifier(max_depth=3)# 3..
머신러닝 복습기본 알고리즘 분류범줏값을 예측로지스틱 회귀 (Logistic Regression), 결정 트리 (Decision Trees), 랜덤 포레스트 (Random Forest), 서포트 벡터 머신 (Support Vector Machine, SVM), k-최근접 이웃 (k-Nearest Neighbors, k-NN) 등회귀연속적인 숫자를 예측선형 회귀 (Linear Regression), 다항 회귀 (Polynomial Regression), 결정 트리 회귀 (Decision Tree Regression), 랜덤 포레스트 회귀 (Random Forest Regression) 1. Linear Regression(선형 회귀) 알고리즘최선의 회귀모델은 전체 데이터의 오차합이 최소가 되는 모델을 의미 ..
6주차 (3월 25일 ~ 29일) 데이터 분석 표현(3월 25일 ~ 26일) 6주차는 허신 강사님의 데이터 분석 표현 수업으로 시작되었습니다. Streamlit과 PowerBI라는 툴에 대해서 학습하게 되었는데 시각화툴인 PowerBI는 전부터 다뤄보고 싶었어서 흥미롭게 들었습니다! 하루만에 배우기엔 많은 양이었지만 유용하게 잘 써먹을 거 같습니다. 강사님께서는 유튜브도 운영 중이시라고 합니다. https://www.youtube.com/@huhshin-businessintelligence/videos 허신 - Business Intelligence MS Power BI (Business Intelligence): 데이터분석 및 시각화 도구에 대한 정보를 제공합니다. - 유튜브 재생 목록 1) Power..
머신러닝 복습 머신러닝1. 머신러닝컴퓨터 시스템에게 데이터에서 학습하고 패턴을 식별하여 작업을 수행할 수 있는 능력을 부여하는 인공지능의 한 분야다양한 알고리즘과 기술을 사용하여 모델을 훈련시키고, 이 모델은 새로운 데이터를 분석하고 예측하거나 패턴을 인식하여 의사 결정을 내림지도학습(Supervised Learning)학습 대상이 되는 데이터에 정답을 주어 규칙성을 배우게 하는 방법비지도학습(Unsupervised Learning)정답이 없는 데이터만으로 배우게 하는 학습 방법강화학습(Reinforcement Learning)선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법 2. 분류와 회귀분류범줏값을 예측 로지스틱 회귀 (Logistic Regression), 결정 트리 (De..