728x90
728x90
딥러닝 기초 복습머신러닝 정리 알고리즘 평가 지표 딥러닝 개념인공 신경망을 사용하여 복잡한 패턴을 학습하고 데이터를 분석하는 기술스케일링 필수 가중치 조정 조금씩 가중치(weight)를 조정하며 지정한 횟수나 더 이상 오차가 줄지 않을 때까지 오차 확인 이를 학습이라고 함(가장 적합한 가중치를 찾는 과정) 학습 절차가중치에 초기값 할당예측 결과 출력오차 계산(MSE)오차를 줄이는 방향으로 가중치(weight) 조정(가중치 = 파라미터)1번으로 올라가 반복(max iteration에 도달)loss function: 오차계산optimizer: 가중치 조절learning_rate: 학습율 결정epoch: 반복횟수 딥러닝 모델링1. Regression 스케일링# 스케일러 선언 scaler = MinMaxScal..
7, 8주차 (4월 1일 ~ 5일, 4월 8일 ~ 12일) 3차 미니프로젝트(4월 4일 ~ 9일) 4월 4일부터 9일까지 3차 미니프로젝트가 진행되었습니다! 이번 미니프로젝트는 두 번에 걸쳐 나누어서 진행되었는데 4, 5일에는 스마트폰 센서 데이터 기반으로 행동을 분류하는 주제, 8, 9일에는 신규 임대 아파트의 주차 수요를 예측하는 주제였습니다. 첫 번째 주제에서는 데이터에 대한 이해가 많이 부족한 상태에서 주어진 문제들 풀기에 급급하다 보니 내용도 제대로 파악하지 못하고 체계가 잘 잡혀있지 않아 많이 헤맸던 거 같습니다. 이에 조원들과 얘기 나눠본 결과 두 번째 주제 진행 전에 데이터에 대한 이야기를 먼저 적극적으로 나누어 도메인 지식을 쌓은 후 프로젝트를 진행하는 방향으로 결정이 되었습니다! 확실히..
머신러닝 복습비지도학습레이블이나 명시적인 결과 없이 입력 데이터의 구조나 패턴을 발견하고 모델링하는 방법비지도 학습만으로 끝나지 않고 후속 작업 필요차원 축소: 고차원 데이터를 축소하여 새로운 feature 생성Clustering: 고객별 군집 생성이상탐지: 정상 데이터 범위 지정 1. 차원 축소고차원 데이터는 많은 특성(feature)을 가지고 있기 때문에 데이터를 시각화하거나 분석하기 어려움또한, 차원이 증가함에 따라 데이터의 복잡성도 증가 및 학습 알고리즘의 성능이 저하됨(차원의 저주)따라서 차원 축소는 데이터의 복잡성을 줄이고 효율적인 분석을 가능하게 함ex) 주성분 분석(PCA), t-SNE 주성분 분석(PCA)데이터를 새로운 축으로 변환하여 가장 많은 분산을 보존하는 주성분을 찾아내는 방법스케..
머신러닝 복습K-Fold Cross Validation(교차 검증)머신러닝 모델의 성능을 평가하는 방법 중 하나데이터를 여러 개로 나눈 뒤, 각각의 나눈 것들을 사용하여 모델을 학습하고 나머지로 모델을 검증하는 과정을 반복하는 것과소적합 문제 방지 가능좀 더 일반화된 모델을 만들 수 있음반복 횟수가 많아서 모델 학습과 평가에 많은 시간이 소요된다는 단점 K-분할 교차 검증 사용 방법# 1단계: 불러오기from sklearn.tree import DecisionTreeClassifier # KNN, Logisticfrom sklearn.model_selection import cross_val_score# 2단계: 선언하기model = DecisionTreeClassifier(max_depth=3)# 3..
머신러닝 복습기본 알고리즘 분류범줏값을 예측로지스틱 회귀 (Logistic Regression), 결정 트리 (Decision Trees), 랜덤 포레스트 (Random Forest), 서포트 벡터 머신 (Support Vector Machine, SVM), k-최근접 이웃 (k-Nearest Neighbors, k-NN) 등회귀연속적인 숫자를 예측선형 회귀 (Linear Regression), 다항 회귀 (Polynomial Regression), 결정 트리 회귀 (Decision Tree Regression), 랜덤 포레스트 회귀 (Random Forest Regression) 1. Linear Regression(선형 회귀) 알고리즘최선의 회귀모델은 전체 데이터의 오차합이 최소가 되는 모델을 의미 ..
6주차 (3월 25일 ~ 29일) 데이터 분석 표현(3월 25일 ~ 26일) 6주차는 허신 강사님의 데이터 분석 표현 수업으로 시작되었습니다. Streamlit과 PowerBI라는 툴에 대해서 학습하게 되었는데 시각화툴인 PowerBI는 전부터 다뤄보고 싶었어서 흥미롭게 들었습니다! 하루만에 배우기엔 많은 양이었지만 유용하게 잘 써먹을 거 같습니다. 강사님께서는 유튜브도 운영 중이시라고 합니다. https://www.youtube.com/@huhshin-businessintelligence/videos 허신 - Business Intelligence MS Power BI (Business Intelligence): 데이터분석 및 시각화 도구에 대한 정보를 제공합니다. - 유튜브 재생 목록 1) Power..