728x90
728x90
5주차 (3월 18일 ~ 22일)데이터 수집(3월 18일 ~ 19일)5주차에는 박두진 강사님께서 웹 크롤링을 주제로 2차 미니프로젝트 전 이틀 동안 강의를 해주셨습니다! 개인적으로 이전에 유튜브를 통해 웹 스크래핑을 잠깐 공부한 적이 있었는데, 그때는 제대로 이해하지 못한 채로 끝나서 조금 아쉬움을 남긴 채로 끝났었습니다. 이번 강의 역시 쉽지는 않았지만 웹 크롤링을 네이버, 직방, 카카오 등 다양한 사이트에서 다뤄보면서 실습까지 진행할 수 있어서 재미있게 학습할 수 있었습니다! 나중에 시간 내서 다양한 주제로 다뤄보려고 합니다. 2차 미니프로젝트(3월20일 ~ 22일) 2차 미니프로젝트에는 서울시 공공데이터를 가지고 전처리부터 분석 그리고 인사이트를 도출해내는 과정을 3일에 걸쳐 진행되었는데 에러도 많..
4주차 (3월 11일 ~ 15일)데이터 분석(3월 11일 ~ 15일)에이블스쿨 4주차 후기입니다!4주차에는 한기영 강사님의 데이터 분석 강의를 듣게 되었습니다. 강사님께서 텐션이 너무 좋으시고 중간중간에 회사 생활하며 있었던 일도 얘기해주시고 성대모사(솔직히 취저여서 웃겼습니다..)까지 해주시면서 지루하지 않게 강의 들었습니다! 강의는 아래 순서대로 진행되었습니다데이터 분석의 방법과 EDA단변량 분석이변량 분석시계열 분석강사님께서 설명도 정말 열정적으로 잘해주셨는데! 어렵더라고요..나름 ADSP 자격증 취득도 했었어서 이번 강의가 익숙하지 않을까 싶었는데 데이터 분석 공부가 아닌 자격증 취득 목적으로 벼락치기 해서 그런지 배경지식으로 삼기에는 큰 도움이 되지 못했습니다. P-Value, t-검정(T-..
데이터 다듬기 복습 5. 판다스(Pandas) 데이터 프레임 변경 열 이름 변경 1) 일부 열 이름 변경 rename() 메서드를 사용해 변경 전후의 열 이름을 딕셔너리 형태로 나열 inplace=True 옵션을 설정해야 변경 사항이 실제로 반영 # rename() 함수로 열 이름 변경 tip.rename(columns = {'total_bill_amount': 'total_bill', 'male_female' : 'sex', 'dinner_lunch' : 'time'}, inplace =True) 2) 모든 열이름 변경 모든 열 이름을 변경할 때는 columns 속성을 변경 변경이 필요없는 열은기존 이름 부여 # 모든 열 이름 변경 tip.columns = ['total_bill', 'sex', 'ti..
데이터 다듬기 복습 1. 넘파이(Numpy) 배열 확인 및 연산 # 배열 정보 확인 ndim # 차원 확인 shape # 형태(크기) 확인 dtype # 요소 자료형 확인 # 배열 연산 np.add(x, y) # 배열 더하기 np.subtract(x, y) # 배열 빼기 np.multiply(x, y) # 배열 곱하기 np.divide(x, y) # 배열 나누기 np.power(x, y) # 배열 제곱 2. 판다스(Pandas) 데이터 프레임 함수 head() # 상위 데이터 확인 tail() # 하위 데이터 확인 shape # 데이터프레임 크기 index # 인덱스 정보 확인 values # 값 정보 확인 columns # 열 정보 확인 dtypes # 열 자료형 확인 info() # 각 열에 대한 요..
3주차 (3월 4일 ~ 8일)데이터 다듬기(3월 4일 ~ 6일 )2주차에 이어서 데이터 다듬기 수업이 계속되었습니다! 데이터 다듬기 수업에서는 csv 파일을 불러와 데이터 프레임을 조회, 탐색, 집계, 변경 등 전처리의 전반적인 과정을 배웠습니다. 이론 후 실습 과정으로 진행되었으며 크게 이해가 어려운 부분은 없었지만 개인적으로 '.'이나 '[]' 같이 판다스 객체에서 데이터에 접근하고 조작하는 데 사용되는 문법을 언제 사용해야 하는지와 merge 부분에서 어떤 방법으로 조인(inner, left, outer)하는지에 대해서 조금 헷갈렸습니다. 나름 SQL 공부도 했는데 여전히 헷갈리네요ㅠ 수업 마지막 날(3월6일)에는 강사님께서 초미니테스트라고 부르시는 종합실습을 진행하며 복습할 수 있는 시간을 가졌습..
데이터 다루기 복습 enumerate() 반복 가능한 객체(리스트, 튜플, 문자열 등)를 입력으로 받아 인덱스와 해당 요소를 포함하는 enumerate 객체를 반환하는 함수 # enumerate() 형식 enumerate(iterable, start=0)# 순회할 수 있는(iterable) 객체 #인덱스의 시작값을 설정할 수 있으며 기본값은 0 # 리스트의 각 요소와 인덱스를 함께 출력하는 예시 fruits = ['apple', 'banana', 'cherry'] for index, fruit in enumerate(fruits): print(index, fruit, end = ' ')# 결과 0 apple 1 banana 2 cherry items 딕셔너리를 반복문에 사용할 때 각 (키, 값) 쌍을 반..