본문 바로가기
728x90
반응형

파이썬연습4

빅데이터 분석기사 실기 기출문제 -파이썬 연습(6) - Python Pandas - pivot() 판다스 피벗테이블 만들기 오늘도 빅데이터 분석기사 실기 파이썬 연습 나올것 같지는 않지만 기본기를 다지기 위해 ~ 판다스 피벗테이블을 만들어보자Python Pandas - pivot() 판다스 피벗테이블은 두가지로 만들수 있는데 pandas pivot pandas pivot_table 로 만들 수 있다.  첫번째는 집계함수가 필요없는 피벗테이블을 그야말로 행과 열을 변경할때.두번째는 행과열을 변경해 group by로  aggfunc을 사용해 만들어 줄 수있다.   1. 피벗을 이용해 시리얼의 타입별을 기준으로 각 시리얼들의 설탕량 구하기. 데이터셋은 https://www.kaggle.com/datasets/crawford/80-cereals?select=cereal.csv 서가져옴 ! 시리얼 데이터는 이렇게 생겼다.  이중에 o.. 2024. 7. 8.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(3) - 데이터 전처리 / 결측치 제거 Python DataFrame.dropna(), DataFrame.fillna() 빅데이터 분석기사 실기 기출문제 파이썬 연습 오늘은 2유형의 꽃인 데이터 전처리를 연습해본다.  사실 2유형은 데이터 전처리가 필수지만, 여태까지 결측치가 나온적은 없다 (적어도 내가 시험봤 두번 다..ㅎ)하지만 빅데이터 분석에 필수이기도 하고 뭐. 알아둬서 나쁠건 없지!   1. 결측치 찾기 일단 dropna 를 사용하기 전, 결측치가 있는지 없는지를 판단하기를 위해 null 값을 찾고, sum()을 해준다 df.isnull().sum()  이 데이터 셋엔 결측치가 없는 것을 확인. 2. 만약 결측치가 있다면 ?  결측치 제거df.dropna() # 모든 행을 삭제 df.dropna(axis = 1) # 결측치가 포함된 열을 삭제행/ 열을 삭제해 주는 것이 하나의 방법   3. 결측치 채우기 사실 결측.. 2024. 6. 26.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(2) - 정규화와 표준화 (sklearn preprocessing MinMaxScaler / StandardScaler) 오늘은 빅데이터 분석기사 실기 단골 기출문제  정규화와 표준화!  1. 정규화와 표준화의 차이 정규화 MinMaxScaler() = 컬럼들을 0 ~ 1 사이의 값으로 스케일링 하는 것으로 최소값이 0, 최대값이 1으로 정규화 하는 것 , 회귀 분석에 쓰임  표준화 StandardScaler() = 표준화 방식으로 컬럼들을 평균이 0, 분산이 1인 정규분포로 스케일링하는것 , 분류 분석에 쓰임  2. 정규화 하기 일단 빅데이터 분석기사 실기 8회에서는 두가지의 컬럼을 MinMax Scaling 하고, 그것들의 표준편차의 차를 구하는 문제가 출제되었다. (나는 ... 풀다가 시간이 없어 결국 끝내지못함....ㅎㅎ... ) 이전의 데이터 셋을 대충 이용해보자. 일단 파이썬 정규화를 할때는 두 컬럼 이상을 이용.. 2024. 6. 25.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(1) - 데이터 요약하기 (판다스(Pandas) .groupby() , 집계함수 (sum ,max, min, mean, std) ) 오늘은 파이썬의 기초 of 기초 데이터 요약 및 집계함수.!  빅데이터 분석기사 실기의 아주 걸음마 단계 1유형 문제를 풀으려면 이정돈 기본으로 눈을 감고도 알고 있어야 한다  1. group by 함수 import pandas as pd #그룹화 함수 모를땐 이렇게! help(pd.DataFrame.groupby)df.groupby('컬럼명').FUN() # FUN 자리에는 집계함수를 넣어 쓸 수있음 2. 집계함수 집계 함수도 아주~ 기본중의 기본이니 그냥 외울것. 사실 이것은 외울것 보다는 그냥 기본 지식이므로 .. 따로 외울건 없지만 파이썬 초보에게는 어떻게 쓰는지를 외우는 것이 더 좋겠다 =바로나 참고로 이전 빅데이터 분석기사 실기에서는 1 유형 에 quantile 값을 가지고 수치를 구하는 문제.. 2024. 6. 24.
728x90
반응형