본문 바로가기
728x90
반응형

빅데이터 분석기사3

빅데이터 분석기사 실기 기출문제 -파이썬 연습(5) - 상관관계 구하기 Pandas DataFrame. Corr 피어슨 상관관계, 스피어만 상관관계 빅데이터 분석기사 실기 기출문제 연습 파이썬 연습! 이번에는 상관관계 구하기.  상관관계 구하기는 작년 빅데이터 분석기사 7회에 1유형에 나왔던 문제... ! 아마 주가 중에 가장 상관관계가 높은 것을 구하는 문제였던것으로 기억난다.  1. 상관관계 Pandas DataFrame Corr 상관관계는 .corr 함수를 사용해 구하면 된다.일단 상관관계를 구할때는 method 를 이용하는데 pearson, kendall, spearman 을 이용한다.   사실 이렇게까지 디테일하게 나오지는 않을 것 같지만 그래도 통계를 공부하면 알아둘 상관계수의 종류들을 대략적으로 정리해본다.  1-1 . Pearson -1~ 1사이의 상관계수로 나타냄. X 와 Y 간의 선형 상관 관계를 계량화한 수치 (위키백과)  -1 .. 2024. 7. 3.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(2) - 정규화와 표준화 (sklearn preprocessing MinMaxScaler / StandardScaler) 오늘은 빅데이터 분석기사 실기 단골 기출문제  정규화와 표준화!  1. 정규화와 표준화의 차이 정규화 MinMaxScaler() = 컬럼들을 0 ~ 1 사이의 값으로 스케일링 하는 것으로 최소값이 0, 최대값이 1으로 정규화 하는 것 , 회귀 분석에 쓰임  표준화 StandardScaler() = 표준화 방식으로 컬럼들을 평균이 0, 분산이 1인 정규분포로 스케일링하는것 , 분류 분석에 쓰임  2. 정규화 하기 일단 빅데이터 분석기사 실기 8회에서는 두가지의 컬럼을 MinMax Scaling 하고, 그것들의 표준편차의 차를 구하는 문제가 출제되었다. (나는 ... 풀다가 시간이 없어 결국 끝내지못함....ㅎㅎ... ) 이전의 데이터 셋을 대충 이용해보자. 일단 파이썬 정규화를 할때는 두 컬럼 이상을 이용.. 2024. 6. 25.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(1) - 데이터 요약하기 (판다스(Pandas) .groupby() , 집계함수 (sum ,max, min, mean, std) ) 오늘은 파이썬의 기초 of 기초 데이터 요약 및 집계함수.!  빅데이터 분석기사 실기의 아주 걸음마 단계 1유형 문제를 풀으려면 이정돈 기본으로 눈을 감고도 알고 있어야 한다  1. group by 함수 import pandas as pd #그룹화 함수 모를땐 이렇게! help(pd.DataFrame.groupby)df.groupby('컬럼명').FUN() # FUN 자리에는 집계함수를 넣어 쓸 수있음 2. 집계함수 집계 함수도 아주~ 기본중의 기본이니 그냥 외울것. 사실 이것은 외울것 보다는 그냥 기본 지식이므로 .. 따로 외울건 없지만 파이썬 초보에게는 어떻게 쓰는지를 외우는 것이 더 좋겠다 =바로나 참고로 이전 빅데이터 분석기사 실기에서는 1 유형 에 quantile 값을 가지고 수치를 구하는 문제.. 2024. 6. 24.
728x90
반응형