본문 바로가기
728x90
반응형

파이썬기초4

빅데이터 분석기사 실기 기출문제 -파이썬 연습(4) - 데이터 프레임 만들기 Python Pandas.DataFrame() 빅데이터 분석기사 실기 기출문제 파이썬 연습 - 데이터 프레임 만들기 빅데이터 분석기사 실기 8회 3유형은 데이터 프레임으로 값을 넣어서 예측하는 문제가 있었음!! 아 물론 2유형도 답 제출시 무조건 dataframe 형식으로 제출을 해야하니, 반드시 알아야 할 함수다. 데이터 프레임을 만들때는 pandas 라이브러리에서 DataFrame 을 사용해서 만드는데 아주 간단한 방식이다.   1. Pd.DataFrame  원리는 가져올 데이터, 컬럼, 데이터 타입을 선언해주면 된다. 컬럼명 :[숫자, 숫자] 이렇게 외워서 생각해보기 import pandas as pd df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})df 예를 들어 빅데이터 분석기사 3유형에서는 선형회.. 2024. 6. 29.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(3) - 데이터 전처리 / 결측치 제거 Python DataFrame.dropna(), DataFrame.fillna() 빅데이터 분석기사 실기 기출문제 파이썬 연습 오늘은 2유형의 꽃인 데이터 전처리를 연습해본다.  사실 2유형은 데이터 전처리가 필수지만, 여태까지 결측치가 나온적은 없다 (적어도 내가 시험봤 두번 다..ㅎ)하지만 빅데이터 분석에 필수이기도 하고 뭐. 알아둬서 나쁠건 없지!   1. 결측치 찾기 일단 dropna 를 사용하기 전, 결측치가 있는지 없는지를 판단하기를 위해 null 값을 찾고, sum()을 해준다 df.isnull().sum()  이 데이터 셋엔 결측치가 없는 것을 확인. 2. 만약 결측치가 있다면 ?  결측치 제거df.dropna() # 모든 행을 삭제 df.dropna(axis = 1) # 결측치가 포함된 열을 삭제행/ 열을 삭제해 주는 것이 하나의 방법   3. 결측치 채우기 사실 결측.. 2024. 6. 26.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(2) - 정규화와 표준화 (sklearn preprocessing MinMaxScaler / StandardScaler) 오늘은 빅데이터 분석기사 실기 단골 기출문제  정규화와 표준화!  1. 정규화와 표준화의 차이 정규화 MinMaxScaler() = 컬럼들을 0 ~ 1 사이의 값으로 스케일링 하는 것으로 최소값이 0, 최대값이 1으로 정규화 하는 것 , 회귀 분석에 쓰임  표준화 StandardScaler() = 표준화 방식으로 컬럼들을 평균이 0, 분산이 1인 정규분포로 스케일링하는것 , 분류 분석에 쓰임  2. 정규화 하기 일단 빅데이터 분석기사 실기 8회에서는 두가지의 컬럼을 MinMax Scaling 하고, 그것들의 표준편차의 차를 구하는 문제가 출제되었다. (나는 ... 풀다가 시간이 없어 결국 끝내지못함....ㅎㅎ... ) 이전의 데이터 셋을 대충 이용해보자. 일단 파이썬 정규화를 할때는 두 컬럼 이상을 이용.. 2024. 6. 25.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(1) - 데이터 요약하기 (판다스(Pandas) .groupby() , 집계함수 (sum ,max, min, mean, std) ) 오늘은 파이썬의 기초 of 기초 데이터 요약 및 집계함수.!  빅데이터 분석기사 실기의 아주 걸음마 단계 1유형 문제를 풀으려면 이정돈 기본으로 눈을 감고도 알고 있어야 한다  1. group by 함수 import pandas as pd #그룹화 함수 모를땐 이렇게! help(pd.DataFrame.groupby)df.groupby('컬럼명').FUN() # FUN 자리에는 집계함수를 넣어 쓸 수있음 2. 집계함수 집계 함수도 아주~ 기본중의 기본이니 그냥 외울것. 사실 이것은 외울것 보다는 그냥 기본 지식이므로 .. 따로 외울건 없지만 파이썬 초보에게는 어떻게 쓰는지를 외우는 것이 더 좋겠다 =바로나 참고로 이전 빅데이터 분석기사 실기에서는 1 유형 에 quantile 값을 가지고 수치를 구하는 문제.. 2024. 6. 24.
728x90
반응형