728x90 반응형 빅데이터분석기사실기기출2 빅데이터 분석기사 실기 기출문제 -파이썬 연습(4) - 데이터 프레임 만들기 Python Pandas.DataFrame() 빅데이터 분석기사 실기 기출문제 파이썬 연습 - 데이터 프레임 만들기 빅데이터 분석기사 실기 8회 3유형은 데이터 프레임으로 값을 넣어서 예측하는 문제가 있었음!! 아 물론 2유형도 답 제출시 무조건 dataframe 형식으로 제출을 해야하니, 반드시 알아야 할 함수다. 데이터 프레임을 만들때는 pandas 라이브러리에서 DataFrame 을 사용해서 만드는데 아주 간단한 방식이다. 1. Pd.DataFrame 원리는 가져올 데이터, 컬럼, 데이터 타입을 선언해주면 된다. 컬럼명 :[숫자, 숫자] 이렇게 외워서 생각해보기 import pandas as pd df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})df 예를 들어 빅데이터 분석기사 3유형에서는 선형회.. 2024. 6. 29. 빅데이터 분석기사 실기 기출문제 -파이썬 연습(3) - 데이터 전처리 / 결측치 제거 Python DataFrame.dropna(), DataFrame.fillna() 빅데이터 분석기사 실기 기출문제 파이썬 연습 오늘은 2유형의 꽃인 데이터 전처리를 연습해본다. 사실 2유형은 데이터 전처리가 필수지만, 여태까지 결측치가 나온적은 없다 (적어도 내가 시험봤 두번 다..ㅎ)하지만 빅데이터 분석에 필수이기도 하고 뭐. 알아둬서 나쁠건 없지! 1. 결측치 찾기 일단 dropna 를 사용하기 전, 결측치가 있는지 없는지를 판단하기를 위해 null 값을 찾고, sum()을 해준다 df.isnull().sum() 이 데이터 셋엔 결측치가 없는 것을 확인. 2. 만약 결측치가 있다면 ? 결측치 제거df.dropna() # 모든 행을 삭제 df.dropna(axis = 1) # 결측치가 포함된 열을 삭제행/ 열을 삭제해 주는 것이 하나의 방법 3. 결측치 채우기 사실 결측.. 2024. 6. 26. 이전 1 다음 728x90 반응형