본문 바로가기
728x90
반응형

빅데이터분석기사실기4

빅데이터 분석기사 실기 9회 준비 파이썬 - 1,2,3유형 최종 정리 (7,8회 기출문제 정리해보기) 빅분기 D_2 남아따 ... ㅎ 일단 오늘은 헷갈릴 수있는 코드들 정리해보기.  1유형은 여태까지의 7,8회 시험으로 보아 엄청나게 어려웠던건 아니였지만 groupby(), 집계함수 sum, mean, median, std 등 기초통계를 구할 수 있으면 어느정도 풀 수 있었다. 만약에 시간에 대한 문제가 나온다 ? ㅎㅎ.. 음 pd.to_datetime 을 이용해 풀 수 있을 지도  데이터마님 기출 6회 문제를 풀어보는 것도 좋을듯 일단 pd.to_datetime은 str (문자열)을 시간으로 변경해주는 것이다. 숫자열을 문자열로 바꾸는 함수는 .astype('str')로 변경해주기 , str.zfill(자리수)는 y m d hh ss 를 zfill을 이용해 채워주기.  시간을 초로 변경하는 함수는 .d.. 2024. 11. 28.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(6) - Python Pandas - pivot() 판다스 피벗테이블 만들기 오늘도 빅데이터 분석기사 실기 파이썬 연습 나올것 같지는 않지만 기본기를 다지기 위해 ~ 판다스 피벗테이블을 만들어보자Python Pandas - pivot() 판다스 피벗테이블은 두가지로 만들수 있는데 pandas pivot pandas pivot_table 로 만들 수 있다.  첫번째는 집계함수가 필요없는 피벗테이블을 그야말로 행과 열을 변경할때.두번째는 행과열을 변경해 group by로  aggfunc을 사용해 만들어 줄 수있다.   1. 피벗을 이용해 시리얼의 타입별을 기준으로 각 시리얼들의 설탕량 구하기. 데이터셋은 https://www.kaggle.com/datasets/crawford/80-cereals?select=cereal.csv 서가져옴 ! 시리얼 데이터는 이렇게 생겼다.  이중에 o.. 2024. 7. 8.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(5) - 상관관계 구하기 Pandas DataFrame. Corr 피어슨 상관관계, 스피어만 상관관계 빅데이터 분석기사 실기 기출문제 연습 파이썬 연습! 이번에는 상관관계 구하기.  상관관계 구하기는 작년 빅데이터 분석기사 7회에 1유형에 나왔던 문제... ! 아마 주가 중에 가장 상관관계가 높은 것을 구하는 문제였던것으로 기억난다.  1. 상관관계 Pandas DataFrame Corr 상관관계는 .corr 함수를 사용해 구하면 된다.일단 상관관계를 구할때는 method 를 이용하는데 pearson, kendall, spearman 을 이용한다.   사실 이렇게까지 디테일하게 나오지는 않을 것 같지만 그래도 통계를 공부하면 알아둘 상관계수의 종류들을 대략적으로 정리해본다.  1-1 . Pearson -1~ 1사이의 상관계수로 나타냄. X 와 Y 간의 선형 상관 관계를 계량화한 수치 (위키백과)  -1 .. 2024. 7. 3.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(4) - 데이터 프레임 만들기 Python Pandas.DataFrame() 빅데이터 분석기사 실기 기출문제 파이썬 연습 - 데이터 프레임 만들기 빅데이터 분석기사 실기 8회 3유형은 데이터 프레임으로 값을 넣어서 예측하는 문제가 있었음!! 아 물론 2유형도 답 제출시 무조건 dataframe 형식으로 제출을 해야하니, 반드시 알아야 할 함수다. 데이터 프레임을 만들때는 pandas 라이브러리에서 DataFrame 을 사용해서 만드는데 아주 간단한 방식이다.   1. Pd.DataFrame  원리는 가져올 데이터, 컬럼, 데이터 타입을 선언해주면 된다. 컬럼명 :[숫자, 숫자] 이렇게 외워서 생각해보기 import pandas as pd df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})df 예를 들어 빅데이터 분석기사 3유형에서는 선형회.. 2024. 6. 29.
728x90
반응형