본문 바로가기
빅데이터 분석

빅데이터 분석기사 실기 기출문제 -파이썬 연습(6) - Python Pandas - pivot() 판다스 피벗테이블 만들기

by Salon de arte 2024. 7. 8.
728x90
반응형

 

오늘도 빅데이터 분석기사 실기 파이썬 연습 

나올것 같지는 않지만 기본기를 다지기 위해 ~ 판다스 피벗테이블을 만들어보자

Python Pandas - pivot()

 

판다스 피벗테이블은 두가지로 만들수 있는데 

pandas pivot 

pandas pivot_table 로 만들 수 있다. 

 

첫번째는 집계함수가 필요없는 피벗테이블을 그야말로 행과 열을 변경할때.

두번째는 행과열을 변경해 group by로  aggfunc을 사용해 만들어 줄 수있다. 

 

 

1. 피벗을 이용해 시리얼의 타입별을 기준으로 각 시리얼들의 설탕량 구하기. 

데이터셋은 https://www.kaggle.com/datasets/crawford/80-cereals?select=cereal.csv 서가져옴 ! 

시리얼 데이터는 이렇게 생겼다. 

 

이중에 object type의 데이터를 가지고 pandas pivot을 만들어보면 이렇게 된다.

 

df_pivot =pd.pivot(index= 'type', columns = 'name', values = 'sugars', data= df)

 

그러면 이런 피벗테이블이 완성이 된다. 

보아하니 타입 h 에는 값이 없는가보다. 

 

그럼 pivot_table 을 이용해 aggfunc을 이용해 각 시리얼제조사 (mfr )들의 평균 설탕량을 구해보자. 

df_table = df.pivot_table(index= 'mfr', columns ='name', values = 'sugars', aggfunc ='mean')

 

 

간단하게 구할 수 있다 ~! 

사실 이건 나올것 같지는 않아서 그냥 대충 어떻게 하는지만 알아보기 ~! 

728x90
반응형

댓글