728x90
반응형
오늘도 빅데이터 분석기사 실기 파이썬 연습
나올것 같지는 않지만 기본기를 다지기 위해 ~ 판다스 피벗테이블을 만들어보자
Python Pandas - pivot()
판다스 피벗테이블은 두가지로 만들수 있는데
pandas pivot
pandas pivot_table 로 만들 수 있다.
첫번째는 집계함수가 필요없는 피벗테이블을 그야말로 행과 열을 변경할때.
두번째는 행과열을 변경해 group by로 aggfunc을 사용해 만들어 줄 수있다.
1. 피벗을 이용해 시리얼의 타입별을 기준으로 각 시리얼들의 설탕량 구하기.
데이터셋은 https://www.kaggle.com/datasets/crawford/80-cereals?select=cereal.csv 서가져옴 !
시리얼 데이터는 이렇게 생겼다.
이중에 object type의 데이터를 가지고 pandas pivot을 만들어보면 이렇게 된다.
df_pivot =pd.pivot(index= 'type', columns = 'name', values = 'sugars', data= df)
그러면 이런 피벗테이블이 완성이 된다.
보아하니 타입 h 에는 값이 없는가보다.
그럼 pivot_table 을 이용해 aggfunc을 이용해 각 시리얼제조사 (mfr )들의 평균 설탕량을 구해보자.
df_table = df.pivot_table(index= 'mfr', columns ='name', values = 'sugars', aggfunc ='mean')
간단하게 구할 수 있다 ~!
사실 이건 나올것 같지는 않아서 그냥 대충 어떻게 하는지만 알아보기 ~!
728x90
반응형
댓글