본문 바로가기
728x90
반응형

빅분기6

2024 빅데이터 분석기사 빅분기 실기 9회 파이썬 공부 -제3유형 (+8회 기출 후기) 빅분기 실기 9회^^...다행히 저번보다 가까운 시험장소 선정했구 ~ 그래도 열심히?  공부 했다고 할 수있다... ^^ 뭔가 자꾸 떠올리면 내머릿속의 지우개 같지만 아냐. 할 수있어!!!  마지막이기를 바라며 제 3유형 정리 해보기 지난 기억을 되돌려보면 선형 회귀 문제와 로지스틱 회귀 문제 두개가 나왔다~!  일단 선형회귀 공식이다    from statsmodels.formual.api import ols formula= "종속~ 독립1+독립2 .... "model=ols(formula, data=df).fit()model.summary()#회귀계수는 ?model.params#오즈비는 ?np.exp(model.params)#오즈비 증가는 ?np.exp(model.params)*증가수   일단 데이터.. 2024. 11. 22.
2024 빅데이터 분석기사 빅분기 실기 9회 파이썬 공부 -제1유형 공부법 다시 돌아온 빅데이터 분석기사 실기 2024 9회... ㅎㅎ  그동안 뜸했던 블로그 다시 써보기 !  10월부터 틈틈히 보며 공부했던 1유형 연습들인데 적어보려고 한다. 일단은 파이썬사용은 아나콘다 깔아서 주피터로 작성했다. 나중에 시험환경 테스트에서 다시한번 해보는걸로 주피터는 실행하면 바로 답이 나오지만 시험환경은 전체코드를 실행하고 오류 찾아가야하기 때문에 약간의 번거로움이 있어서 한줄씩 실행해보면서 코드를 추가해야한다.  일단 이건 빅분기 홈페이지에서 시험환경 테스트에서 경험해봐야한다. https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육.. 2024. 10. 30.
빅데이터 분석기사 실기 연습문제 - 제2유형 모델링 전처리 (1) One-hot encoding /Label encoding/ pd.get_dummies() 빅데이터 분석기사 실기 연습 오늘은 제 2유형 모델링 7회 8회 기출문제에서는 수치형 데이터를 예측하는 문제가 나왔다.  일단 생각을해보면 7회는 컬럼명을 틀려서 떨어졌고 ^^ ; 8회는 20점을 깎였다. 왜일지는 모르겠음. 일단 가장 큰 이유는 정수형을 해버려서 값이 많이 달라진게 아닐까 싶은데 . 오카방에선 이걸로 말들이 많다.  일단 나는 정수형은 안하는걸로. 정수형을 해버리는 순간 값이 많이 틀려져서 성능평가에서 많이 달라질 수있는것 같다. 왜냐 7회차때는 컬럼명 빼곤 깎인점수가 없고, 정수형 안하고 소수점 그대로 출력해서 제출했기 때문에 생각해볼 수있는 문제.  어쨌든 제 2유형은 플로우를 기억해두는게 좋다. 1. 전처리하기 Null 값 확인 ,outlier 확인 -> 이 두가지는 사실 이전에 .. 2024. 7. 11.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(6) - Python Pandas - pivot() 판다스 피벗테이블 만들기 오늘도 빅데이터 분석기사 실기 파이썬 연습 나올것 같지는 않지만 기본기를 다지기 위해 ~ 판다스 피벗테이블을 만들어보자Python Pandas - pivot() 판다스 피벗테이블은 두가지로 만들수 있는데 pandas pivot pandas pivot_table 로 만들 수 있다.  첫번째는 집계함수가 필요없는 피벗테이블을 그야말로 행과 열을 변경할때.두번째는 행과열을 변경해 group by로  aggfunc을 사용해 만들어 줄 수있다.   1. 피벗을 이용해 시리얼의 타입별을 기준으로 각 시리얼들의 설탕량 구하기. 데이터셋은 https://www.kaggle.com/datasets/crawford/80-cereals?select=cereal.csv 서가져옴 ! 시리얼 데이터는 이렇게 생겼다.  이중에 o.. 2024. 7. 8.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(5) - 상관관계 구하기 Pandas DataFrame. Corr 피어슨 상관관계, 스피어만 상관관계 빅데이터 분석기사 실기 기출문제 연습 파이썬 연습! 이번에는 상관관계 구하기.  상관관계 구하기는 작년 빅데이터 분석기사 7회에 1유형에 나왔던 문제... ! 아마 주가 중에 가장 상관관계가 높은 것을 구하는 문제였던것으로 기억난다.  1. 상관관계 Pandas DataFrame Corr 상관관계는 .corr 함수를 사용해 구하면 된다.일단 상관관계를 구할때는 method 를 이용하는데 pearson, kendall, spearman 을 이용한다.   사실 이렇게까지 디테일하게 나오지는 않을 것 같지만 그래도 통계를 공부하면 알아둘 상관계수의 종류들을 대략적으로 정리해본다.  1-1 . Pearson -1~ 1사이의 상관계수로 나타냄. X 와 Y 간의 선형 상관 관계를 계량화한 수치 (위키백과)  -1 .. 2024. 7. 3.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(3) - 데이터 전처리 / 결측치 제거 Python DataFrame.dropna(), DataFrame.fillna() 빅데이터 분석기사 실기 기출문제 파이썬 연습 오늘은 2유형의 꽃인 데이터 전처리를 연습해본다.  사실 2유형은 데이터 전처리가 필수지만, 여태까지 결측치가 나온적은 없다 (적어도 내가 시험봤 두번 다..ㅎ)하지만 빅데이터 분석에 필수이기도 하고 뭐. 알아둬서 나쁠건 없지!   1. 결측치 찾기 일단 dropna 를 사용하기 전, 결측치가 있는지 없는지를 판단하기를 위해 null 값을 찾고, sum()을 해준다 df.isnull().sum()  이 데이터 셋엔 결측치가 없는 것을 확인. 2. 만약 결측치가 있다면 ?  결측치 제거df.dropna() # 모든 행을 삭제 df.dropna(axis = 1) # 결측치가 포함된 열을 삭제행/ 열을 삭제해 주는 것이 하나의 방법   3. 결측치 채우기 사실 결측.. 2024. 6. 26.
728x90
반응형