본문 바로가기
728x90
반응형

빅데이터 분석13

2024 빅데이터분석기사 실기 9회 기출문제 후기 11/30일 대망의 빅데이터 분석기사 실기를 봤다 ^^...  일단 9시반에 입실해서 대기하고 있는데 서버가 터짐 ^^ 그래서 한 10분정도 시험끝나는 시간 지연~  네에 ~^^ 불길했지.. 이때부터 ㅠㅋㅋㅋㅋㅋㅋㅋ     일단 기억을 더듬어 보자  1유형  세번본 시험중에 역대급으로 어렵고 복잡했던듯ㅋㅋㅋㅋㅋㅋㅋㅋㅋ7회는 그나마 1유형 세개 다 풀 수있는 정도였다면  8회는 그룹바이로 비벼볼 수 있는 문제 9회는 1번문제 까지는 어찌저찌 해보겠지만 2,3 문제가 헬이였음 ^^....  어쨋든  1번  은행 데이터를 보고 총 대출액 = 비은행 대출액+ 주은행 대출액(?)을 더해 하나의 컬럼을 만들고 우편변호별로 GROUP BY 를해서 성별 1 과 성별 2의 총 대출액의 차가 가장 큰 우편번호 고르기 성별.. 2024. 12. 9.
빅데이터 분석기사 실기 9회 준비 파이썬 - 1,2,3유형 최종 정리 (7,8회 기출문제 정리해보기) 빅분기 D_2 남아따 ... ㅎ 일단 오늘은 헷갈릴 수있는 코드들 정리해보기.  1유형은 여태까지의 7,8회 시험으로 보아 엄청나게 어려웠던건 아니였지만 groupby(), 집계함수 sum, mean, median, std 등 기초통계를 구할 수 있으면 어느정도 풀 수 있었다. 만약에 시간에 대한 문제가 나온다 ? ㅎㅎ.. 음 pd.to_datetime 을 이용해 풀 수 있을 지도  데이터마님 기출 6회 문제를 풀어보는 것도 좋을듯 일단 pd.to_datetime은 str (문자열)을 시간으로 변경해주는 것이다. 숫자열을 문자열로 바꾸는 함수는 .astype('str')로 변경해주기 , str.zfill(자리수)는 y m d hh ss 를 zfill을 이용해 채워주기.  시간을 초로 변경하는 함수는 .d.. 2024. 11. 28.
2024 빅데이터 분석기사 빅분기 실기 9회 파이썬 공부 -제3유형 (+8회 기출 후기) 빅분기 실기 9회^^...다행히 저번보다 가까운 시험장소 선정했구 ~ 그래도 열심히?  공부 했다고 할 수있다... ^^ 뭔가 자꾸 떠올리면 내머릿속의 지우개 같지만 아냐. 할 수있어!!!  마지막이기를 바라며 제 3유형 정리 해보기 지난 기억을 되돌려보면 선형 회귀 문제와 로지스틱 회귀 문제 두개가 나왔다~!  일단 선형회귀 공식이다    from statsmodels.formual.api import ols formula= "종속~ 독립1+독립2 .... "model=ols(formula, data=df).fit()model.summary()#회귀계수는 ?model.params#오즈비는 ?np.exp(model.params)#오즈비 증가는 ?np.exp(model.params)*증가수   일단 데이터.. 2024. 11. 22.
2024 빅데이터 분석기사 빅분기 실기 9회 파이썬 공부 -제2유형 (작년 실기 후기 +) 빅분기 실기 9회가 4일 앞으로 다가온.. 그동안 하루에 한줄이라도 꾸준히 하려고 했지만, 계속해서 실수를 하고 있기 때문에 빅분기 실기  파이썬 2유형 공부법 총정리하기.  시험환경 문제도 다시한번 풀어보자.  일단 나의 재수생 경험으로는 회귀모델이 두번 다 나왔었고, 이때 나온 소수점을 정수형으로 바꾸거나 반올림 하면 큰 감점이 있는듯 싶다^^ (맨 처음 실기에서는 소수점 나온 대로 제출했고, 튜닝 따윈 안했는데 만점이 나왔으나.. 컬럼명 틀려서 -3점 으로 떨어졌고,, ㅎㅎㅎ 그 다음엔 정수형으로 변경해서 제출했거, 튜닝 안했는데 20점 나옴ㅋㅋ ) 그래서 아무래도 모델평가에 영향을 미치는 것 같다.  나는 그냥 다른거 안하고 앙상블 모델링으로 할 것이기 때문에 순서를 차근차근 외워두기.  1.ED.. 2024. 11. 20.
2024 빅데이터 분석기사 빅분기 실기 9회 파이썬 공부 -제1유형 공부법 다시 돌아온 빅데이터 분석기사 실기 2024 9회... ㅎㅎ  그동안 뜸했던 블로그 다시 써보기 !  10월부터 틈틈히 보며 공부했던 1유형 연습들인데 적어보려고 한다. 일단은 파이썬사용은 아나콘다 깔아서 주피터로 작성했다. 나중에 시험환경 테스트에서 다시한번 해보는걸로 주피터는 실행하면 바로 답이 나오지만 시험환경은 전체코드를 실행하고 오류 찾아가야하기 때문에 약간의 번거로움이 있어서 한줄씩 실행해보면서 코드를 추가해야한다.  일단 이건 빅분기 홈페이지에서 시험환경 테스트에서 경험해봐야한다. https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육.. 2024. 10. 30.
빅데이터 분석기사 실기 연습문제 - 제2유형 모델링 전처리 (1) One-hot encoding /Label encoding/ pd.get_dummies() 빅데이터 분석기사 실기 연습 오늘은 제 2유형 모델링 7회 8회 기출문제에서는 수치형 데이터를 예측하는 문제가 나왔다.  일단 생각을해보면 7회는 컬럼명을 틀려서 떨어졌고 ^^ ; 8회는 20점을 깎였다. 왜일지는 모르겠음. 일단 가장 큰 이유는 정수형을 해버려서 값이 많이 달라진게 아닐까 싶은데 . 오카방에선 이걸로 말들이 많다.  일단 나는 정수형은 안하는걸로. 정수형을 해버리는 순간 값이 많이 틀려져서 성능평가에서 많이 달라질 수있는것 같다. 왜냐 7회차때는 컬럼명 빼곤 깎인점수가 없고, 정수형 안하고 소수점 그대로 출력해서 제출했기 때문에 생각해볼 수있는 문제.  어쨌든 제 2유형은 플로우를 기억해두는게 좋다. 1. 전처리하기 Null 값 확인 ,outlier 확인 -> 이 두가지는 사실 이전에 .. 2024. 7. 11.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(6) - Python Pandas - pivot() 판다스 피벗테이블 만들기 오늘도 빅데이터 분석기사 실기 파이썬 연습 나올것 같지는 않지만 기본기를 다지기 위해 ~ 판다스 피벗테이블을 만들어보자Python Pandas - pivot() 판다스 피벗테이블은 두가지로 만들수 있는데 pandas pivot pandas pivot_table 로 만들 수 있다.  첫번째는 집계함수가 필요없는 피벗테이블을 그야말로 행과 열을 변경할때.두번째는 행과열을 변경해 group by로  aggfunc을 사용해 만들어 줄 수있다.   1. 피벗을 이용해 시리얼의 타입별을 기준으로 각 시리얼들의 설탕량 구하기. 데이터셋은 https://www.kaggle.com/datasets/crawford/80-cereals?select=cereal.csv 서가져옴 ! 시리얼 데이터는 이렇게 생겼다.  이중에 o.. 2024. 7. 8.
빅데이터 분석기사 실기 기출문제 -파이썬 연습(5) - 상관관계 구하기 Pandas DataFrame. Corr 피어슨 상관관계, 스피어만 상관관계 빅데이터 분석기사 실기 기출문제 연습 파이썬 연습! 이번에는 상관관계 구하기.  상관관계 구하기는 작년 빅데이터 분석기사 7회에 1유형에 나왔던 문제... ! 아마 주가 중에 가장 상관관계가 높은 것을 구하는 문제였던것으로 기억난다.  1. 상관관계 Pandas DataFrame Corr 상관관계는 .corr 함수를 사용해 구하면 된다.일단 상관관계를 구할때는 method 를 이용하는데 pearson, kendall, spearman 을 이용한다.   사실 이렇게까지 디테일하게 나오지는 않을 것 같지만 그래도 통계를 공부하면 알아둘 상관계수의 종류들을 대략적으로 정리해본다.  1-1 . Pearson -1~ 1사이의 상관계수로 나타냄. X 와 Y 간의 선형 상관 관계를 계량화한 수치 (위키백과)  -1 .. 2024. 7. 3.
728x90
반응형