본문 바로가기
빅데이터 분석

2024 빅데이터 분석기사 빅분기 실기 9회 파이썬 공부 -제3유형 (+8회 기출 후기)

by Salon de arte 2024. 11. 22.
728x90
반응형

빅분기 실기 9회^^...

다행히 저번보다 가까운 시험장소 선정했구 ~ 

그래도 열심히?  공부 했다고 할 수있다... ^^ 뭔가 자꾸 떠올리면 내머릿속의 지우개 같지만 

아냐. 할 수있어!!! 

 

마지막이기를 바라며 

제 3유형 정리 해보기 

지난 기억을 되돌려보면 선형 회귀 문제와 로지스틱 회귀 문제 두개가 나왔다~! 

 

일단 선형회귀 공식이다 

 

 

 

from statsmodels.formual.api import ols 

formula= "종속~ 독립1+독립2 .... "


model=ols(formula, data=df).fit()
model.summary()

#회귀계수는 ?
model.params

#오즈비는 ?
np.exp(model.params)

#오즈비 증가는 ?

np.exp(model.params)*증가수

 

 

 

일단 데이터 마님 7회 기출문제로 보면 

model.summary() 한 결과이다 

 

R2 결정계수 = 0.99

Prob= F p_value 이고 , 이 모델이 유의미한지에 대한 내용이다 

 

coef/ intercept 는 상관계수 

 

저번엔 각각의 회귀계수(상관계수) 중 유의성이 가장 낮은 변수의 갯수를 쓰는 것이 문제였다. 

 

유의성이 낮은 것을 볼때는 P>|t| 컬럼에서 0.05 이상인 것을 보는것이다 ~!!!!

 

 

 

두번째문제는

여기서 유의한 컬럼들을 가지고 다시 모델을 만든후 

상관계수의 평균을 구하는거! 

구할땐 model.params로 상관계수 확인하고 여기서 평균을 구하면 되겠지 ? 

물론 똑같이 나오지 않겠지만 

 

세번째는 회긔계수 3증가시 오즈비 ?에 대한 문제 였던거같은데

 

그러면 params 에 *3 하면 되겠지요 ~ 제발 틀리지 말아보자 ㅎㅎ 

 

상관계수 (회귀계수)의미 , 오즈비, 잘 잡고가기 ! 

 

 

 

두번째는 로지스틱 회귀모델

로지스틱은 범주형 변수일때 쓰이겠주 

 

 

 

 

from statsmodels.formula.api import logit

formula="종속~ 독립1+독립2+~~~~"

model=logit(formula,data=df).fit()
model.summary

 

 

 

보는 법은 같고 

유의확률에 대한 내용이 저번에도 나왔으니 이거 P>|z| 잘보기 

 

 

유의확률 0.05 보다 크면 무의미 한 데이터이므로 ! 

 

저번에는 유의확률이 작은 것들을 제외하고 다시 모델링해서 예측하는 문제가나왔으니 잘 봐두기! 

 

 

오즈비는 마찬가지로 

 

np.exp(model.params)로 본다 

 

 

 

 

 

선형회귀에서는 모델링 후에 예측하는 것이었음 

주어진 데이터를 데이터 프레임으로 만들어서 model.predict() 해 

예측값을 나타내는것이었다 ....

 

작년 후기버니까 50점 맞을것같다고 했네 ..ㅋㅋㅋ

사실 2유형에서 겁나깎여서 20점인가 나온듯ㅋㅋ

개쓰레기 점수 ^^... 

 

이번엔 제발 65점만 맞자 제발!!!!!!!!!!!!!!!!!!!!!!!!화이탱 

728x90
반응형

댓글