728x90 반응형 빅분기실기8회기출1 빅데이터 분석기사 실기 연습문제 - 제2유형 모델링 전처리 (1) One-hot encoding /Label encoding/ pd.get_dummies() 빅데이터 분석기사 실기 연습 오늘은 제 2유형 모델링 7회 8회 기출문제에서는 수치형 데이터를 예측하는 문제가 나왔다. 일단 생각을해보면 7회는 컬럼명을 틀려서 떨어졌고 ^^ ; 8회는 20점을 깎였다. 왜일지는 모르겠음. 일단 가장 큰 이유는 정수형을 해버려서 값이 많이 달라진게 아닐까 싶은데 . 오카방에선 이걸로 말들이 많다. 일단 나는 정수형은 안하는걸로. 정수형을 해버리는 순간 값이 많이 틀려져서 성능평가에서 많이 달라질 수있는것 같다. 왜냐 7회차때는 컬럼명 빼곤 깎인점수가 없고, 정수형 안하고 소수점 그대로 출력해서 제출했기 때문에 생각해볼 수있는 문제. 어쨌든 제 2유형은 플로우를 기억해두는게 좋다. 1. 전처리하기 Null 값 확인 ,outlier 확인 -> 이 두가지는 사실 이전에 .. 2024. 7. 11. 이전 1 다음 728x90 반응형