[데이터사이언스] 선형회귀분석, 로지스틱 회귀분석, KNN
선형회귀분석: 머신러닝파트 minimize MSE 경사하강법(Gradient Descent): 보폭을 결정하는 개념을 Learning Rate(학습률, 에타, 일반적으로 0.05) 전체 최적을 (optimal minimum) 보장하지는 않음 다중공선성: 독립변수들 간에 강한 상관관계가 존재하는 상태 확인방법: 상관계수, VIF 클수록 다중공선성이 큼 해결방법: 다중공선성이 있는 독립변수 제거, 머신러닝에서는 크게 고민하지 않는다 one-hot-encoding → Dummy variable 다중공선성 문제 해결: Ridge(가중치 조절), LASSO(데이터 제거) 로지스틱 회귀분석 로지스틱 → 로그 느낌 Classification: 이진 분류 모델, class 예측하는 문제, 이상, 이하로 수치형 데이터도..
2023. 4. 2.