ROC curve(3)
-
[ADP] R을 활용한 모형평가 방법(2) - Confusion matrix, ROC Curve, Gain chart
https://todayisbetterthanyesterday.tistory.com/5 헷갈리는 통계기본 - 정확도, 정밀도, 재현율, 특이도, G-mean, F1 measure, ROC curve&AUC, Gain Chart & Lift cur 추출한 훈련용 자료를 사용하여 분류 모형을 적합후 검증용 데이터를 사용하여 정확도를 평가할 때, 범주형 변수에 대해 사용되는 confusion matrix, ROC curve, gain chart, lift curve에 대해서 알아보자. 모 todayisbetterthanyesterday.tistory.com 위의 링크에 Confusion matrix에 관한 주요 지표들의 정의와 ROC curve, Gain chart&Lift chart의 설명이 모두 포함되어 ..
2020.08.02 -
[Python]로지스틱회귀분석 실습
실습에 사용될 데이터 : 개인대출 데이터 -----target Personal Loan ( 0 or 1 의 값을 갖는 변수이다. ) -----feature Experience 경력 Income 수입 Famliy 가족단위 CCAvg 월 카드사용량 Education 교육수준 (1: undergrad; 2, Graduate; 3; Advance ) Mortgage 가계대출 Securities account 유가증권계좌유무 CD account 양도예금증서 계좌 유무 Online 온라인계좌유무 CreidtCard 신용카드유무 여태 단순/다중회귀분석과 다중공선성을 해결하기 위한 방법을 Python코드로 알아보았다. 이제 sigmoid function을 이용한 분류/예측을 하는 로지스틱 회귀분석을 실습하려고 한다. ..
2020.06.20 -
헷갈리는 통계기본 - 정확도, 정밀도, 재현율, 특이도, G-mean, F1 measure, ROC curve&AUC, Gain Chart & Lift curve 정리
추출한 훈련용 자료를 사용하여 분류 모형을 적합후 검증용 데이터를 사용하여 정확도를 평가할 때, 범주형 변수에 대해 사용되는 confusion matrix, ROC curve, gain chart, lift curve에 대해서 알아보자. 모델 성능 평가 방법 1. Confusion matrix(오분류표) 오분류표는 아래의 형태와 같다. TP(True Positive) : 실제값과 예측치 모두 True TN(True Negative) : 실제값과 예측치 모두 False FP(False Positive) : 실제값은 False, 예측은 True FN(False Negative) : 실제값은 True, 예측은 False 로 이루어진 표이다. 이 때 정분류율(accuracy) = TP + TN / TP + FN..
2020.06.09