2023년 1월 29일 일요일

아빠가 들려 주는 [통계] 로지스틱 회귀분석 후 ROC 커브 그리기(2)

 아빠가 들려 주는 [통계] 로지스틱 회귀분석 후 ROC 커브 그리기(2)

배경

오래전에 썼던 글이 있는데, 저의 글 중에서는 그나마 조회수가 좀 나오지만, 

지금은 그것보다는 훨씬 쉽고 간단한 방법을 만들어 두었기에 소개합니다. 

그렇지만, 이전에 썼던 글을 대충이라도 읽어 보길 추천합니다. 

과거에는 얼마나 어려웠는지 아는 것도 좋고, 

기본 개념과 중간 과정을 아는 것도 중요합니다. 

참고할 오래전 글


가장 간단한 방법

통계포탈에 들어와서,

"7-5. ROC from LR *"라고 검색하고, 그 아래 링크를 클릭합니다. 

참고로 *를 한 것은 특히 기본적인 것이라고 생각되는 것을 

저의 주관으로 표시한 것입니다. 



다른 옵션들도 있지만, 이 글의 목적에 맞게 지금은 
빨간 사각과 같이 모두 "logisti regression"라고 선택합니다. 

오른쪽 파란 사각에 보듯이 예제 데이터가 보입니다. 
다양한 변수들이 있는데, 
'event'에는 지금 처럼 yes와 no가 있거나 1과 0이 있어야 합니다. 
더 권장하고 일반적인 것은 1과 0이며 
당연히 1은 event가 일어났다는 뜻이고, yes를 의미하고, 
0은 event가 일어나지 않았다는 뜻이며, no와 같습니다. 


4번째 탭에서는 일반적인 '로지스틱 회귀분석'의 결과를 보여주는데, 
일반적인 해석은 오늘의 주제가 아니므로 생략합니다. 
'로지스틱 회귀분석'에 대해서는 꼭 자세히 공부하기를 추천합니다. 



세번째 탭에서 바로 ROC를 볼 수 있습니다. 
빨간 사각은 ROC의 색을 바꾸거나 grid의 색을 바꾸거나 지우는 등의
간단하 옵션이 있습니다. 

이 그림을 다운로드 받는 법은 
공통이므로 아래 링크를 참고 하세요. 

자신의 데이터를 업로드 하는 법에 대해서도 
기본이지만, 질문이 많아서,
따로 아래 링크를 참고 하세요. 

요약 및 첨언

참고할 오래전 글을 보고 지금 
이글을 보면 얼마나 단순해 졌는지, 
얼마나 편리해 졌는지 금방 알 수 있습니다. 
그러나 기본 개념을 모르고 
편리함만 추구하면 안됩니다. 
꼭 "로지스틱 회귀분석"에 대한 기본 개념을 공부하고, 
도 읽어 보길 권합니다. 

한편 이 내용은 "로지스틱 회귀분석 후 ROC 커브 그리기"
은 "로지스틱 회귀분석"과 관련된 내용이기도 하고, 
'예측모형/머신 러닝'과도 관련된 내용이라서, 
자세한 것은 저의 다른 책들에서도 다루었으므로
참고하시면 공부가 되실 것입니다. 



Related Post

Understand ROC in R  ROC를 설명하기 위한 강의 도구
D) Understand ROC in R    ROC를 설명하기 위한 강의 도구 
many ROCs in R     ROC를 여러 개 동시에 그리고, 비교하기 위한 도구
ROC curves and sample size in R  Link1  Link2 
      4개까지의 ROC를 그리고, 두 개의 ROC를 통계적으로 비교하고 샘플 수 계산해 주는 도구
Comparison more ROCs in R   여러 ROC를 통계적으로 비교하는 도구

ROC from table or model in R   로지스틱 회귀분석 직후 바로 ROC 그리는 도구
    로지스틱 회귀회분석 모델을 검토하는 도구
Model Calibrations, ROC and calibration Plot from prediction in R
    Link1    Link2   
    로지스틱 회귀회분석 모델을 검토하는 도구

  

댓글 없음:

댓글 쓰기