2016년 2월 16일 화요일

아빠가 들려 주는 [통계] Overlapping Method : p값의 대안이 될까?

 p 값의 대안인 듯하면서도, 
사실 아주 단순한 발상에서 시작한 이 방법은
유쾌합니다. 
그리고, 늘 그러하듯 다른 방법을 생각한다는 것은 
늘 해왔던 원래의 방법이 무엇을 의미하는지
다시 일깨워 줍니다.

 이렇게 A,B 두 군에서 각각 200명의 사람에게서 
치료가 된 사람이 112명, 88명이 생겼다면, 
뭔가 두 치료법 사이에 차이가 있지나 않을까?
라는 생각을 하게 됩니다.

 우선 치료율이 44% 음... 56%  역시나 차이가 꽤 있는 듯한데, 
치료율(성공율)의 95%신뢰구간을 구해 보았더니
(빨간 상자 참고)
앗, 신뢰구간이 서로 겹치는 군요. 
음. 그렇다면 차이가 없다는 말!
아깝다...
 보다 전통적인 방법으로 생각해 봅시다.
빨간 상자에서 보여 주는 것은 각각 
RD의 95% 신뢰구간 0을 포함하지 않음-->의미있음
OR과 RR의 95% 신뢰구간 1을 포함하지 않음-->의미있음

피어슨, Yates의 카이제곱과 Fisher exact test의 결과 
(빨간 점선)
p<0.05
의미있는 차이임. 

이렇게 평가하는 것이 보통 하는 평가이죠. 
이때의 귀무가설은 RD=0 또는 RR=1이 됩니다. 
구체적인 과정은 오늘의 주제는 아니고요. 

이렇게 후자의 방법이 보통 해왔던 방법인데, 
전자의 방법은 어떤가요?

이에 대한 연구를 한 분이 있어서 한번 대충 훑어 보죠.
 이런 제목입니다. 


이런 논문에서 이 overlapping 방법이 쓰였다고 하는군요. 
이것에 대해서 선행 연구들이 이렇게 있었군요. 
이것은 하나의 예입니다. 위에서 제가 보여 드린
그 숫자입니다. 구체적인 공식은 여기 나와 있고요, 
저는 인터넷에서 계산해서 보여 드렸습니다. 
공식 보여 드리면 힘드실까봐.
결과 숫자는 같습니다.
type 1 error는 오히려 적습니다. 더 보수적인 결과이죠. 
위의 예제와 같습니다. 
즉, 유의하지 않다고 나올 가능성이 많다는 뜻.
이것은 power.
power도 더 낮습니다.  



결론입니다. 
해석은 여러분께 맡기겠습니다. 

사실 제가 이 방법으로 ICC를 비교한 적이 있습니다. 
두 ICC를 비교하는 것이 통계 프로그램에서 안되길래
(R이나 SAS는 될지도)
보다 보수적인 방법이니까..
차이가 있다고 하는 경우는 쓸 수도 있겠다는 생각이 드는군요. 

그렇지만, 함부로 쓸 생각은 마시고요. 
일반적인 방법이 안될 때만 살짝...

댓글 없음:

댓글 쓰기