Statistics for everyone: 아빠가 들려 주는 [통계] Overlapping Method : p값의 대안이 될까?

p 값의 대안인 듯하면서도,

사실 아주 단순한 발상에서 시작한 이 방법은

유쾌합니다.

그리고, 늘 그러하듯 다른 방법을 생각한다는 것은

늘 해왔던 원래의 방법이 무엇을 의미하는지

다시 일깨워 줍니다.

이렇게 A,B 두 군에서 각각 200명의 사람에게서

치료가 된 사람이 112명, 88명이 생겼다면,

뭔가 두 치료법 사이에 차이가 있지나 않을까?

라는 생각을 하게 됩니다.

우선 치료율이 44% 음... 56% 역시나 차이가 꽤 있는 듯한데,

치료율(성공율)의 95%신뢰구간을 구해 보았더니

(빨간 상자 참고)

앗, 신뢰구간이 서로 겹치는 군요.

음. 그렇다면 차이가 없다는 말!

아깝다...

보다 전통적인 방법으로 생각해 봅시다.

빨간 상자에서 보여 주는 것은 각각

RD의 95% 신뢰구간 0을 포함하지 않음-->의미있음

OR과 RR의 95% 신뢰구간 1을 포함하지 않음-->의미있음

피어슨, Yates의 카이제곱과 Fisher exact test의 결과

(빨간 점선)

p<0.05

음 의미있는 차이임.

이렇게 평가하는 것이 보통 하는 평가이죠.

이때의 귀무가설은 RD=0 또는 RR=1이 됩니다.

구체적인 과정은 오늘의 주제는 아니고요.

이렇게 후자의 방법이 보통 해왔던 방법인데,

전자의 방법은 어떤가요?

이에 대한 연구를 한 분이 있어서 한번 대충 훑어 보죠.

이런 제목입니다.

이런 논문에서 이 overlapping 방법이 쓰였다고 하는군요.

이것에 대해서 선행 연구들이 이렇게 있었군요.

이것은 하나의 예입니다. 위에서 제가 보여 드린

그 숫자입니다. 구체적인 공식은 여기 나와 있고요,

저는 인터넷에서 계산해서 보여 드렸습니다.

공식 보여 드리면 힘드실까봐.

결과 숫자는 같습니다.

type 1 error는 오히려 적습니다. 더 보수적인 결과이죠.

위의 예제와 같습니다.

즉, 유의하지 않다고 나올 가능성이 많다는 뜻.

이것은 power.

power도 더 낮습니다.

결론입니다.

해석은 여러분께 맡기겠습니다.

사실 제가 이 방법으로 ICC를 비교한 적이 있습니다.

두 ICC를 비교하는 것이 통계 프로그램에서 안되길래

(R이나 SAS는 될지도)

보다 보수적인 방법이니까..

차이가 있다고 하는 경우는 쓸 수도 있겠다는 생각이 드는군요.

그렇지만, 함부로 쓸 생각은 마시고요.

일반적인 방법이 안될 때만 살짝...

Statistics for everyone

2016년 2월 16일 화요일

아빠가 들려 주는 [통계] Overlapping Method : p값의 대안이 될까?

댓글 없음:

댓글 쓰기