2016년 2월 23일 화요일

아빠가 들려 주는 [통계] 짝지은 자료의 분석(2) McNemar test 논문에서 어떻게 표현할까?


 
McNemar test에 대해서 알아 보았습니다.
실제 실행하는 것은 모든 통계 프로그램에서 가능하기 때문에
따로 강조할 필요는 없을 것같군요.
그런데, McNemar test의 결과를
단순히 p값만으로 보여 주는 것보다는
오즈비와 95%신뢰구간 등으로 보여 주는 것이 바람직합니다.

 
그래서, McNemar test의 오즈비와 위험차의
구해 보았습니다.
보통 통계 프로그램들이 잘 보여 주지 않기에
한번 만들어 보았습니다.
(1)노란 곳에 먼저 자료를 입력합니다.
(2) 넣어도 됩니다. 사실 저는 개인적으로 (1)에 넣는 것을 더 권장합니다
(3)p값이 보여지는데 3가지나 됩니다.
(4)에 조건이 3가지 있기 때문입니다.
그 중에 연속성을 수정하지 않은 것이나, 1.0으로 수정한 두 가지가 많이 사용됩니다.
그냥 아무런 언급없이 모두 그냥 McNemar test라고 부르기도 합니다.
(5)오즈비 즉 OR과 그것의 95%신뢰구간도 논문에 같이 써 줄 수 있습니다.
그런데 이 신뢰구간이 공식에 따라서 좀 다양합니다. 그것은 다음그림에서 보여 드리겠습니다.
(6)위험차(risk difference) 이것의 95%신뢰구간도 보여주는 논문이 있습니다.
압도적으로 오즈비가 많이 쓰이지만, 무작위대조연구(RCT)인 경우는 RD 저는 더 좋다는 생각도 합니다.
그 아래에는
위험차와 그 신뢰구간을 보여 줍니다.
논문에서는 연속성이 수정되거나 혹은 수정되지 않았거나
둘중에 하나를 택해서,
P값을 보여줍니다.
그리고, 오즈비와 그것으니 95%신뢰구간을 표시할 수 있습니다.
오즈비 대신에, 위험차(risk difference)를 사용해도 되겠습니다.

 
http://graphpad.com/quickcalcs/mcNemar2/ 의 결과로,
2X2 table, 보여 주면서, p (1)을 보여 주는데, 연속성 수정한 값이라고 말해 줍니다.(2)
아울러 odds ratio를 보여 줍니다(3)
그런데, odds ratio95% 신뢰구간이 앞의 것과 조금 다르죠.


 
http://www.vassarstats.net/
의 결과입니다.
(1) p값은 연속성 수정한 p값과 아주 가깝습니다.
이값은 사실 exact McNemar test의 값입니다. (b+c의 값이 1000이하이면)
(2)에서 설명해 주고 있죠.
(2)에서 오즈비의 값은 같으나,
95%신뢰구간은 역시 다릅니다.


 
사실 McNemar testodds ratio95% 신뢰구간을 구하는 방법은 다양합니다.
이 논문에서 24가지를 비교하였습니다.
그 중에서 2가지가 좋다고 하였네요.
관심있는 분은 이 논문을 무료로 볼 수 있습니다.


 
많이 알려져 있지 않지만, NCSS 라는 통계 프로그램의 매뉴얼을
인터넷에서 검색할 수 있습니다.
여기에는 Risk Difference에 대해 4가지 방법
Risk Ratio에 대해서 2가지 방법
Odds Ratio에 대해서 2가지 방법으로
Confidence interval을 구하고 있습니다.
사실 이것만 하더라도,
상당히 우수하고 적절한 프로그램이라 할 수 있을 것같습니다.


 
이 프로그램은 이 그림을 그려 주는데, 이것만해도 그나마 적절합니다.
그림에 대해서는 다시 이야기 하겠습니다.
 
의학용인 MedCalc의 경우에는 Risk Difference와 신뢰구간을 제시합니다.
엑셀에서와 비슷한 값입니다.
 
STATA의 경우에는 OR, RR, RD95% 신뢰구간을 모두 구해 줍니다.
P값은 연속성을 수정하지 않는 McNemar testexact test의 결과를 보여 주고 있습니다.
SPSS는 연속성 수정한 McNemar testexact test의 결과를 보여 주고 있습니다.
OR 등에 대해서는 관심이 없군요. (물론 최신 버전은 다를 수도 있습니다)
어쨌든 다양한 공식이 있긴 하지만, 
OR, RR, RD중의 하나와 그95% 신뢰구간를
본문에 표시해 주는 것을 저는 권합니다.


 
이제 어떤 그래프가 좋을지 생각해 봅시다.
통계프로그램이 그려 주는 그래프는 이것이 다고,
논문에서도 이런 식의 그래프를 본 적있습니다.
사실 McNemar test를 주되게 검정하는 논문이 많지 않아서
그래프로 보기는 쉽지 않을 것입니다.
잘보면 이것은 risk를 보여주는 것으로
2X2 table에서의 A,B,C,D가 무엇을 말하는지
표를 생각해 보세요.
그런데 이렇게 표를 그리면 두 RISK를 비교해 볼 수 있습니다

 
이것은 제가 만든 그래프로, Odds RatioRisk Ratio
Risk difference 를 동시에 표현할 수 있습니다.
그래프라는 것은 가급적 원래의 자료를 그대로 가지고 있으면서
요약된 정보를 잘 간직해야 하는데,
이렇게 한 그림으로 여러 정보를 잘 나타낼 수 있기 때문에
꽤 좋은 그래프라고 할 수 있습니다.


 
원래의 자료를 보다 잘 나타내기 위해서 이런 변형도 가능합니다.
이렇게 만들면, 전체의 키가, total 표를 반영해 주게 됩니다.


 
너무 복잡해서, D 값을 이렇게 아래에 표시하는 것도 생각할 수 있습니다.
원래의 자료를 모두 표시해 준다는 장점은 있습니다만,
Total값을 모두 알수는 없습니다

 
결론적으로 이 두 차트가 가장 적당한 듯합니다.
이것 역시 위의 엑셀 표의 노란칸에 숫자를 넣으면
자동으로 표가 그려지도록 만들었으므로
복사해서 사용하시면 됩니다.



한편 앞서 보았듯이 McNemar test의 경우도
연속성 수정을 한것과 하지 않은 것
그리고, exact McNemar test라고도 불리는 것이 있습니다.
3가지가 있고 모두 그냥 McNemar test라고 부릅니다.
exact McNemar test
dBSTATbinorminal test라고 구분하여 표시합니다.



R에서는 적절한 패키지와 라이브러리를 사용하면
연속성 수정된 McNemar testexact McNemar test를 구할 수 있고,
이렇게 오즈비와 신뢰구간을 구할 수 있습니다.




아래는 위에서 설명한 엑셀 쉬트입니다. 입력하면 결과값을 얻을 수 있습니다.






아래는 McNemar test에 어울리는 차트를 만들어 보았습니다. 
해석의 위의 설명에 나와 있습니다.



댓글 없음:

댓글 쓰기