Statistics for everyone

2016년 6월 16일 목요일

아빠가 들려 주는 [통계] SPSS에서 카이제곱 검정 , Fisher exact test

가장 쉬울 것같은 카이제곱 검정이 SPSS에서는 조금 복잡합니다.

아니, table로 정리되어 있을 때 복잡하다는 거죠.

우리가 만들고 싶은 표는 (1)에서 보이는 것과 같은 3X3 table 인데, SPSS에서는 이렇게 표 형식으로 입력이 안되기 때문에 (2)의 형태로 입력해야 합니다.

언젠가는 (1) 형태에서 바로 작업이 가능하길 희망해 봅니다.

변수1,변수2열에 0,1,2를 그림과 같은 규칙으로 먼저 넣고,

3열에는 순자를 넣는데, (1)에서의 숫자를 차례로 넣습니다.

그림 (1)과 (2)의 숫자 배열이 화살표 방향이라는 것을 주목합니다.

익숙해 지면 (1)은 그릴 필요가 없습니다.

‘data’에서 ‘weight cases’를 클릭합니다.

3열을 이용해서 가중치를 줍니다.

Analysis의 crosstabs를 클릭합니다.

1열과 2열을 차례로 row와 column에 넣습니다.

이제 exact와 statistics 를 클릭합니다.

Exact 에서는 Exact를 선택합니다. 시간은 적당히 넣습니다.

2X2 table에서는 Exact를 선택하지 않아도 Exact를 계산해 주지만,

2X3 이상에서는 이렇게 선택해 주어야 계산해 줍니다.

statistics 창에서는 Chi-square를 선택합니다.

이정도 옵션이 최소의 옵션입니다.

그다음 진행하면 답이 나옵니다.

요렇게 결과가 나왔습니다. 논문에서는 0.47이라고 했으므로,

Fisher exact test를 사용한 것임을 알 수 있습니다.

굳이 이렇게 자세히 쓴 것은

보통 SPSS 설명한 통계책에서 2X3 이상의 Fisher exact test이 불가능하다고 쓴 책도 보았고,

사용법을 설명하지 않은 책도 보았기 때문입니다.

또는(1)처럼 글자를 넣는 방법도 있습니다.

나머지는 동일합니다.
별로 권하지는 않습니다.

글자를 넣기 위해서는 변수탭(2)에서 1열과 2열을 string(3)으로 바꾸고 길이도 조금 늘여 줍니다.

그러면 입력이 됩니다.

이번에는 차트도 한번 만들어 보죠(4)

변수의 배치가 알파벳 순서로 바뀌었고(5)

Linear-by-Linear Association 가 없어졌습니다. 카이제곱 trend test라 명목변수에서는 적합하지 않기 때문입니다.

이렇게 차트가 만들어 지고 더블클릭하면 차트 에디터가 나와서 편집이 가능하지만, 이것보다는 엑셀에서

편집하는 것이 쉽고 더 예쁘죠.

아빠가 들려 주는 [통계] 오해를 유발하는 통계 용어 3총사

오늘 아침에 출근하면서 만든 슬라이드입니다.

뭐 중요한 것은 아니고,

논문쓸 때 도움되는 것은 아닌데,

알면 뭐 나쁠 것도 없는 그런 겁니다.

피타고라스 정리가 피타고라스가 만든 거냐 아니냐 만큼도 의미없는 걸수도 있어요.

너무 진지하게 생각하지 마세요.

스마트폰이 왜 스마트폰이냐..
스마트한 사람들이 쓰는 거냐,
스마트해 진다는 거냐...
PDA와 다른게 머냐...
따지는 거랑 비슷합니다.

그렇지만, 한번 생각해 볼 필요는 있을 것같습니다.

2016년 6월 6일 월요일

아빠가 들려 주는 [통계 ] NNT(number to treat)란 무엇인가?

통계책에 거의 나오지 않는…..NNT?

Number Needed to Treat

아마도 거의 의학 통계에 국한된 내용이 될 것같은데,

의사들이 많이 보는 통계책이 SPSS인데,

SPSS에서 계산되지 않다보니…

익숙지 않은 이름이 되었습니다.

http://statistics4everyone.blogspot.kr/2016/02/what-is-chi-squared-test.html 의 오른쪽 아래쪽으로 스크롤 해 보면 RD가 계산되고, 그것의 아래쪽에 NNT가 보입니다.

Yes가 사망이라고 합시다, old treat는 그냥 물만 먹이는 치료인데, 이것만 해도 100명중에 10명이 살게 됩니다. New treat를 하게 되면 100명중에 90명이 살게 된다고 합시다. 그러면 당신에게 100명의 환자가 왔을 때, old treat에 비해서 new treat를 하게 되면 얼마의 장점(이익)이 있나요? 예, 80명을 더 살릴 수 있습니다. 즉 100명중 80명 즉 0.8이 RD입니다(위에 계산이 되어 있죠)

100명 중에 80명을 살릴 수 있다면 말은 1명을 더 살리기 위해 몇 명의 환자를 보게 되는 것일까요?

1.25명입니다. 0.8의 역수이죠. 즉, “1명의 이익을 얻기 위해서 몇 명의 환자를 만나야 할까?” 또, 대조약(placebo 혹은 기존의 약)에 대비한 효과를 표현해 주는 하나의 지표이기도 합니다. 만약 NNT가 20이라면, 20명 치료할 때마다 1명이 추가적으로 이익을 얻게 되는 셈이고 NNT가 200이라면 200명에 가서야 비로서 1명의 추가적인 이익을 얻게 된다는 뜻이 되므로, 상당히 임상적인 의미가 강하게 있습니다.

사실 RD의 역수이기 때문에 계산하기는 쉽지만 그래도 인터넷으로 계산할 수 있도록 만들어 두었으니 이용하시에 좋을 것입니다. CONSORT에도 구체적으로 나와 있습니다.

For both binary and survival time data, expressing the results also as the number needed to treat for benefit or harm can be helpful (see item 21). (CONSORT 17a)

Yes가 성공률이라면 경우에 old treatment의 성공율은 76%, new treatment의 성공율은 66%로 오히려 new treatment의 성공율이 낮으므로 NNT는 NNH(number needed to harm)으로 해석해야 합니다. Yes가 사망이라면 사망률을 낮추었으므로, NNT로 해석하면 됩니다.

아빠가 들려 주는 [통계] P 값이란 무엇인가? Story III (p값이 클 때의 의미)

그런데 만일 p값이 0.05 이상이라면 그 때는 어떻게 판단해야 할까요?
더 증거를 수집해서 유죄인지 무죄인지 판단해
야 하는 것이고, 물건을 살지 말지를 판단해야 하는 그런 상황을 말해줍니다.

간혹 어떤 경우에 1종 오류가 5%이상이라고 해서, 다시 흔히 말해서 p값이 0.05이상 (예를
들면) 0.25라고 해서 “두 군의 차이가 없다”는 식으로 해석하는 논문도 많습니다. 이것은
잘못된 것입니다.
‘차이가 있다고 말할 수는 없다’ 정도가 맞는 표현이고 다시 말해서 ‘차이가 있는지 없는지 잘 모르겠다 판단을 유보해야 한다’는 뜻입니다.
Why ‘not statistical ly significant’ does not mean simi lar, the same, or not different라는 제목의 블로그 글(1쪽짜리)에 When we test a difference and we say it is NOT significant,
this does not mean that there is no difference. 라는 글이 있군요.
Absence of evidence is not evidence of absence라는 한 쪽짜리 무료 PDF를 읽어 보시는
것이 좋겠습니다. 제목 자체가 보여주는 바도 있지만, 얼마나 많은 연구자들이 잘못 해석하
고 있는지를 잘 지적해 주고 있습니다. Bland Altman plot으로 유명한 Bland와 Altman)
이 쓴 글이지요.

괜히 어렵게 말하면 ‘1종 오류’도 크고 ‘2종 오류’도 큰 상태가 됩니다. 그러면 ‘진짜 두 군
의 차이가 없다’라고 말하려면 어떻게 하느냐- 그 때는 비열등성 검정이나 동등성 검정을
해야 합니다.
많은 논문들이 ‘내가 새로 개발한 새로운 치료법이 기존 치료법과 비교할 때 p값이0.05이
상이므로 큰 차이가 없는 (좋은) 치료법으로 생각된다’는 식의 결론을 비열등성 검정의 개
념없이 내리고 있는지도 모릅니다. 논문의 심사위원들은 뭔가 조금 이상하니까, power를
계산해서 내라고 주문하곤 하지만, 이것도 사실은 다소 틀린 이야기로 비열등성 검정을 통
해서 증명하라고 주문해야 옳습니다.

이런 것을 ‘post hoc power analysis’(사후 검정력 분석)라고 부릅니다. 어떤 학자들
은 ‘post hoc power analysis는 의미없다’고도까지 강조하기도 합니다.
http://www.ats.ucla.edu/stat/seminars/Intro_power/에서
저의 생각을 그대로 보여 주는 글을 발견했습니다. 그대로 옮기겠습니다.

Afterthoughts: A post-hoc power analysis
In general, just say “No!” to post-hoc analyses. 요약하면 그냥 ‘사후 검정력 분석’에 대해
서는 그냥 ‘No’라고 말하시오
There are many reasons, both mechanical and theoretical, why most researchers should
not do post-hoc power analyses.
사후 검정력 분석을 하지 말아야 할 많은 이유가 있습니다. (mechanical은 mathematical을
잘못 쓴 것같습니다.)
Excel lent summaries can be found in Hoenig and Heisey (2001) The Abuse of Power:
The Pervasive Fal lacy of Power Calculations for Data Analysis and Levine and Ensom
(2001) Post Hoc Power Analysis: An Idea Whose Time Has Passed?
2001년에 나온 두 논문이 그 이유들을 잘 요약하였습니다.
As Hoenig and Heisey show, power is mathematical ly directly related to the p-value;
hence, calculating power once you know the p-value associated with a statistic adds no
new information.
전자에서 보여 주듯이 p값이 계산되면 power는 수학적으로 계산되기에 다시 power를 계
산하는 것은 전혀 새로운 정보를 주지 못합니다. (이 논문은 저자의 “통계의 첫걸음 샘플
수의 계산”에서 다루었고, 무료 PDF가 있습니다.)
Furthermore, as Levine and Ensom clearly explain, the logic underlying post-hoc power
analysis is fundamental ly flawed.
한편 추가해서, 후자는 사후 검정력 분석에 깔린 이유가 기본적으로 잘못된 것을 설명합니
다. (이 논문은 초록만 무료로 볼 수 있는데, post hoc power 보다도 신뢰구간이 더 많은
정보를 준다고 되어 있습니다. 동감하는 바입니다.)
However, there are some things that you should look at after your study is completed.
Have a look at the means and standard deviations of your variables and see how close
they are (or are not) from the values that you used in the power analysis.
그렇지만, 연구자가 보아야 할 것이 있습니다. 그것은 평균에 표준편차가 얼마나 가까운지
를 보세요.(이건 검정력 분석에서 보는 것이 아니지만, 어쨌든)
Many researchers do a series of related studies, and this information can aid in making
decisions in future research.
많은 연구자는 비슷한 연구를 계속하고, 추후 연구를 위해서 이 정보는 중요합니다.
For example, if you find that your outcome variable had a standard deviation of 7, and
in your power analysis you were guessing it would have a standard deviation of 2,
you may want to consider using a different measure that has less variance in your next
study.
예를 들어 여러분의 연구의 표준 편차가 7이었는데, 검정력 분석에서 표준 편차가 2 정도
되기를 바란다면 후속 연구에서는 다른 방안을 찾아야 합니다. (이 말은 다음 연구는 샘플
수를 더 늘이든지, 더 정밀하고 정확한 측정 방법으로 바꾸는 등 다음 연구를 위한 준비가
됩니다)
The point here is that in addition to answering your research question(s), your current
research project can also assist with your next power analysis.
요점은 현재의 연구에서 얻은 정보로 다음 연구의 power를 계산하는 것은 도움이 된다는
것입니다.
제 생각에 논문 리뷰어가 power를 계산하라고 요구하려면 그것이 의미하는 바를 잘 알고
요구해야 하고, 저자는 가설이 우수성을 밝히기 위한 연구였다면, not significant 하다는 의
미가 무엇인지 명확하게 알고 표현해야 합니다. 비열등하다는 것을 밝히기 원한다면, 아예
처음부터 연구를 새로 시작해야 합니다. 독자는 당연히 개념이 있게 비판적으로 받아 들여
야 합니다.