2016년 8월 9일 화요일

아빠가 들려주는 [통계] Durbin-Watson test 후에 자기상관을 판단하는 기준

Durbin-Watson test 는 웬만한 통계 프로그램이 다 계산해 줍니다.
문제는 그결과 나온 값으로 어떻게 판한해야 할지 모른다는 것...
그래서,
통계 프로그램에서 나온 값이 어디에 속하는지
기준을 보여 주고자 합니다.

total sample size(T)와 variable의 갯수(K)
를 노란 칸에 입력합니다.
제일 오른쪽의 노란칸에 계산된 값을 입력합니다.
현재 2.12가 기록된 그 칸입니다.
그러면
아래쪽에 경계값들이 표시되고, 우리의 값이 어떤 영역에 있는지도 표시됩니다.

아래쪽 엑셀 쉬트를 바꾸면 유의수준을 5%, 2.5%, 1%로 수정할 수 있습니다.

https://youtu.be/c7si9PdjYH0
https://youtu.be/4SMeuS4JsY0
참고하세요.


2016년 7월 10일 일요일

아빠가 들려 주는 [통계] 날짜 데이터 정리하기


생존분석... 뿐 아니라, 일반적인 자료 정리에서도

날짜 정리는 매우 중요합니다.

엑셀은 기본적으로 입력하기 쉽도록 지능적으로 제공하는 기능이 있는데요.

그것도 알아보고요.


혹시라도 잘못입력했을 때,

처리하는 법까지 같이 알아 보겠습니다.

2016년 7월 7일 목요일

아빠가 들려 주는 [차트] dot plot jitter plot (2)

두 군의 자료를 비교하려고 할 때 갯수가 그리 많지 않다면, 
막대차트나 boxplot 보다는 dotplot이 더 바람직 하겠지요. 

두군을 비교하기에 시각적으로 매우 우수한 차트이면서 
동시에 원자료의 값을 모두 보여 줄 수 있어서 좋습니다. 

http://blog.naver.com/kjhnav/220756455112 에 파일 첨부되어 있습니다.

2016년 7월 2일 토요일

아빠가 들려 주는 [통계]오차막대가 의미하는 것은







마지막에 잘린 내용


에러바의 크기를
SD로 하면 집단의 분포를 알 수 있지만, 통계적 유의성과는 전혀 상관없습니다.
SE로 하면 N이 커질 수록 작아지며, SD에 비해서도 아주 작아집니다.
SE는 95%CI의 절반정도 되기에 통계적 유의성을 간접적으로 보여주기에 좋지만,
그래도 가장 직접적으로 보여주는 것은 95% CI이고,
그 내용은 동영상으로 보였습니다.

단 조건은 양군의 N수가 비슷할 때, 그리고, 두군만을 비교할 때이기에 ANOVA 등은 해당하지 않습니다.

아빠가 들려 주는 [통계]오차막대가 의미하는 것은







마지막에 잘린 내용


에러바의 크기를
SD로 하면 집단의 분포를 알 수 있지만, 통계적 유의성과는 전혀 상관없습니다.
SE로 하면 N이 커질 수록 작아지며, SD에 비해서도 아주 작아집니다.
SE는 95%CI의 절반정도 되기에 통계적 유의성을 간접적으로 보여주기에 좋지만,
그래도 가장 직접적으로 보여주는 것은 95% CI이고,
그 내용은 동영상으로 보였습니다.

단 조건은 양군의 N수가 비슷할 때, 그리고, 두군만을 비교할 때이기에 ANOVA 등은 해당하지 않습니다.

2016년 6월 28일 화요일

아빠가 들려 주는 [통계] 카이제곱 검정 & Fisher exact test

얼마전에도 같은 글을 올렸네요.. 그러고 보니..
오늘은 동영상으로 글 올립니다. 
오늘 네이버 블로그에 질문 올리신 분이 있어서 답이 되길 바라면서..

2016년 6월 16일 목요일

아빠가 들려 주는 [통계] SPSS에서 카이제곱 검정 , Fisher exact test

 
가장 쉬울 것같은 카이제곱 검정이 SPSS에서는 조금 복잡합니다.
아니, table로 정리되어 있을 때 복잡하다는 거죠.
 
우리가 만들고 싶은 표는 (1)에서 보이는 것과 같은 3X3 table 인데, SPSS에서는 이렇게 표 형식으로 입력이 안되기 때문에 (2)의 형태로 입력해야 합니다.
언젠가는 (1) 형태에서 바로 작업이 가능하길 희망해 봅니다.
변수1,변수2열에 0,1,2를 그림과 같은 규칙으로 먼저 넣고,
3열에는 순자를 넣는데, (1)에서의 숫자를 차례로 넣습니다.
그림 (1)(2)의 숫자 배열이 화살표 방향이라는 것을 주목합니다.
익숙해 지면 (1)은 그릴 필요가 없습니다.
 
‘data’에서 ‘weight cases’를 클릭합니다.
3열을 이용해서 가중치를 줍니다.
 
Analysiscrosstabs 클릭합니다.
1열과 2열을 차례로 rowcolumn에 넣습니다.
이제 exactstatistics 를 클릭합니다.


 
Exact 에서는 Exact를 선택합니다. 시간은 적당히 넣습니다.
2X2 table에서는 Exact를 선택하지 않아도 Exact를 계산해 주지만,
2X3 이상에서는 이렇게 선택해 주어야 계산해 줍니다.
statistics 창에서는 Chi-square를 선택합니다.
이정도 옵션이 최소의 옵션입니다.
그다음 진행하면 답이 나옵니다.


 
요렇게 결과가 나왔습니다. 논문에서는 0.47이라고 했으므로,
Fisher exact test를 사용한 것임을 알 수 있습니다.
굳이 이렇게 자세히 쓴 것은
보통 SPSS 설명한 통계책에서 2X3 이상의 Fisher exact test이 불가능하다고 쓴 책도 보았고,
사용법을 설명하지 않은 책도 보았기 때문입니다.


 
또는(1)처럼 글자를 넣는 방법도 있습니다.
나머지는 동일합니다.
별로 권하지는 않습니다.


 
글자를 넣기 위해서는 변수탭(2)에서 1열과 2열을 string(3)으로 바꾸고 길이도 조금 늘여 줍니다.
그러면 입력이 됩니다.
 
이번에는 차트도 한번 만들어 보죠(4)
 
변수의 배치가 알파벳 순서로 바뀌었고(5)
Linear-by-Linear Association  가 없어졌습니다. 카이제곱 trend test라 명목변수에서는 적합하지 않기 때문입니다.

이렇게 차트가 만들어 지고 더블클릭하면 차트 에디터가 나와서 편집이 가능하지만, 이것보다는 엑셀에서
편집하는 것이 쉽고 더 예쁘죠.