2016년 1월 25일 월요일

아빠가 들려 주는 [통계] long form ↔ wide form in Web-R.org





 long form 은 뭐고,  wide form 은 또 무엇이냐..

사실 동영상을 보시면 그냥 눈치 채실 겁니다.
(사실 엄격한 의미에서 꼭 맞지는 않지만, 대충 말하자면)
한 사람에게서 시간을 따라서 얻어진 자료를 한줄로 가로로 쓴 것을 wide form이라고 합니다.
paired t-test나 RM ANOVA 같은데 사용하죠.
그런데, 한 사람에 얻어진 자료를 세로로 쓴 것을 long form 이라고 합니다.
실제 모양은 동영상을 보시면 아실 것이고요,
이건 mixed model이나 GEE를 하기 위해서 필요합니다.

paired t-test나 RM ANOVA 에서는 하나라도 값이 없으면 그 사람 자료는 몽땅 없어집니다.
즉, 1,3,5개월 자료 중에 3개월 자료 하나만 없어도 그건 없는 것이랑 마찬가지 입니다.
mixed model이나 GEE는 이런 자료도 살려서 분석할 수가 있습니다.

병원에서의 자료는 보통 이런 시간에 따른 자료가 많죠.
longitudinal data라고 말하는 경우가 많습니다.

그것을 분석하기 위해서,
자료를 상호 호환할 필요가 있습니다.
 long form ↔ wide form
이렇게 말이죠.

이게 SPSS에서 됩니다. 그런데 너무 어려워서 제가 도무지 헷갈리더라고요.
저도 이전에 제가 써둔 매뉴얼을 한참 봐야 합니다.
뭐 GEE를 늘 하는 것도 아니고, 공부하려고 한번 실제 논문쓸려고 한번.. 이런 식일 텐데요..
이렇게 어려워서야....

그런데 Web-R.org 에서 이게 간단하게 되는 거 아닙니까?
아직 개선의 여지는 남아 있지만, 그래도 곧 되리라고 생각됩니다.
Web-R.org 화이팅

댓글 없음:

댓글 쓰기