본문 바로가기
R/R Commander

R Commander - Statistics - Summaries - Sapiro-Wilk test of normality

by 거인과난쟁이 2011. 1. 13.
http://scholar.google.com 에서 검색어로 sapiro-wilk test 로 1965년 자료를 찾을 수 있다.
http://www.wikipedia.org/en/에서 sapiro-wilk test에 대한 설명의 각주를 참조하면 원문을 구할 수 있다.

어떤 변수가 갖고 있는 자료들의 정규성(normality)를 검정하는 방법이다. 정확히는 정규분포라는 영가설을 기각할 수 있는가, 없는가에 대한 수리적 근거들이다.

혹시 비모수적 방법(non-parametric method)를 사용하게 될 때, 잘 사용할 수 있다: 1) 모집단의 분포에 대한 설명부족과 표본의 크기가 작은 경우에 흔히 사용한다. 2) 순위척도(ordinal scale) 형식의 숫자 배열 데이타에 대한 분석에 용이하다.




x <- c(6, 1, -4, 8, -2, 5, 0)         [Sapiro-Wilk의 1965년 논문의 샘플이다]
을 검정한 결과가 Output windows에서 파란색으로 보인다.

* Sapiro-Wilk의 통계량(W)에 대한 퍼센트가 정리된 표가 있다. 이 표는 샘플의 숫자와 유의수준의 조합에 대한 값들을 갖고 있다: 위의 변수에 담긴 7개의 자료들의 W 값(0.9735), 유의확률(0.7612)은 유의수준 0.05(95%)에서 제시된 0.803보다 크다.

How do I interpret the Shapiro-Wilk test for normality?

The null hypothesis for this test is that the data are normally distributed.The Prob < W value listed in the output is the p-value. If the chosen alphalevel is 0.05 and the p-value is less than 0.05, then the null hypothesis that the data are normally distributed is rejected. If the p-value is greater than0.05, then the null hypothesis has not been rejected.

(http://www.jmp.com/support/faq/jmp2085.shtml)