우리가 가진 자료가 너무 크고, 필요한 정보가 전혀 들어 있지 않은 것처럼 보이는지 평가하고, 그것을 아름다운 자료로 바꾸는 방법을 살펴본다.
정규분포에 기초한 모수적 검정이란 통계학자들이 밝혀낸 분포 중 하나를 따르는 자료를 요구하는 검정. 그 자료는 반드시 특정한 가정들을 만족하는 파라미터적 자료여야 한다.
정규분포: 이상적인 세상이라면 자료가 모든 점수의 중심을 기준으로 좌우 대칭 형태일 것이다. 만일 분포의 중심에 수직선을 그린다면 그 양쪽이 거울처럼 같은 모습이 될 텐데, 그런 형태의 분포를 정규분포라고 부른다.
어떤 통계적 판정이 적합한지 결정하려면 먼저 관련 가정들부터 확인하는 것이 아주 중요하다.
모수적 검정의 4가지 기본 가정
분포의 정규성: 가설 검정에 깔린 논리는 뭔가가 정규분포를 따른다는 점에 의존한다. 따라서 이 가정이 위반되면 가설 검정에 깔린 논리에 결함이 생긴다.
분산의 동질성: 자료 전반에서 분산들이 동일하다는 뜻이다. 한 변수의 분산이 다른 변수의 모든 수준에서 안정적이라는 뜻이다.
구간 자료: 자료가 적어도 구간 수준에서 측정한 것이어야 한다.
독립성: 한 참가자의 행동이 다른 참가자의 행동에 영향을 미치지 않아야 한다는, 독립적이어야 한다는 뜻이다.
이번 장은 자료의 정규분포성, 줄여서 정규성 가정과 분산의 동질성 가정에 초점을 둔다.
install.packages(c('car', 'ggplot2', 'pastecs', 'psych'))
library(car)
library(ggplot2)
library(pastecs)
library(psych)