Uji normalitas dilakukan sebelum analisis lanjut, agar penentuan metode tepat, apakah menggunakan uji paramterik atau non-parametrik.
Data yang digunakan adalah data dari R (R data sets),
"CO2"
.
data("CO2")
head(CO2)
Beberapa metode yang dapat digunakan untuk uji normalitas data adalah histogram, QQ plot, dan uji Shapiro-Wilk.
# Histogram
hist(CO2$uptake)
# QQ-plot
qqnorm(CO2$uptake, main='Normal')
qqline(CO2$uptake)
# atau
install.packages("car")
library("car")
qqPlot(CO2$uptake, id = FALSE # id = FALSE untuk menghapus identifikasi titik
)
# Uji Shapiro-Wilk
shapiro.test(CO2$uptake)
##
## Shapiro-Wilk normality test
##
## data: CO2$uptake
## W = 0.94105, p-value = 0.0007908
Berdasarkan hasil uji normalitas, data memiliki sebaran yang tidak normal. Uji non-parametrik lebih tepat untuk data yang tidak normal. Tetapi data dapat diuji dengan uji parametrik, dengan catatan data ditransformasi terlebih dahulu. Salah satu contoh bentuk transformasi adalah log(n+1) (log trasnformation).
## R version 4.3.2 (2023-10-31 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 19045)
##
## Matrix products: default
##
##
## locale:
## [1] LC_COLLATE=English_United States.utf8
## [2] LC_CTYPE=English_United States.utf8
## [3] LC_MONETARY=English_United States.utf8
## [4] LC_NUMERIC=C
## [5] LC_TIME=English_United States.utf8
##
## time zone: Asia/Jakarta
## tzcode source: internal
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] car_3.1-2 carData_3.0-5
##
## loaded via a namespace (and not attached):
## [1] digest_0.6.34 R6_2.5.1 fastmap_1.1.1 xfun_0.42
## [5] cachem_1.0.8 abind_1.4-5 knitr_1.45 htmltools_0.5.7
## [9] rmarkdown_2.25 lifecycle_1.0.4 cli_3.6.2 sass_0.4.8
## [13] jquerylib_0.1.4 compiler_4.3.2 highr_0.10 rstudioapi_0.15.0
## [17] tools_4.3.2 evaluate_0.23 bslib_0.6.1 yaml_2.3.8
## [21] rlang_1.1.3 jsonlite_1.8.8