DESKRIPSI DATA
Pada pembahasan One Way MANOVA kali ini, akan digunakan data yang meneliti hubungan antara desain helm sepak bola dengan cedera leher. Data dapat diakses pada tautan berikut: https://vincentarelbundock.github.io/Rdatasets/doc/heplots/FootHead.html
data <- read.csv("C:/Users/MSI Cyborg15/OneDrive/Documents/college/Semester 3/Analisis Data Multivariat 1/FootHead.csv")
head(data)
## rownames group width circum front.back eye.top ear.top jaw
## 1 1 High school 13.5 57.15 19.5 12.5 14.0 11
## 2 2 High school 15.5 58.42 21.0 12.0 16.0 12
## 3 3 High school 14.5 55.88 19.0 10.0 13.0 12
## 4 4 High school 15.5 58.42 20.0 13.5 15.0 12
## 5 5 High school 14.5 58.42 20.0 13.0 15.5 12
## 6 6 High school 14.0 60.96 21.0 12.0 14.0 13
UJI ASUMSI
Dalam pengujian MANOVA dengan bantuan software R, taraf dari faktor harus bersifat numerik. Oleh karena itu, akan dilakukannya pendefinisian terlebih dahulu.
library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
data1 <- data[3:8]
head(data1)
## width circum front.back eye.top ear.top jaw
## 1 13.5 57.15 19.5 12.5 14.0 11
## 2 15.5 58.42 21.0 12.0 16.0 12
## 3 14.5 55.88 19.0 10.0 13.0 12
## 4 15.5 58.42 20.0 13.5 15.0 12
## 5 14.5 58.42 20.0 13.0 15.5 12
## 6 14.0 60.96 21.0 12.0 14.0 13
UJI NORMALITAS DATA
Untuk melakukan uji asumsi normalitas, akan dilakukan plot Q-Q untuk melihat persebaran data secara eksploratif, lalu akan dilakukan juga uji Mardia Test dengan rumusan hipotesis:
A. Mardia Skewness
H0 : Data berdistribusi Normal
H1 : Data tidak berdistribusi Normal
B. Mardia Kurtosis
H0 : Data berdistribusi Normal
H1 : Data tidak berdistribusi Normal
H0 akan ditolak jika p-value < alpha, terima dalam hal lainnya. Dengan taraf signifikansi sebesar 5%, diperoleh:
test = mvn(data1, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
test
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 84.9365366556038 0.00756703046152702 NO
## 2 Mardia Kurtosis 0.909772669322413 0.362942410946737 YES
## 3 MVN <NA> <NA> NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk width 0.9464 0.0010 NO
## 2 Shapiro-Wilk circum 0.9449 0.0008 NO
## 3 Shapiro-Wilk front.back 0.9794 0.1643 YES
## 4 Shapiro-Wilk eye.top 0.9832 0.2967 YES
## 5 Shapiro-Wilk ear.top 0.9727 0.0548 YES
## 6 Shapiro-Wilk jaw 0.9857 0.4338 YES
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## width 90 15.40000 0.6656922 15.50 13.5 17.50 15.000 15.650 0.37333477
## circum 90 58.02889 1.8795484 57.55 54.8 63.50 56.900 59.150 0.80796477
## front.back 90 19.90722 0.7444009 19.90 18.5 21.75 19.425 20.400 0.29546460
## eye.top 90 11.37000 1.6779770 11.30 7.4 15.00 10.125 12.725 0.06590774
## ear.top 90 13.96111 0.9569021 13.90 11.1 16.50 13.400 14.500 0.26597108
## jaw 90 12.00444 0.6365128 12.00 10.5 13.50 11.500 12.500 0.09940867
## Kurtosis
## width 1.5816752
## circum 0.4287847
## front.back -0.5087056
## eye.top -0.7569089
## ear.top 0.3840565
## jaw -0.1315865
Dapat dilihat bahwa secara eksploratif, Mardia Kurtosis berdistribusi normal, sedangkan Mardia Skewness tidak berdistribusi normal. Oleh karena itu, akan dilakukan pengambilan data sebanyak 60 data dari baris ke-31 hingga ke-90 sebagai acuan pembelajaran Analisis Data Multivariat ini.
data2 <- data[31:90,2:8]
x1 <- data[31:90,3]
x2 <- data[31:90,4]
x3 <- data[31:90,5]
x4 <- data[31:90,6]
x5 <- data[31:90,7]
x6 <- data[31:90,8]
data3=data.frame(x1=x1, x2=x2, x3=x3, x4=x4, x5=x5, x6=x6)
library(MVN)
test1 = mvn(data3, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")
test1
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 55.3011597909414 0.501275845549599 YES
## 2 Mardia Kurtosis -0.414711130056112 0.678353383590794 YES
## 3 MVN <NA> <NA> YES
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk x1 0.9525 0.0204 NO
## 2 Shapiro-Wilk x2 0.9613 0.0543 YES
## 3 Shapiro-Wilk x3 0.9885 0.8446 YES
## 4 Shapiro-Wilk x4 0.9914 0.9496 YES
## 5 Shapiro-Wilk x5 0.9641 0.0745 YES
## 6 Shapiro-Wilk x6 0.9848 0.6589 YES
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis
## x1 60 15.50000 0.6084156 15.45 14.3 17.3 15.200 15.800 0.68378534 0.98495309
## x2 60 57.57483 1.6214144 57.40 54.8 62.6 56.500 58.425 0.67695813 0.46445914
## x3 60 19.80667 0.6769490 19.80 18.5 21.5 19.375 20.200 0.12363518 -0.46848405
## x4 60 10.51333 1.2139677 10.40 7.4 13.1 9.800 11.325 -0.04915206 -0.29469553
## x5 60 13.57500 0.6985760 13.60 11.1 15.1 13.075 14.000 -0.65865793 1.27042202
## x6 60 11.87333 0.5689320 11.80 10.5 13.3 11.500 12.200 0.26399327 0.06933073
Dapat dilihat bahwa pada Q-Q Plot, titik-titik data tersebut telah menyebar di sekitar garis lurus. Hal ini berarti menunjukkan bahwa data berdistribusi normal. Pernyataan ini dapat dibuktikan di mana Mardia Kurtosis dan Mardia Skewness memiliki p-value yang lebih besar dari alpha (0.05) sehingga data tersebut telah berdistribusi secara normal.
UJI HOMOGENITAS
Selanjutnya akan ditunjukkan bahwa data tersebut homogen, melalui rumusan hipotesis sebagai berikut:
H0 : Data berkarakteristik Homogen
H1 : Data berkarakteristik Heterogen
data2$group = ifelse(data2$group == "College", 1, 2)
library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
boxM(data = data3, grouping = data2$group)
##
## Box's M-test for Homogeneity of Covariance Matrices
##
## data: data3
## Chi-Sq (approx.) = 22.136, df = 21, p-value = 0.3917
Dari hasil analisis menggunakan Box M diketahui bahwa p-value, lebih besar dari taraf signifikansi alpha 5%, sehingga disimpulkan bahwa data homogen. Selanjutnya akan dilakukan Uji Manova dengan rumusan hipotesis:
H0 : Faktor tidak memengaruhi respon secara signifikan
H1 : Setidaknya terdapat satu faktor yang mempengaruhi respons secara signifikan
owm = manova(cbind(data3$x1, data3$x2, data3$x3, data3$x4, data3$x5, data3$x6)~data2$group)
summary(owm)
## Df Pillai approx F num Df den Df Pr(>F)
## data2$group 1 0.19211 2.1004 6 53 0.06851 .
## Residuals 58
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dengan taraf signifikansi 5%, dapat disimpulkan bahwa faktor tersebut tidak memengaruhi respon secara signifikan.