DESKRIPSI DATA
Pada pembahasan Two Way MANOVA kali ini, akan digunakan data yang meneliti hubungan antara penyakit jantung dengan beberapa variabel seperti thal, chol, umur, dan lain sebagainya. Data dapat diakses pada tautan berikut:
https://www.kaggle.com/datasets/abdmental01/heart-disease-dataset?select=heart_disease_uci.csv
data <- read.csv("C:/Users/MSI Cyborg15/OneDrive/Documents/college/Semester 3/Analisis Data Multivariat 1/heart_disease_uci.csv")
head(data)
## id age sex dataset cp trestbps chol fbs restecg
## 1 1 63 Male Cleveland typical angina 145 233 TRUE lv hypertrophy
## 2 2 67 Male Cleveland asymptomatic 160 286 FALSE lv hypertrophy
## 3 3 67 Male Cleveland asymptomatic 120 229 FALSE lv hypertrophy
## 4 4 37 Male Cleveland non-anginal 130 250 FALSE normal
## 5 5 41 Female Cleveland atypical angina 130 204 FALSE lv hypertrophy
## 6 6 56 Male Cleveland atypical angina 120 236 FALSE normal
## thalch exang oldpeak slope ca thal num
## 1 150 FALSE 2.3 downsloping 0 fixed defect 0
## 2 108 TRUE 1.5 flat 3 normal 2
## 3 129 TRUE 2.6 flat 2 reversable defect 1
## 4 187 FALSE 3.5 downsloping 0 normal 0
## 5 172 FALSE 1.4 upsloping 0 normal 0
## 6 178 FALSE 0.8 upsloping 0 normal 0
UJI NORMALITAS
Untuk melakukan uji asumsi normalitas, akan dilakukan plot Q-Q untuk melihat persebaran data secara eksploratif, lalu akan dilakukan juga uji Mardia Test dengan rumusan hipotesis:
A. Mardia Skewness
H0 : Data berdistribusi Normal
H1 : Data tidak berdistribusi Normal
B. Mardia Kurtosis
H0 : Data berdistribusi Normal
H1 : Data tidak berdistribusi Normal
Dikarenakan data yang begitu banyak, maka akan diambil data dengan baris ke- 180 sampai baris ke- 240, dengan kolom 3, kolom 6 dan 7, serta kolom 9 dan 10 sebagai acuan pembelajaran Analisis Data Multivariat ini.
H0 akan ditolak jika p-value < alpha, terima dalam hal lainnya. Dengan taraf signifikansi 5%, diperoleh:
data1 <- data[181:240,c(3,6:7,9:10)]
x1 <- data[181:240,6]
x2 <- data[181:240,7]
x3 <- data[181:240,10]
data2 <- data.frame(x1=x1, x2=x2, x3=x3)
library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
test = mvn(data2, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq"); test
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 9.0816883310946 0.52436902974998 YES
## 2 Mardia Kurtosis 0.449877220786362 0.652798973455237 YES
## 3 MVN <NA> <NA> YES
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Shapiro-Wilk x1 0.9466 0.0108 NO
## 2 Shapiro-Wilk x2 0.9704 0.1525 YES
## 3 Shapiro-Wilk x3 0.9649 0.0822 YES
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis
## x1 60 133.2500 21.59145 130.0 94 192 120.00 142.50 0.7304306 0.0235914
## x2 60 250.1167 46.92767 248.0 126 409 211.75 278.25 0.2674444 1.1171348
## x3 60 150.2833 24.53161 154.5 95 195 129.00 168.25 -0.3070791 -0.8433647
Dapat dilihat bahwa pada Q-Q Plot, titik-titik data tersebut telah menyebar di sekitar garis lurus. Hal ini berarti menunjukkan bahwa data berdistribusi normal. Pernyataan ini dapat dibuktikan di mana Mardia Kurtosis dan Mardia Skewness memiliki p-value yang lebih besar dari alpha (0.05) sehingga data tersebut telah berdistribusi secara normal.
UJI HOMOGENITAS
Selanjutnya akan ditunjukkan bahwa data tersebut homogen, melalui rumusan hipotesis sebagai berikut:
H0 : Data berkarakteristik Homogen
H1 : Data berkarakteristik Heterogen
data1$sex = ifelse(data1$sex == "Male", 1, 2)
library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
boxM(data = data2, grouping = data1$sex)
##
## Box's M-test for Homogeneity of Covariance Matrices
##
## data: data2
## Chi-Sq (approx.) = 4.927, df = 6, p-value = 0.5532
data1$restecg = ifelse(data1$restecg == "normal", 1, 2)
boxM(data = data2, grouping = data1$restecg)
##
## Box's M-test for Homogeneity of Covariance Matrices
##
## data: data2
## Chi-Sq (approx.) = 7.6159, df = 6, p-value = 0.2676
Dari hasil analisis menggunakan Box M diketahui bahwa p-value, lebih besar dari taraf signifikansi alpha 5%, sehingga disimpulkan bahwa data homogen. Selanjutnya akan dilakukan Uji Manova dengan rumusan hipotesis:
H0 : Faktor tidak memengaruhi respon secara signifikan
H1 : Setidaknya terdapat satu faktor yang mempengaruhi respons secara signifikan
sex <- as.factor(data1$sex)
restecg <- as.factor(data1$restecg)
manova <- manova(cbind(x1, x2, x3) ~ sex * restecg, data = data2)
summary(manova)
## Df Pillai approx F num Df den Df Pr(>F)
## sex 1 0.078348 1.5301 3 54 0.2172
## restecg 1 0.060996 1.1692 3 54 0.3300
## sex:restecg 1 0.024385 0.4499 3 54 0.7184
## Residuals 56
Dengan taraf signifikansi 5%, didapatkan bahwa:
Faktor Sex, karna p-value (0.2172) > alpha (0.05), maka H0 ditolak
Faktor Restecg, karna p-value (0.3300) > alpha (0.05), maka H0 ditolak
Sehingga kedua faktor tersebut tidak memiliki pengaruh yang signifikan terhadap respon.