DESKRIPSI DATA

Pada pembahasan Two Way MANOVA kali ini, akan digunakan data yang meneliti hubungan antara penyakit jantung dengan beberapa variabel seperti thal, chol, umur, dan lain sebagainya. Data dapat diakses pada tautan berikut:

https://www.kaggle.com/datasets/abdmental01/heart-disease-dataset?select=heart_disease_uci.csv

data <- read.csv("C:/Users/MSI Cyborg15/OneDrive/Documents/college/Semester 3/Analisis Data Multivariat 1/heart_disease_uci.csv")
head(data)
##   id age    sex   dataset              cp trestbps chol   fbs        restecg
## 1  1  63   Male Cleveland  typical angina      145  233  TRUE lv hypertrophy
## 2  2  67   Male Cleveland    asymptomatic      160  286 FALSE lv hypertrophy
## 3  3  67   Male Cleveland    asymptomatic      120  229 FALSE lv hypertrophy
## 4  4  37   Male Cleveland     non-anginal      130  250 FALSE         normal
## 5  5  41 Female Cleveland atypical angina      130  204 FALSE lv hypertrophy
## 6  6  56   Male Cleveland atypical angina      120  236 FALSE         normal
##   thalch exang oldpeak       slope ca              thal num
## 1    150 FALSE     2.3 downsloping  0      fixed defect   0
## 2    108  TRUE     1.5        flat  3            normal   2
## 3    129  TRUE     2.6        flat  2 reversable defect   1
## 4    187 FALSE     3.5 downsloping  0            normal   0
## 5    172 FALSE     1.4   upsloping  0            normal   0
## 6    178 FALSE     0.8   upsloping  0            normal   0

UJI NORMALITAS

Untuk melakukan uji asumsi normalitas, akan dilakukan plot Q-Q untuk melihat persebaran data secara eksploratif, lalu akan dilakukan juga uji Mardia Test dengan rumusan hipotesis:

A. Mardia Skewness

H0 : Data berdistribusi Normal

H1 : Data tidak berdistribusi Normal

B. Mardia Kurtosis

H0 : Data berdistribusi Normal

H1 : Data tidak berdistribusi Normal

Dikarenakan data yang begitu banyak, maka akan diambil data dengan baris ke- 180 sampai baris ke- 240, dengan kolom 3, kolom 6 dan 7, serta kolom 9 dan 10 sebagai acuan pembelajaran Analisis Data Multivariat ini.

H0 akan ditolak jika p-value < alpha, terima dalam hal lainnya. Dengan taraf signifikansi 5%, diperoleh:

data1 <- data[181:240,c(3,6:7,9:10)]
x1 <- data[181:240,6]
x2 <- data[181:240,7]
x3 <- data[181:240,10]
data2 <- data.frame(x1=x1, x2=x2, x3=x3)
library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
test = mvn(data2, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq"); test

## $multivariateNormality
##              Test         Statistic           p value Result
## 1 Mardia Skewness   9.0816883310946  0.52436902974998    YES
## 2 Mardia Kurtosis 0.449877220786362 0.652798973455237    YES
## 3             MVN              <NA>              <NA>    YES
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    x1        0.9466    0.0108    NO    
## 2 Shapiro-Wilk    x2        0.9704    0.1525    YES   
## 3 Shapiro-Wilk    x3        0.9649    0.0822    YES   
## 
## $Descriptives
##     n     Mean  Std.Dev Median Min Max   25th   75th       Skew   Kurtosis
## x1 60 133.2500 21.59145  130.0  94 192 120.00 142.50  0.7304306  0.0235914
## x2 60 250.1167 46.92767  248.0 126 409 211.75 278.25  0.2674444  1.1171348
## x3 60 150.2833 24.53161  154.5  95 195 129.00 168.25 -0.3070791 -0.8433647

Dapat dilihat bahwa pada Q-Q Plot, titik-titik data tersebut telah menyebar di sekitar garis lurus. Hal ini berarti menunjukkan bahwa data berdistribusi normal. Pernyataan ini dapat dibuktikan di mana Mardia Kurtosis dan Mardia Skewness memiliki p-value yang lebih besar dari alpha (0.05) sehingga data tersebut telah berdistribusi secara normal.

UJI HOMOGENITAS

Selanjutnya akan ditunjukkan bahwa data tersebut homogen, melalui rumusan hipotesis sebagai berikut:

H0 : Data berkarakteristik Homogen

H1 : Data berkarakteristik Heterogen

data1$sex = ifelse(data1$sex == "Male", 1, 2)
library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
boxM(data = data2, grouping = data1$sex)
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data2
## Chi-Sq (approx.) = 4.927, df = 6, p-value = 0.5532
data1$restecg = ifelse(data1$restecg == "normal", 1, 2)
boxM(data = data2, grouping = data1$restecg)
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data2
## Chi-Sq (approx.) = 7.6159, df = 6, p-value = 0.2676

Dari hasil analisis menggunakan Box M diketahui bahwa p-value, lebih besar dari taraf signifikansi alpha 5%, sehingga disimpulkan bahwa data homogen. Selanjutnya akan dilakukan Uji Manova dengan rumusan hipotesis:

H0 : Faktor tidak memengaruhi respon secara signifikan

H1 : Setidaknya terdapat satu faktor yang mempengaruhi respons secara signifikan

sex <- as.factor(data1$sex)
restecg <- as.factor(data1$restecg)
manova <- manova(cbind(x1, x2, x3) ~ sex * restecg, data = data2)
summary(manova)
##             Df   Pillai approx F num Df den Df Pr(>F)
## sex          1 0.078348   1.5301      3     54 0.2172
## restecg      1 0.060996   1.1692      3     54 0.3300
## sex:restecg  1 0.024385   0.4499      3     54 0.7184
## Residuals   56

Dengan taraf signifikansi 5%, didapatkan bahwa:

Sehingga kedua faktor tersebut tidak memiliki pengaruh yang signifikan terhadap respon.