Multivariate Analysis of Variance (MANOVA)

MANOVA adalah teknik analisis statistik yang digunakan untuk menguji perbedaan simultan antara dua atau lebih variabel dependen yang terkait dengan satu atau lebih variabel independen. Tujuannya untuk menentukan apakah terdapat perbedaan signifikan antara kelompok dalam beberapa variabel dependen.

Asumsi MANOVA:

  1. Independen
  2. Sampel Acak
  3. Normalitas Multivariat
  4. Homogenitas Matriks Kovariansi

Keterangan variabel:

drat: rasio poros belakang

wt: berat mobil dalam 1000 lbs

qsec: waktu untuk menempuh 1/4 mil

gear: jumlah gigi depan

cyl: jumlah silinder

Import Dataset

data <- read.csv("C:/Users/L E N O V O/Documents/Tugas Kuliah/mtcars.csv")
head(data)
##            rownames  mpg cyl disp  hp drat    wt  qsec vs am gear carb
## 1         Mazda RX4 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## 2     Mazda RX4 Wag 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## 3        Datsun 710 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## 4    Hornet 4 Drive 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## 5 Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## 6           Valiant 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

Dataset yang digunakan pada kasus ini adalah dataset mtcars yang tersedia di website Vincent Arel-Bundock yang berisi kumpulan data dari tes kendaraan yang pertama kali di muat di majalah Motor Trend tahun 1974. Dataset ini mencakup 32 mobil model tahun 1973-1974.

ONE-WAY MANOVA

Uji Normalitas

Hipotesis:

H0: Data berdistribusi normal multivariat

H1: Data tidak berdistribusi normal multivariat

Statistik Uji:

Menggunakan Mardia’s Test

library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
data1<-data.frame(data$qsec,data$drat,data$wt)
test = mvn(data1, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test          Statistic           p value Result
## 1 Mardia Skewness   6.32177258619075 0.787543740325955    YES
## 2 Mardia Kurtosis -0.640582934654805 0.521793689975588    YES
## 3             MVN               <NA>              <NA>    YES
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk data.qsec    0.9733    0.5935    YES   
## 2 Shapiro-Wilk data.drat    0.9459    0.1101    YES   
## 3 Shapiro-Wilk  data.wt     0.9433    0.0927    YES   
## 
## $Descriptives
##            n      Mean   Std.Dev Median    Min    Max     25th  75th      Skew
## data.qsec 32 17.848750 1.7869432 17.710 14.500 22.900 16.89250 18.90 0.3690453
## data.drat 32  3.596563 0.5346787  3.695  2.760  4.930  3.08000  3.92 0.2659039
## data.wt   32  3.217250 0.9784574  3.325  1.513  5.424  2.58125  3.61 0.4231465
##              Kurtosis
## data.qsec  0.33511422
## data.drat -0.71470062
## data.wt   -0.02271075

Didapatkan nilai p-value untuk uji normalitas multivariat sebagai berikut

Mardia Skewness: 0,787

Mardia Kurtosis: 0,521

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan dan Kesimpulan:

Karena nilai p-value untuk mardia kurtosis dan skewness > alpha (0,05) maka terima H0. Dengan taraf signifikansi 5% dapat disimpulkan bahwa secara simultan data berdistribusi normal.

Uji Homogenitas

Hipotesis:

H0: Matriks kovariansi grup adalah sama

H1: Minimal ada satu matriks kovarians grup yang berbeda

Statistik Uji:

Menggunakan Box’s M Test

library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
grup <- data$cyl
head(grup)
## [1] 6 6 4 6 8 6
boxM(data = data1, grouping = grup)
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data1
## Chi-Sq (approx.) = 19.794, df = 12, p-value = 0.07108

didapatkan p-value sebesar 0,07108

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan dan Kesimpulan:

Karena nilai p-value(0,07108) > 𝛼, maka H0 diterima. Dengan taraf signifikansi 5% dapat disimpulkan bahwa data ini memiliki matriks kovariansi grup yang sama.

MANOVA

Hipotesis:

H0: Tidak ada perbedaan signifikan pada rata-rata quarter-mile time(qsec), rasio poros belakang(drat), berat mobil (wt) berdasarkan jumlah silinder (cyl)

H1: Terdapat perbedaan signifikan pada rata-rata quarter-mile time(qsec), rasio poros belakang(drat), berat mobil (wt) berdasarkan jumlah silinder (cyl)

Statistik Uji:

owm = manova(cbind(data$qsec, data$drat, data$wt)~data$cyl)
summary(owm)
##           Df  Pillai approx F num Df den Df    Pr(>F)    
## data$cyl   1 0.87625   66.087      3     28 8.052e-13 ***
## Residuals 30                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan dan Kesimpulan:

Karena nilai p-value(8,052e-13) < 𝛼, maka H0 ditolak. Dengan taraf signifikansi 5% dapat disimpulkan bahwa terdapat perbedaan signifikan pada rata-rata quarter-mile time(qsec), rasio poros belakang(drat), berat mobil (wt) berdasarkan jumlah silinder (cyl).

Uji Lanjut

Hipotesis:

H0: Faktor tidak berpengaruh secara signifikan terhadap vektor yang diamati

H1: Faktor berpengaruh secara signifikan terhadap vektor yang diamati

Statistik Uji:

summary.aov(owm)
##  Response 1 :
##             Df Sum Sq Mean Sq F value    Pr(>F)    
## data$cyl     1 34.603  34.603  16.123 0.0003661 ***
## Residuals   30 64.385   2.146                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response 2 :
##             Df Sum Sq Mean Sq F value    Pr(>F)    
## data$cyl     1 4.3418  4.3418  28.814 8.245e-06 ***
## Residuals   30 4.5206  0.1507                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response 3 :
##             Df Sum Sq Mean Sq F value    Pr(>F)    
## data$cyl     1 18.172 18.1723  47.379 1.218e-07 ***
## Residuals   30 11.507  0.3835                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan:

Karena p-value untuk response qsec (0,0003661) < 𝛼, maka H0 ditolak

Karena p-value untuk response drat (8,245e-06) < 𝛼, maka H0 ditolak

Karena p-value untuk response drat (1,218e-07) < 𝛼, maka H0 ditolak

Kesimpulan:

Dengan taraf signifikansi 5% dapat disimpulkan,

  1. Jumlah silinder dari mobil secara signifikan memengaruhi waktu yg dibutuhkan untuk menempuh jarak 1/4 mil
  2. Jumlah silinder dari mobil secara signifikan memengaruhi rasio poros belakang
  3. Jumlah silinder dari mobil secara signifikan memengaruhi berat mobil

TWO-WAY MANOVA

Uji Normalitas

Hipotesis:

H0: Data berdistribusi normal multivariat

H1: Data tidak berdistribusi normal multivariat

Statistik Uji:

Menggunakan Mardia’s Test

library(MVN)
data1<-data.frame(data$qsec,data$drat,data$wt)
head(data1)
##   data.qsec data.drat data.wt
## 1     16.46      3.90   2.620
## 2     17.02      3.90   2.875
## 3     18.61      3.85   2.320
## 4     19.44      3.08   3.215
## 5     17.02      3.15   3.440
## 6     20.22      2.76   3.460
test = mvn(data1, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test          Statistic           p value Result
## 1 Mardia Skewness   6.32177258619075 0.787543740325955    YES
## 2 Mardia Kurtosis -0.640582934654805 0.521793689975588    YES
## 3             MVN               <NA>              <NA>    YES
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk data.qsec    0.9733    0.5935    YES   
## 2 Shapiro-Wilk data.drat    0.9459    0.1101    YES   
## 3 Shapiro-Wilk  data.wt     0.9433    0.0927    YES   
## 
## $Descriptives
##            n      Mean   Std.Dev Median    Min    Max     25th  75th      Skew
## data.qsec 32 17.848750 1.7869432 17.710 14.500 22.900 16.89250 18.90 0.3690453
## data.drat 32  3.596563 0.5346787  3.695  2.760  4.930  3.08000  3.92 0.2659039
## data.wt   32  3.217250 0.9784574  3.325  1.513  5.424  2.58125  3.61 0.4231465
##              Kurtosis
## data.qsec  0.33511422
## data.drat -0.71470062
## data.wt   -0.02271075

Didapatkan nilai p-value untuk uji normalitas multivariat sebagai berikut

Mardia Skewness: 0,787

Mardia Kurtosis: 0,521

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan dan Kesimpulan:

Karena nilai p-value untuk mardia kurtosis dan skewness > alpha (0,05) maka terima H0. Dengan taraf signifikansi 5% dapat disimpulkan bahwa secara simultan data berdistribusi normal.

Uji Homogenitas

Hipotesis:

H0: Matriks kovariansi grup adalah sama

H1: Minimal ada satu matriks kovarians grup yang berbeda

Statistik Uji:

Menggunakan Box’s M Test

library(biotools)
# Cyl
grup <- data$cyl
head(grup)
## [1] 6 6 4 6 8 6
boxM(data = data1, grouping = grup)
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data1
## Chi-Sq (approx.) = 19.794, df = 12, p-value = 0.07108
# Gear
grup <- data$gear
head(grup)
## [1] 4 4 4 3 3 3
boxM(data = data1, grouping = grup)
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data1
## Chi-Sq (approx.) = 12.904, df = 12, p-value = 0.376

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan dan Kesimpulan:

Karena nilai p-value kelompok Cyl (0,07108) > 𝛼, maka H0 diterima

Karena nilai p-value kelompok Gear (0,376) > 𝛼, maka H0 diterima.

Dengan taraf signifikansi 5% dapat disimpulkan bahwa data ini memiliki matriks kovariansi grup yang sama.

MANOVA

Hipotesis:

Pengaruh jumlah silinder

H0: Faktor jumlah silinder(cyl) tidak berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

H1: Faktor jumlah silinder(cyl) berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

Pengaruh jumlah gear

H0: Faktor jumlah gear(gear) tidak berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

H1: Faktor jumlah gear(gear) berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

Interaksi antara jumlah silinder dan jumlah gigi

H0: Interaksi antara jumlah silinder(cyl) dan jumlah gear(gear) tidak berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

H1: Interaksi antara jumlah silinder(cyl) dan jumlah gear(gear) berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

Statistik Uji:

cyl <- as.factor(data$cyl)
gear <- as.factor(data$gear)
manova <- manova(cbind(data$qsec, data$drat, data$wt) ~ data$cyl * data$gear, data = data)
summary(manova)
##                    Df  Pillai approx F num Df den Df    Pr(>F)    
## data$cyl            1 0.88677   67.872      3     26 1.991e-12 ***
## data$gear           1 0.56793   11.392      3     26 5.921e-05 ***
## data$cyl:data$gear  1 0.08576    0.813      3     26    0.4983    
## Residuals          28                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan:

Karena nilai p-value cyl (1,991e-12) < 𝛼, maka H0 ditolak

Karena nilai p-value gear (5,921e-05) < 𝛼, maka H0 ditolak

Karena nilai p-value cyl:gear (0,4983) < 𝛼, maka H0 diterima

Kesimpulan:

Dengan taraf signifikansi 5% dapat disimpulkan,

  1. Jumlah silinder(cyl) berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)
  2. Jumlah gear(gear) berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)
  3. Interaksi antara jumlah silinder(cyl) dan jumlah gear(gear) tidak berpengaruh terhadap rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt)

Uji Lanjut

Hipotesis:

H0: Faktor tidak berpengaruh secara signifikan terhadap vektor yang diamati

H1: Faktor berpengaruh secara signifikan terhadap vektor yang diamati

Statistik Uji:

summary.aov(manova)
##  Response 1 :
##                    Df Sum Sq Mean Sq F value    Pr(>F)    
## data$cyl            1 34.603  34.603 32.6022 4.007e-06 ***
## data$gear           1 33.202  33.202 31.2821 5.501e-06 ***
## data$cyl:data$gear  1  1.465   1.465  1.3801      0.25    
## Residuals          28 29.718   1.061                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response 2 :
##                    Df Sum Sq Mean Sq F value    Pr(>F)    
## data$cyl            1 4.3418  4.3418 40.3515  7.13e-07 ***
## data$gear           1 1.4729  1.4729 13.6888 0.0009339 ***
## data$cyl:data$gear  1 0.0349  0.0349  0.3243 0.5735723    
## Residuals          28 3.0128  0.1076                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response 3 :
##                    Df  Sum Sq Mean Sq F value    Pr(>F)    
## data$cyl            1 18.1723 18.1723 51.0170 8.995e-08 ***
## data$gear           1  1.5328  1.5328  4.3032   0.04735 *  
## data$cyl:data$gear  1  0.0000  0.0000  0.0001   0.99084    
## Residuals          28  9.9736  0.3562                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kriteria Uji:

Jika nilai p-value < 𝛼, maka H0 ditolak

Keputusan:

Response Kelompok P-Value Keputusan
1 (qsec) cyl 4,007e-06 Tolak H0
gear 5,501e-06 Tolak H0
cyl:gear 0,25 Terima H0
2 (drat) cyl 7,13e-07 Tolak H0
gear 0,0009339 Tolak H0
cyl:gear 0,5735723 Terima H0
3 (wt) cyl 8,995e-08 Tolak H0
gear 0,04735 Tolak H0
cyl:gear 0,99084 Terima H0

Kesimpulan:

Dengan taraf signifikansi 5% dapat disimpulkan,

  1. Jumlah silinder dan gear dari mobil secara signifikan memengaruhi waktu yg dibutuhkan untuk menempuh jarak 1/4 mil
  2. Jumlah silinder dan gear dari mobil secara signifikan memengaruhi rasio poros belakang.
  3. Jumlah silinder dan gear dari mobil secara signifikan memengaruhi berat mobil.
  4. Interaksi antara jumlah silinder(cyl) dan jumlah gear(gear) tidak memengaruhi rata-rata quarter-mile time(qsec), rasio poros belakang(drat), dan berat mobil (wt) secara signifikan.