Manova atau Multivariate Analysis Of Variance merupakan suatu uji signifikansi rata-rata sampel multivariat.

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

DATA

Pada pembahasan MANOVA ini, digunakan data pola dan tingkat kinerja pada ukuran neurokognitif di antara individu dengan skizofrenia dan gangguan skizoafektif. Data dapat diakses pada tautan berikut: https://vincentarelbundock.github.io/Rdatasets/doc/heplots/NeuroCog.html

data <- read.csv("C:/Users/ACER/Documents/ANALISIS DATA MULTIVARIAT/MANOVA/NeuroCog.csv")
head(data)
##   rownames            Dx Speed Attention Memory Verbal Visual ProbSolv
## 1       14 Schizophrenia    19         9     19     33     24       39
## 2       15 Schizophrenia     8        25     15     28     24       40
## 3       16 Schizophrenia    14        23     15     20     13       32
## 4       17 Schizophrenia     7        18     14     34     16       31
## 5       18 Schizophrenia    21         9     35     28     29       45
## 6       19 Schizophrenia    31        10     26     29     21       33
##   SocialCog Age    Sex
## 1        28  44 Female
## 2        37  26   Male
## 3        24  55 Female
## 4        36  53   Male
## 5        28  51   Male
## 6        28  21   Male

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Uji Asumsi

Dalam pengujian menggunakan Manova dengan bantuan software R, taraf dari faktor independen harus bertipe numerik, sehingga disini akan didefinisikan terlebih dahulu bahwa untuk Dx “Schizophrenia” = 1, “Schizoaffective” = 2, dan “Control” = 0

data$Dx <- ifelse(data$Dx == "Schizophrenia", 1,
                  ifelse(data$Dx == "Schizoaffective", 2, 0))
head(data)
##   rownames Dx Speed Attention Memory Verbal Visual ProbSolv SocialCog Age
## 1       14  1    19         9     19     33     24       39        28  44
## 2       15  1     8        25     15     28     24       40        37  26
## 3       16  1    14        23     15     20     13       32        24  55
## 4       17  1     7        18     14     34     16       31        36  53
## 5       18  1    21         9     35     28     29       45        28  51
## 6       19  1    31        10     26     29     21       33        28  21
##      Sex
## 1 Female
## 2   Male
## 3 Female
## 4   Male
## 5   Male
## 6   Male
attach(data)

Akan didefinisikan terlebih dahulu variabel dependen, “Speed” = x1, “Attention” = x2, “Memori” = x3, “Verbal” = x4, “Visual” = x5, “ProbSolv” = x6, dan “SocialCog” = x7.

x1 <- data[,3]
x2 <- data[,4]
x3 <- data[,5]
x4 <- data[,6]
x5 <- data[,7]
x6 <- data[,8]
x7 <- data[,9]
data_fix <- data.frame(x1=x1, x2=x2, x3=x3, x4=x4, x5=x5, x6=x6, x7=x7)

1. Asumsi Normalitas

Untuk melakukan uji asumsi normalitas, dilakukan plot Q-Q untuk melihat persebaran data secara eksploratif, lalu dilakukan juga uji formal menggunakan Mardia Test dengan hipotesis:

Mardia Skewness

H0: Data berdistribusi Normal

H1: Data tidak berdistribusi Normal

Mardia Kurtosis

H0: Data berdistribusi Normal

H1: Data tidak berdistribusi Normal

dengan taraf signifikansi alpha 5%, sehingga nilai kritisnya sebesar 0,05.

## Uji Normalitas Multivariate 
library(MVN)
## Warning: package 'MVN' was built under R version 4.3.3
test = mvn((data[2:9]), mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test          Statistic              p value Result
## 1 Mardia Skewness   221.298574459728 5.23151524166493e-08     NO
## 2 Mardia Kurtosis -0.624269249358864    0.532450775270711    YES
## 3             MVN               <NA>                 <NA>     NO
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    Dx        0.7002  <0.001      NO    
## 2 Shapiro-Wilk   Speed      0.9846  0.0102      NO    
## 3 Shapiro-Wilk Attention    0.9789  0.0011      NO    
## 4 Shapiro-Wilk  Memory      0.9797  0.0015      NO    
## 5 Shapiro-Wilk  Verbal      0.9733   2e-04      NO    
## 6 Shapiro-Wilk  Visual      0.9889   0.06       YES   
## 7 Shapiro-Wilk ProbSolv     0.9615  <0.001      NO    
## 8 Shapiro-Wilk SocialCog    0.9850  0.0119      NO    
## 
## $Descriptives
##             n       Mean    Std.Dev Median Min Max 25th  75th        Skew
## Dx        242  0.5619835  0.7555335      0   0   2    0  1.00  0.91128609
## Speed     242 40.3099174 12.1046194     41  -1  74   33 48.75 -0.35203222
## Attention 242 39.7520661 13.4961381     41   1  67   32 50.00 -0.44530106
## Memory    242 42.4421488 12.2392624     44   3  71   36 51.00 -0.48103440
## Verbal    242 41.3719008 10.2030280     40  20  78   33 48.00  0.47718521
## Visual    242 37.1157025 11.2051337     38  12  65   29 44.00 -0.02114612
## ProbSolv  242 45.8264463  9.9847832     45  29  65   39 52.00  0.26765404
## SocialCog 242 43.9338843 12.7345940     44  10  72   34 53.00 -0.05561740
##              Kurtosis
## Dx        -0.67461201
## Speed      0.77637629
## Attention -0.28534512
## Memory     0.06294211
## Verbal    -0.18988635
## Visual    -0.60348440
## ProbSolv  -0.88183569
## SocialCog -0.75241979

Secara eksploratif, dapat dilihat bahwa titik-titik data sudah menyebar di sekitar garis lurus, namun dari uji formal menggunakan Mardia test, diketahui bahwa data tidak berdistribsi normal secara multivariate karena p-value untuk mardia skewnessnya jauh lebih kecil dari taraf signifikansi alpha 5%.

Data yang tidak normal seharusnya ditangani dengan melakukan trasformasi data, setelah dilakukan transformasi data yang cukup panjang, tidak ditemukan transformasi yang menjadikan data tersebut normal secara multivariat. Sehingga demi keberlangsungan pembelajaran, diputuskan untuk dilakukan pemotongan data sebanyak 86 data yakni dari baris ke-40 sampai ke-125.

data_p <- data_fix[40:125,]
x1 <- data[40:125,3]
x2 <- data[40:125,4]
x3 <- data[40:125,5]
x4 <- data[40:125,6]
x5 <- data[40:125,7]
x6 <- data[40:125,8]
x7 <- data[40:125,9]

Selanjutnya, dilakukan uji normalitas kembali secara eksploratif dan formal menggunakan metode yang sama.

library(MVN)
test = mvn(data_p, mvnTest = "mardia", univariateTest = "SW", multivariatePlot = "qq")

test
## $multivariateNormality
##              Test          Statistic            p value Result
## 1 Mardia Skewness   101.008645264592 0.0996571537793414    YES
## 2 Mardia Kurtosis -0.458156694462462  0.646839869768339    YES
## 3             MVN               <NA>               <NA>    YES
## 
## $univariateNormality
##           Test  Variable Statistic   p value Normality
## 1 Shapiro-Wilk    x1        0.9786    0.1652    YES   
## 2 Shapiro-Wilk    x2        0.9870    0.5500    YES   
## 3 Shapiro-Wilk    x3        0.9867    0.5296    YES   
## 4 Shapiro-Wilk    x4        0.9534    0.0036    NO    
## 5 Shapiro-Wilk    x5        0.9807    0.2277    YES   
## 6 Shapiro-Wilk    x6        0.9465    0.0014    NO    
## 7 Shapiro-Wilk    x7        0.9704    0.0454    NO    
## 
## $Descriptives
##     n     Mean   Std.Dev Median Min Max  25th  75th       Skew   Kurtosis
## x1 86 34.70930  9.311430   35.0   2  55 28.25 41.00 -0.4658470  0.7388268
## x2 86 34.95349 13.672563   34.5   1  63 26.50 45.00 -0.2090929 -0.4631130
## x3 86 38.08140 12.231315   39.0  10  68 29.00 46.75 -0.1413130 -0.4406118
## x4 86 37.86047  8.513191   37.0  23  67 32.00 42.00  0.7734299  0.4575772
## x5 86 34.20930 10.817324   34.5  12  57 26.00 41.00  0.1595105 -0.6580799
## x6 86 41.44186  8.742869   40.0  29  65 35.00 47.50  0.6674841 -0.2354894
## x7 86 40.26744 12.020986   39.5  15  65 29.50 50.75  0.1895354 -0.9079452

Dapat dilihat melalui gambar plot Q-Q, titik-titik data tersebut sudah menyebar di sekitar garis lurus, hal ini mengindikasikan bahwa data berdistribusi normal. Untuk memperkuat keyakinan, dilakukan juga uji menggunakan Mardia Test yang dimana didapatkan bahwa p-value mardia kurtosis dan mardia skewness lebih besar dari taraf signifikansi alpha 5%, sehingga dapat disimpulkan bahwa data berdistribusi normal.

2. Asumsi Homogenitas

Asumsi yang harus terpenuhi berikutnya adalah data memiliki karakteristik yang homogen. Uji asumsi ini dilakukan dengan hipotesis:

H0: Data berkarakteristik homogen

H1: Data tidak berkarakteristik homogen (heterogen)

dengan taraf signifikansi alpha 5%, sehingga nilai kritisnya sebesar 0,05.

#UJI HOMOGENITAS
library(biotools)
## Warning: package 'biotools' was built under R version 4.3.3
## Loading required package: MASS
## ---
## biotools version 4.2
head(data[40:125,2])
## [1] 1 1 1 1 1 1
boxM(data = data_p, grouping = data[40:125,2])
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  data_p
## Chi-Sq (approx.) = 70.569, df = 56, p-value = 0.09103

Dari hasil analisis menggunakan Box M diketahui bahwa p-value lebih besar dari taraf signifikansi alpha 5%, sehingga disimpulkan bahwa data homogen.

3. Asumsi Independensi

Diketahui dari sumber bahwa data diambil dari 242 individu dengan schizophrenia atau schizoaffective secara acak dengan jenis kelamin yang acak juga (tidak ditentukan berapa perempuan ataupun berapa laki-laki). Sehingga asumsi independensi dapat terpenuhi.

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Uji Hipotesis

One-Way Manova

Dengan One-Way Manova, kita akan melihat pola dan tingkat kinerja pada ukuran neurokognitif di antara individu dengan skizofrenia dan gangguan skizoafektif. Akan dilihat apakah ada pengaruh kondisi individu terhadap hasil pengukuran neurokognitifnya.

Pengujian dilakukan dengan Hipotesis:

H0: Faktor tidak mempengaruhi respons secara signifikan

H1: Faktor mempengaruhi respons secara signifikan

Taraf signifikansi yang digunakan pada pembahasan ini adalah 5% dengan nilai kritis sebesar 0,05.

Selanjutnya dilakukan statistik uji dengan Manova:

#MANOVA
owm = manova(cbind(Speed,Attention,Memory,Verbal,Visual,ProbSolv,SocialCog)~Dx)
summary(owm)
##            Df  Pillai approx F num Df den Df    Pr(>F)    
## Dx          1 0.25458   11.417      7    234 1.895e-12 ***
## Residuals 240                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Sehingga dengan taraf signifikansi 5%, dapat disimpulkan bahwa terdapat ada pengaruh signifikan antara kondisi individu terhadap hasil pengukuran neurokognitifnya.

Karena didapati faktor mempengaruhi hasil pengukuran neurokognitif secara signifikan, maka selanjutnya akan dilakukan uji lanjut.

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Uji Lanjut

Post Hoc Test

Pada pengujian tingkat lanjut menggunakan Post Hoc Test, hipotesis yang digunakan adalah sebagai berikut:

H0: Faktor tidak mempengaruhi respons i secara signifikan

H1: Faktor mempengaruhi respons i secara signifikan

Sama seperti sebelumnya, taraf signifikansi yang digunakan adalah alpha 5%, dimana nilai kritisnya adalah 0,05. Selanjutnya pengujian akan sebagaimana dilakukan berikut ini:

## Uji Lanjut (Post Hoc Test)
summary.aov(owm)
##  Response Speed :
##              Df  Sum Sq Mean Sq F value    Pr(>F)    
## Dx            1  6926.4  6926.4  58.563 4.776e-13 ***
## Residuals   240 28385.4   118.3                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Attention :
##              Df Sum Sq Mean Sq F value    Pr(>F)    
## Dx            1   4313  4312.9  26.149 6.461e-07 ***
## Residuals   240  39584   164.9                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Memory :
##              Df Sum Sq Mean Sq F value   Pr(>F)    
## Dx            1   2951 2950.77  21.362 6.21e-06 ***
## Residuals   240  33151  138.13                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Verbal :
##              Df  Sum Sq Mean Sq F value    Pr(>F)    
## Dx            1  3649.7  3649.7  40.856 8.457e-10 ***
## Residuals   240 21438.9    89.3                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Visual :
##              Df  Sum Sq Mean Sq F value    Pr(>F)    
## Dx            1  3049.8 3049.80  26.901 4.552e-07 ***
## Residuals   240 27209.0  113.37                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response ProbSolv :
##              Df  Sum Sq Mean Sq F value  Pr(>F)    
## Dx            1  3761.9  3761.9  44.553 1.7e-10 ***
## Residuals   240 20264.8    84.4                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response SocialCog :
##              Df Sum Sq Mean Sq F value    Pr(>F)    
## Dx            1   2445 2445.37  16.019 8.362e-05 ***
## Residuals   240  36638  152.66                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Responses Faktor Keputusan
Speed Kondisi Individu (Dx) Tolak H0
Attention Tolak H0
Memory Tolak H0
Verbal Tolak H0
Visual Tolak H0
Problem Solving Tolak H0
Social Cognitif Tolak H0

Dari tabel keputusan, dengan taraf signifkansi 5%, diketahui bahwa kondisi individu (Dx) mempengaruhi setiap hasil pengukuran kognitif yang terdiri dari Speed, Attention, Memory, Verbal, Visual, Problem Solving, dan Social Cognitif, masing-masing secara signifikan.