Penerapan Multivariate Analysis of Variance (MANOVA) untuk Menganalisis Pengaruh Tingkat Pendidikan Orang Tua terhadap Math score, Reading score, dan Writing Score Siswa

1. PENDAHULUAN

1.1 Latar Belakang

Prestasi akademik siswa dipengaruhi oleh beberapa faktor, mulai dari lingkungan sekolah, kondisi psikologis, serta latar belakang keluarga. Pada latar belakang keluarga, salah satu aspek yang sering diteliti adalah tingkat pendidikan orang tua yang berperan dalam memberikan dukungan belajar, kualitas pendidikan, serta ekspektasi akademik anak. Beragam penelitian telah menunjukkan bahwa orang tua yang memiliki pendidikan lebih tinggi cenderung memiliki pengetahuan dan sumber daya yang lebih baik dalam mendukung perkembangan akademik anak. Sebagai contoh, studi oleh Agustina (2024) menunjukkan bahwa pendidikan orang tua berpengaruh positif dengan hasil belajar siswa SD di Indonesia. Selain itu, meta-analisis internasional menunjukkan bahwa latar belakang pendidikan orang tua berpengaruh signifikan dengan prestasi matematika dan literasi siswa (Huang et al., 2024).

Namun, sebagian besar penelitian hanya menganalisis satu mata pelajaran secara terpisah, padahal prestasi akademik adalah suatu kontruksi multivariat. Oleh karena itu, diperlukan analisis yang mempertimbangkan tiga skor akademik secara simultan (Matematika, Membaca, dan Menulis) untuk menganalisis apakah tingkat pendidikan orang tua memiliki pengaruh signifikan terhadap tiga skor akademik tersebut secara bersama-sama.

1.2 Data

Penelitian ini menggunakan 100 data siswa dari dataset “Students Performance in Exams” yang tersedia pada platform Kaggle. Dalam penelitian ini digunakan variabel:

Variabel Independen (X):

Parental Level of Education
Variabel Dependen (Y):

Math Score (Y1)

Reading Score (Y2)

Writing Score (Y3)

Berikut adalah sebagian data yang digunakan:

X	Y1	Y2	Y3
Bachelor’s degree	72	72	74
Some college	69	90	88
Master’s degree	90	95	93
Associate’s degree	47	57	44
Some college	76	78	75
Associate’s degree	71	83	78
Some college	88	95	92
Some college	40	43	39
High school	64	64	67
High school	38	60	50

1.3 Latar Belakang Metode

Multivariate Analysis of Variance (MANOVA) merupakan pengembangan dari ANOVA yang memungkinkan pengujian pengaruh faktor tertentu terhadap beberapa variabel debenden secara simultan. Pendekatan ini penting digunakan saat variabel dependen saling berkaitan, sehingga analisis univariat saja dapat menghasilkan interpretasi yang tidak tepat. Dengan menggunakan MANOVA, peneliti dapat menguji apakah terdapat perbedaan profil multivariat di antara kelompok-kelompok, serta menganalisis dampak faktor independen dengan lebih komprehensif. Dalam penelitian ini, MANOVA digunakan untuk menguji apakah pendidikan orang tua berpengaruh signifikan terhadap tiga skor akademik siswa secara bersama-sama.

1.4 Tinjauan Pustaka Metode

1.4.1 MANOVA

Multivariate Analysis of Variance (MANOVA) adalah metode statistik yang digunakan untuk menguji perbedaan rata-rata secara bersamaan pada beberapa variabel dependen, dengan memperhitungkan hubungan antara komponen respons. MANOVA dianggap sebagai perluasan langsung dari ANOVA sehingga dapat mengurangi risiko kesalahan Tipe I yang meningkat saat lebih dari satu variabel dependen dianalisis secara bersamaan.

Buku-buku statistik multivariat terkini mengungkapkan bahwa model MANOVA secara matematis dituliskan dalam bentuk matriks Y=XB+E, yang memungkinkan pemecahan matriks SSCP (H dan E) sebagai dasar untuk perhitungan statistik omnibus seperti Wilks’ Lambda, Pillai’s Trace, Hotelling–Lawley, dan Roy’s Largest Root

1.4.2 Asumsi MANOVA

Untuk melakukan uji MANOVA, asumsi normalitas residual, homogenitas matriks kovarians, serta independensi perlu dipenuhi. Pelanggaran terhadap ketiga asumsi ini dapat mempengaruhi validitas hasil, sehingga literatur terbaru merekomendasikan penggunaan statistik yang lebih robust seperti Pillai’s Trace dalam kondisi data yang kurang ideal. Dalam konteks riset pendidikan, MANOVA sangat penting untuk menganalisis dampak variabel kategori seperti tingkat pendidikan orang tua terhadap beberapa skor pencapaian belajar (misalnya Matematika, Membaca, dan Menulis) secara bersamaan, sehingga memberikan pemahaman hubungan yang lebih mendalam dibandingkan metode univariat terpisah

1.4.3 Relevansi MANOVA pada Penelitian Pendidikan

Dalam penelitian di bidang pendidikan, variabel keluarga seperti pendidikan orang tua seringkali berdampak pada berbagai bidang akademis secara bersamaan. Oleh sebab itu, penerapan MANOVA untuk menguji efek simultan pada nilai ujian siswa di bidang Matematika, Membaca, dan Menulis bertujuan untuk memberikan pemahaman yang lebih menyeluruh dibandingkan dengan pengujian terpisah. Tinjauan meta dan penelitian empiris mengenai dampak latar belakang keluarga mendukung pentingnya pendekatan multivariat dalam konteks pendidikan

1.5 Tujuan

Menganalisis apakah tingkat pendidikan orang tua berpengaruh secara signifikan terhadap tiga nilai akademik siswa secara simultan.
Mengidentifikasi perbedaan rata-rata nilai akademik berdasarkan tingkat pendidikan orang tua.
Menilai pola perbedaan profil nilai akademik antar kelompok tingkat pendidikan orang tua.

2. SOURCE CODE

2.1 Library

Berikut merupakan library yang diperlukan, yaitu:

library(readxl)
library(ggplot2)
library(MVN)
library(MVTests)
library(profileR)

Kegunaan library:

readxl: untuk mengimpor data dari file Excel ke RStudio untuk analisis lebih lanjut.
ggplot2:
MVN: untuk melakukan uji normalitas multivariat pada data.
MVTests: untuk menguji berbagai asumsi,salah satunya adalah uji homogenitas. Library ini bermanfaat saat ingin melakukan pengujian untuk dataset yang memiliki beberapa variabel.
profileR: untuk menjalankan uji pada analisis profil

2.2 Input Data

data <- read_excel("D:/SEMESTER 5/ANMUL/PROJECT/Students Performance in Exams.xlsx")
head(data)

## # A tibble: 6 × 4
##   `Parental level of education` `Math score` `Reading score` `Writing score`
##   <chr>                                <dbl>           <dbl>           <dbl>
## 1 bachelor's degree                       72              72              74
## 2 some college                            69              90              88
## 3 master's degree                         90              95              93
## 4 associate's degree                      47              57              44
## 5 some college                            76              78              75
## 6 associate's degree                      71              83              78

Library readxl digunakan untuk mengimpor data dari file Excel bernama Students Performance in Exams ke dalam objek bernama data.

2.3 Buat Data Frame

data_df = as.data.frame(data)
head(data_df)

##   Parental level of education Math score Reading score Writing score
## 1           bachelor's degree         72            72            74
## 2                some college         69            90            88
## 3             master's degree         90            95            93
## 4          associate's degree         47            57            44
## 5                some college         76            78            75
## 6          associate's degree         71            83            78

Setelah data dimuat ke objek data, data tersebut kemudian diubah menjadi format data frame untuk mempermudah operasi data.

2.4 Data Frame Variabel Dependen

dependen = data_df[,c("Math score","Reading score","Writing score")]
head(dependen)

##   Math score Reading score Writing score
## 1         72            72            74
## 2         69            90            88
## 3         90            95            93
## 4         47            57            44
## 5         76            78            75
## 6         71            83            78

Membuat objek baru bernama dependen yang hanya berisi kolom Math score, Reading score, dan Writing score dari data frame utama.

2.5 Statistika Deskriptif

summary(dependen)

Fungsi summary() secara otomatis menghasilkan 5 angka statistik deskriptif (nilai minimum, kuartil 1, kuartil 2, kuartil 3, dan nilai maksimum) serta nilai rata-rata.

2.6 Uji Asumsi Normalitas

2.6.1 Q-Q Plot

Q-Q Plot Math Score

qqnorm(data_df$`Math score`, main = "Q-Q Plot - Math Score") 
qqline(data_df$`Math score`, col = "black", lwd = 2)

Q-Q Plot Reading Score

qqnorm(data_df$`Reading score`, main = "Q-Q Plot - Reading Score") 
qqline(data_df$`Reading score`, col = "black", lwd = 2)

Q-Q Plot Writing Score

qqnorm(data_df$`Writing score`, main = "Q-Q Plot - Writing Score") 
qqline(data_df$`Writing score`, col = "black", lwd = 2)

Fungsi qqnorm() digunakan untuk membuat plot dengan memplot kuantil data yang diamati terhadap kuantil teoritis dari distribusi normal standar. Selanjutnya fungsi qqline() menambahkan garis referensi diagonal pada plot tersebut. Proses ini diulang untuk setiap variabel dependen (math score, reading score, dan writing score).

2.6.2 Statistik Uji

hasil_normalitas_awal = mvn(data = dependen) 
hasil_normalitas_awal$multivariate_normality
hasil_normalitas_awal$univariate_normality

Library MVN dipakai dalam uji normalitas univariat dan multivariat. Fungsi utama mvn() digunakan untuk men-jalankan berbagai uji statistik pada variabel dependen yang kemudian disimpan dalam objek hasil_normalitas_awal. Selanjutnya ditampilkan dalam dua bentuk yaitu untuk uji normalitas multivariat dan uji normalitas univariat.

2.7 Uji Asumsi Homogenitas

ujiboxm = BoxM(data = dependen, group= data_df$`Parental level of education`) 
summary(ujiboxm)

Library MVTests digunakan untuk uji homogenitas. Fungsi BoxM yang disimpan dalam objek ujiboxm digunakan untuk mengevaluasi apakah matriks varians kovarians semua kelompok sama. Setelah itu, fungsi summary() akan menampilkan nilai statistic, derajat bebas, dan p-value untuk keputusan asumsi.

2.8 Uji MANOVA

ujimanova = manova(cbind(data$`Math score`, data$`Reading score`, 
                         data$`Writing score`)~data$`Parental level of education`, 
                   data = data_df) 
summary(ujimanova, test="Pillai")
summary(ujimanova, test="Roy")
summary(ujimanova, test="Wilks")
summary(ujimanova, test="Hotelling-Lawley")

Fungsi manova yang disimpan dalam objek ujimanova digunakan untuk membuat model. Setelah itu, fungsi summary() dijalankan 4 kali untuk mendapatkan hasil dari 4 statistik uji multivariat (Pillai’s Trace, Roy’s Largest Root, Wilk’s Lambda, Hotelling-Lawley Trace).

2.9 Uji ANOVA

summary.aov(ujimanova)

Fungsi summary.aov() menjalankan ANOVA univariat secara terpisah untuk setiap variabel dependen yang ada dalam model MANOVA.

2.10 Analisis Profil

profil <- pbg(data_df[,2:4], data_df[,1], profile.plot = FALSE)
summary(profil)

Library profiler digunakan untuk menjalankan analisis profil. Fungsi pbg() dijalankan pada data nilai dan tingkat pendidikan. Setelah itu, fungsi summary() menampilkan 3 hasil pengujian hipotesis dalam analisis profil (uji kesejajaran profil, uji keberhimpitan profil, uji kesamaan profil).

3. HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

##    Math score    Reading score   Writing score  
##  Min.   : 0.00   Min.   :17.00   Min.   :10.00  
##  1st Qu.:50.00   1st Qu.:54.75   1st Qu.:53.75  
##  Median :62.00   Median :66.50   Median :65.00  
##  Mean   :60.63   Mean   :64.56   Mean   :63.26  
##  3rd Qu.:71.00   3rd Qu.:74.25   3rd Qu.:75.00  
##  Max.   :97.00   Max.   :95.00   Max.   :93.00

Data penelitian ini menunjukkan bahwa ketiga mata pelajaran memiliki variasi dan pola yang berbeda. Nilai Membaca menunjukkan hasil tertinggi dengan rata-rata sebesar 64,54 dan nilai tengah 66, diikuti oleh Nilai Menulis dengan rata-rata 63,27 dan nilai tengah 65. Sementara itu, Nilai Matematika menjadi yang terendah dengan rata-rata 60,59 dan nilai tengah 62. Meskipun rata-rata berada dalam kisaran yang cukup baik, rentang data menunjukkan keberadaan beberapa nilai ekstrem, terutama pada Nilai Matematika yang mencatat nilai terendah 0.

3.2 Uji Asumsi Normalitas

3.2.1 Q-Q Plot Math Score

Hasil Q-Q Plot untuk Math score menunjukkan pola distribusi data yang sangat mendekati distribusi normal. Hal ini terlihat dari titik-titik data yang tersebar mengikuti garis diagonal terutama pada bagian tengah data. Meskipun terdapat sedikit penyimpangan pada ekor bagian bawah, Sebagian besar data tetap membentuk pola linier.

3.2.2 Q-Q Plot Reading Score

Hasil Q-Q Plot untuk Reading score menunjukkan pola distribusi data yang mendekati distribusi normal. Sebagian besar titik data, terutama pada area tengah hingga ekor atas terlihat dekat dengan garis diagonal. Meskipun terdapat sedikit penyimpangan pada ekor bagian bawah di mana beberapa titik data berada sedikit jauh dari garis, hal ini tidak menunjukkan pola non-linear yang ekstrem.

3.2.3 Q-Q Plot Writing Score

Hasil Q-Q Plot untuk Reading score menunjukkan pola distribusi data yang mendekati distribusi normal. Sebagian besar titik data berada di sepanjang garis diagonal terutama pada bagian tengah distribusi, yang menandakan bahwa Sebagian besar data mengikuti pola setangkup.

3.2.4 Statistik Uji

Normalitas Multivariat

H0: data berdistribusi normal multivariat
H1: data tidak berdistribusi normal multivariat
alpha = 5%

##            Test Statistic p.value     Method      MVN
## 1 Henze-Zirkler     0.777   0.321 asymptotic ✓ Normal

Keputusan: p-value (0,354) > alpha (0,05) maka gagal tolak
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa data berdistribusi normal multivariat.

Normal Univariat

H0: data berdistribusi normal univariat
H1: data tidak berdistribusi normal univariat
alpha = 5%

##               Test      Variable Statistic p.value Normality
## 1 Anderson-Darling    Math score     0.486   0.221  ✓ Normal
## 2 Anderson-Darling Reading score     0.536   0.166  ✓ Normal
## 3 Anderson-Darling Writing score     0.537   0.165  ✓ Normal

Keputusan: Ketiga p-value > alpha (0,05) maka gagal tolak
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa data berdistribusi normal multivariat.

3.3 Uji Homogenitas

H0: Asumsi homogenitas terpenuhi
H1: Asumsi homogenitas tidak terpenuhi
alpha = 5%

##        Box's M Test 
## 
## Chi-Squared Value = 36.21199 , df = 30  and p-value: 0.201

Keputusan: p-value (0,237) > alpha (0,05) maka gagal tolak H0
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa matriks varians-kovarians data homogen untuk setiap perlakuan sehingga asumsi homogenitas terpenuhi.

3.4 Uji MANOVA

H0: Tidak terdapat perbedaan pada rata-rata vektor variabel dependen di antara semua kelompok.
H1: Terdapat perbedaan pada rata-rata vektor variabel dependen di antara semua kelompok.
alpha = 5%

##                                    Df  Pillai approx F num Df den Df Pr(>F)
## data$`Parental level of education`  5 0.18129   1.2091     15    282 0.2638
## Residuals                          94

##                                    Df     Roy approx F num Df den Df   Pr(>F)
## data$`Parental level of education`  5 0.17539   3.2974      5     94 0.008681
## Residuals                          94                                        
##                                      
## data$`Parental level of education` **
## Residuals                            
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

##                                    Df   Wilks approx F num Df den Df Pr(>F)
## data$`Parental level of education`  5 0.82369   1.2344     15 254.37  0.246
## Residuals                          94

##                                    Df Hotelling-Lawley approx F num Df den Df
## data$`Parental level of education`  5          0.20805   1.2576     15    272
## Residuals                          94                                        
##                                    Pr(>F)
## data$`Parental level of education` 0.2291
## Residuals

Berdasarkan hasil uji MANOVA dengan tingkat kepercayaan 95%, tiga statistik uji multivariat yaitu Pillai’s Trace, Wilks’ Lambda, dan Hotelling-Lawley Trace menunjukkan bahwa tingkat pendidikan orang tua tidak berpengaruh signifikan secara multivariat terhadap nilai ujian matematika, membaca, dan menulis. Namun, uji Roy’s Largest Root menunjukkan hasil yang berbeda sehingga perlu dilakukan uji lebih lanjut untuk mengetahui secara pasti apakah tingkat pendidikan orang tua berpengaruh signifikan secara multivariat terhadap nilai ujian matematika, membaca, dan menulis atau tidak.

3.5 Uji ANOVA

H0: Tidak terdapat perbedaan pada rata-rata vektor variabel dependen ke-i di antara semua kelompok.
H1: Terdapat perbedaan pada rata-rata vektor variabel dependen ke-i di antara semua kelompok.
alpha = 5%

##  Response 1 :
##                                    Df  Sum Sq Mean Sq F value  Pr(>F)  
## data$`Parental level of education`  5  2482.3  496.45   2.044 0.07948 .
## Residuals                          94 22831.1  242.88                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response 2 :
##                                    Df  Sum Sq Mean Sq F value Pr(>F)
## data$`Parental level of education`  5  1714.1  342.82  1.3923 0.2342
## Residuals                          94 23144.6  246.22               
## 
##  Response 3 :
##                                    Df  Sum Sq Mean Sq F value  Pr(>F)  
## data$`Parental level of education`  5  2779.7  555.95  2.1184 0.06991 .
## Residuals                          94 24669.5  262.44                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat cukup bukti untuk mengatakan bahwa tingkat pendidikan orang tua berpengaruh signifikan secara univariat terhadap nilai ujian matematika, membaca, dan menulis.

3.6 Analisis Profil

## Call:
## pbg(data = data_df[, 2:4], group = data_df[, 1], profile.plot = FALSE)
## 
## Hypothesis Tests:
## $`Ho: Profiles are parallel`
##   Multivariate.Test Statistic Approx.F num.df den.df    p.value
## 1             Wilks 0.8928236 1.084760     10    186 0.37591409
## 2            Pillai 0.1083226 1.076539     10    188 0.38225632
## 3  Hotelling-Lawley 0.1187583 1.092576     10    184 0.36995384
## 4               Roy 0.1067297 2.006518      5     94 0.08475139
## 
## $`Ho: Profiles have equal levels`
##             Df Sum Sq Mean Sq F value Pr(>F)  
## group        5   2279   455.8   1.941 0.0948 .
## Residuals   94  22071   234.8                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $`Ho: Profiles are flat`
##          F df1 df2      p-value
## 1 14.01747   2  93 4.776475e-06

3.6.1 Uji Kesejajaran Profil

H0: Profil antar kelompok sejajar (memiliki bentuk yang sama).
H1: Profil antar kelompok tidak sejajar (memiliki bentuk yang berbeda).
alpha = 5%

Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat perbedaan signifikan antara

3.6.2 Uji Keberhimpitan Profil

H0: Profil yang sejajar berhimpit (memiliki ketinggian yang sama).
H1: Profil yang sejajar tidak berhimpit (memiliki ketinggian yang berbeda).
alpha = 5%

Keputusan: P-value (0,0948) > alpha (0,05) maka gagal tolak H0
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat perbedaan signifikan antara profil kelompok. Artinya, pengaruh tingkat pendidikan orang tua pada nilai ujian matematika, membaca, dan menulis siswa menghasilkan rata-rata nilai yang sama.

3.6.3 Uji Kesamaan Profil

H0: Rata-rata dari semua variabel dependen dalam satu profil sama.
H1: Rata-rata dari semua variabel dependen dalam satu profil berbeda.
alpha = 5%

Keputusan: P-value (0,0000048) < alpha (0,05) maka tolak H0
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa terdapat indikasi pengaruh yang signifikan antara tingkat pendidikan orang tua terhadap nilai ujian matematika, membaca, dan menulis siswa.

4. KESIMPULAN DAN SARAN

4.1 Kesimpulan

Berdasarkan hasil analisis MANOVA, tidak ditemukan pengaruh signifikan tingkat pendidikan orang tua terhadap ketiga nilai akademik siswa secara simultan, sehingga tujuan pertama menunjukkan bahwa perbedaan kelompok tidak cukup kuat memengaruhi kombinasi nilai Matematika, Membaca, dan Menulis. Hasil ANOVA yang juga menerima H0 pada masing-masing mata pelajaran mengonfirmasi bahwa rata-rata nilai akademik secara individual tidak berbeda signifikan antar tingkat pendidikan orang tua, sehingga tujuan kedua mengarah pada kesimpulan bahwa perbedaan pendidikan orang tua tidak menghasilkan perubahan rata-rata yang berarti pada masing-masing skor. Selanjutnya, hasil uji kesejajaran dan keberhimpitan profil yang turut menerima H0 menunjukkan bahwa pola umum hubungan antar nilai akademik serupa di semua kelompok, baik dari segi arah maupun kemiringan profil. Namun, uji kesamaan profil menolak H0, yang berarti meskipun pola hubungan antar skor serupa, terdapat perbedaan level keseluruhan nilai antar kelompok. Dengan demikian, tujuan ketiga menunjukkan bahwa profil nilai memiliki bentuk yang sama tetapi berada pada level yang berbeda, sehingga secara struktural kelompok tidak identik sepenuhnya.

4.2 Saran

Meskipun tingkat pendidikan orang tua tidak terbukti berpengaruh signifikan terhadap nilai akademik siswa, penelitian ini tetap menunjukkan adanya perbedaan level profil antar kelompok, sehingga disarankan agar sekolah dan pemangku kebijakan lebih fokus pada faktor lain yang lebih langsung memengaruhi capaian belajar, seperti kualitas proses pembelajaran, akses bimbingan belajar, serta dukungan belajar di rumah. Penelitian selanjutnya disarankan untuk mempertimbangkan variabel tambahan seperti motivasi siswa, lingkungan belajar, atau status sosial ekonomi untuk memperoleh gambaran yang lebih komprehensif terkait faktor yang memengaruhi prestasi multidimensi. Selain itu, disarankan menggunakan ukuran sampel yang lebih besar atau melakukan segmentasi kelompok yang lebih detail agar variasi yang lebih halus dapat terdeteksi. Terakhir, penggunaan metode multivariat lainnya seperti analisis diskriminan atau SEM juga bisa dipertimbangkan untuk memperluas pemahaman mengenai hubungan antar variabel akademik dan faktor keluarga.

DAFTAR PUSTAKA

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2020). Multivariate Data Analysis (8th Edition).

Rencher, A. C., & Christensen, W. F. (2020). Methods of Multivariate Analysis (3rd Edition).

Stevens, J. P., & Zito, W. (2021). Applied Multivariate Statistics for the Social Sciences.