Prestasi akademik siswa dipengaruhi oleh beberapa faktor, mulai dari lingkungan sekolah, kondisi psikologis, serta latar belakang keluarga. Pada latar belakang keluarga, salah satu aspek yang sering diteliti adalah tingkat pendidikan orang tua yang berperan dalam memberikan dukungan belajar, kualitas pendidikan, serta ekspektasi akademik anak. Beragam penelitian telah menunjukkan bahwa orang tua yang memiliki pendidikan lebih tinggi cenderung memiliki pengetahuan dan sumber daya yang lebih baik dalam mendukung perkembangan akademik anak. Sebagai contoh, studi oleh Agustina (2024) menunjukkan bahwa pendidikan orang tua berpengaruh positif dengan hasil belajar siswa SD di Indonesia. Selain itu, meta-analisis internasional menunjukkan bahwa latar belakang pendidikan orang tua berpengaruh signifikan dengan prestasi matematika dan literasi siswa (Huang et al., 2024).
Namun, sebagian besar penelitian hanya menganalisis satu mata pelajaran secara terpisah, padahal prestasi akademik adalah suatu kontruksi multivariat. Oleh karena itu, diperlukan analisis yang mempertimbangkan tiga skor akademik secara simultan (Matematika, Membaca, dan Menulis) untuk menganalisis apakah tingkat pendidikan orang tua memiliki pengaruh signifikan terhadap tiga skor akademik tersebut secara bersama-sama.
Penelitian ini menggunakan 100 data siswa dari dataset “Students Performance in Exams” yang tersedia pada platform Kaggle. Dalam penelitian ini digunakan variabel:
Variabel Independen (X):
Parental Level of Education
Variabel Dependen (Y):
Math Score (Y1)
Reading Score (Y2)
Writing Score (Y3)
Berikut adalah sebagian data yang digunakan:
| X | Y1 | Y2 | Y3 |
|---|---|---|---|
| Bachelor’s degree | 72 | 72 | 74 |
| Some college | 69 | 90 | 88 |
| Master’s degree | 90 | 95 | 93 |
| Associate’s degree | 47 | 57 | 44 |
| Some college | 76 | 78 | 75 |
| Associate’s degree | 71 | 83 | 78 |
| Some college | 88 | 95 | 92 |
| Some college | 40 | 43 | 39 |
| High school | 64 | 64 | 67 |
| High school | 38 | 60 | 50 |
Multivariate Analysis of Variance (MANOVA) merupakan pengembangan dari ANOVA yang memungkinkan pengujian pengaruh faktor tertentu terhadap beberapa variabel debenden secara simultan. Pendekatan ini penting digunakan saat variabel dependen saling berkaitan, sehingga analisis univariat saja dapat menghasilkan interpretasi yang tidak tepat. Dengan menggunakan MANOVA, peneliti dapat menguji apakah terdapat perbedaan profil multivariat di antara kelompok-kelompok, serta menganalisis dampak faktor independen dengan lebih komprehensif. Dalam penelitian ini, MANOVA digunakan untuk menguji apakah pendidikan orang tua berpengaruh signifikan terhadap tiga skor akademik siswa secara bersama-sama.
Multivariate Analysis of Variance (MANOVA) adalah metode statistik yang digunakan untuk menguji perbedaan rata-rata secara bersamaan pada beberapa variabel dependen, dengan memperhitungkan hubungan antara komponen respons. MANOVA dianggap sebagai perluasan langsung dari ANOVA sehingga dapat mengurangi risiko kesalahan Tipe I yang meningkat saat lebih dari satu variabel dependen dianalisis secara bersamaan.
Buku-buku statistik multivariat terkini mengungkapkan bahwa model MANOVA secara matematis dituliskan dalam bentuk matriks Y=XB+E, yang memungkinkan pemecahan matriks SSCP (H dan E) sebagai dasar untuk perhitungan statistik omnibus seperti Wilks’ Lambda, Pillai’s Trace, Hotelling–Lawley, dan Roy’s Largest Root
Untuk melakukan uji MANOVA, asumsi normalitas residual, homogenitas matriks kovarians, serta independensi perlu dipenuhi. Pelanggaran terhadap ketiga asumsi ini dapat mempengaruhi validitas hasil, sehingga literatur terbaru merekomendasikan penggunaan statistik yang lebih robust seperti Pillai’s Trace dalam kondisi data yang kurang ideal. Dalam konteks riset pendidikan, MANOVA sangat penting untuk menganalisis dampak variabel kategori seperti tingkat pendidikan orang tua terhadap beberapa skor pencapaian belajar (misalnya Matematika, Membaca, dan Menulis) secara bersamaan, sehingga memberikan pemahaman hubungan yang lebih mendalam dibandingkan metode univariat terpisah
Dalam penelitian di bidang pendidikan, variabel keluarga seperti pendidikan orang tua seringkali berdampak pada berbagai bidang akademis secara bersamaan. Oleh sebab itu, penerapan MANOVA untuk menguji efek simultan pada nilai ujian siswa di bidang Matematika, Membaca, dan Menulis bertujuan untuk memberikan pemahaman yang lebih menyeluruh dibandingkan dengan pengujian terpisah. Tinjauan meta dan penelitian empiris mengenai dampak latar belakang keluarga mendukung pentingnya pendekatan multivariat dalam konteks pendidikan
Menganalisis apakah tingkat pendidikan orang tua berpengaruh secara signifikan terhadap tiga nilai akademik siswa secara simultan.
Mengidentifikasi perbedaan rata-rata nilai akademik berdasarkan tingkat pendidikan orang tua.
Menilai pola perbedaan profil nilai akademik antar kelompok tingkat pendidikan orang tua.
Berikut merupakan library yang diperlukan, yaitu:
library(readxl)
library(ggplot2)
library(MVN)
library(MVTests)
library(profileR)
Kegunaan library:
data <- read_excel("D:/SEMESTER 5/ANMUL/PROJECT/Students Performance in Exams.xlsx")
head(data)
## # A tibble: 6 × 4
## `Parental level of education` `Math score` `Reading score` `Writing score`
## <chr> <dbl> <dbl> <dbl>
## 1 bachelor's degree 72 72 74
## 2 some college 69 90 88
## 3 master's degree 90 95 93
## 4 associate's degree 47 57 44
## 5 some college 76 78 75
## 6 associate's degree 71 83 78
Library readxl digunakan untuk mengimpor data dari file Excel bernama Students Performance in Exams ke dalam objek bernama data.
data_df = as.data.frame(data)
head(data_df)
## Parental level of education Math score Reading score Writing score
## 1 bachelor's degree 72 72 74
## 2 some college 69 90 88
## 3 master's degree 90 95 93
## 4 associate's degree 47 57 44
## 5 some college 76 78 75
## 6 associate's degree 71 83 78
Setelah data dimuat ke objek data, data tersebut kemudian diubah menjadi format data frame untuk mempermudah operasi data.
dependen = data_df[,c("Math score","Reading score","Writing score")]
head(dependen)
## Math score Reading score Writing score
## 1 72 72 74
## 2 69 90 88
## 3 90 95 93
## 4 47 57 44
## 5 76 78 75
## 6 71 83 78
Membuat objek baru bernama dependen yang hanya berisi kolom Math score, Reading score, dan Writing score dari data frame utama.
summary(dependen)
Fungsi summary() secara otomatis menghasilkan 5 angka statistik deskriptif (nilai minimum, kuartil 1, kuartil 2, kuartil 3, dan nilai maksimum) serta nilai rata-rata.
qqnorm(data_df$`Math score`, main = "Q-Q Plot - Math Score")
qqline(data_df$`Math score`, col = "black", lwd = 2)
qqnorm(data_df$`Reading score`, main = "Q-Q Plot - Reading Score")
qqline(data_df$`Reading score`, col = "black", lwd = 2)
qqnorm(data_df$`Writing score`, main = "Q-Q Plot - Writing Score")
qqline(data_df$`Writing score`, col = "black", lwd = 2)
Fungsi qqnorm() digunakan untuk membuat plot dengan memplot kuantil data yang diamati terhadap kuantil teoritis dari distribusi normal standar. Selanjutnya fungsi qqline() menambahkan garis referensi diagonal pada plot tersebut. Proses ini diulang untuk setiap variabel dependen (math score, reading score, dan writing score).
hasil_normalitas_awal = mvn(data = dependen)
hasil_normalitas_awal$multivariate_normality
hasil_normalitas_awal$univariate_normality
Library MVN dipakai dalam uji normalitas univariat dan multivariat. Fungsi utama mvn() digunakan untuk men-jalankan berbagai uji statistik pada variabel dependen yang kemudian disimpan dalam objek hasil_normalitas_awal. Selanjutnya ditampilkan dalam dua bentuk yaitu untuk uji normalitas multivariat dan uji normalitas univariat.
ujiboxm = BoxM(data = dependen, group= data_df$`Parental level of education`)
summary(ujiboxm)
Library MVTests digunakan untuk uji homogenitas. Fungsi BoxM yang disimpan dalam objek ujiboxm digunakan untuk mengevaluasi apakah matriks varians kovarians semua kelompok sama. Setelah itu, fungsi summary() akan menampilkan nilai statistic, derajat bebas, dan p-value untuk keputusan asumsi.
ujimanova = manova(cbind(data$`Math score`, data$`Reading score`,
data$`Writing score`)~data$`Parental level of education`,
data = data_df)
summary(ujimanova, test="Pillai")
summary(ujimanova, test="Roy")
summary(ujimanova, test="Wilks")
summary(ujimanova, test="Hotelling-Lawley")
Fungsi manova yang disimpan dalam objek ujimanova digunakan untuk membuat model. Setelah itu, fungsi summary() dijalankan 4 kali untuk mendapatkan hasil dari 4 statistik uji multivariat (Pillai’s Trace, Roy’s Largest Root, Wilk’s Lambda, Hotelling-Lawley Trace).
summary.aov(ujimanova)
Fungsi summary.aov() menjalankan ANOVA univariat secara terpisah untuk setiap variabel dependen yang ada dalam model MANOVA.
profil <- pbg(data_df[,2:4], data_df[,1], profile.plot = FALSE)
summary(profil)
Library profiler digunakan untuk menjalankan analisis profil. Fungsi pbg() dijalankan pada data nilai dan tingkat pendidikan. Setelah itu, fungsi summary() menampilkan 3 hasil pengujian hipotesis dalam analisis profil (uji kesejajaran profil, uji keberhimpitan profil, uji kesamaan profil).
## Math score Reading score Writing score
## Min. : 0.00 Min. :17.00 Min. :10.00
## 1st Qu.:50.00 1st Qu.:54.75 1st Qu.:53.75
## Median :62.00 Median :66.50 Median :65.00
## Mean :60.63 Mean :64.56 Mean :63.26
## 3rd Qu.:71.00 3rd Qu.:74.25 3rd Qu.:75.00
## Max. :97.00 Max. :95.00 Max. :93.00
Data penelitian ini menunjukkan bahwa ketiga mata pelajaran memiliki variasi dan pola yang berbeda. Nilai Membaca menunjukkan hasil tertinggi dengan rata-rata sebesar 64,54 dan nilai tengah 66, diikuti oleh Nilai Menulis dengan rata-rata 63,27 dan nilai tengah 65. Sementara itu, Nilai Matematika menjadi yang terendah dengan rata-rata 60,59 dan nilai tengah 62. Meskipun rata-rata berada dalam kisaran yang cukup baik, rentang data menunjukkan keberadaan beberapa nilai ekstrem, terutama pada Nilai Matematika yang mencatat nilai terendah 0.
Hasil Q-Q Plot untuk Math score menunjukkan pola distribusi data yang sangat mendekati distribusi normal. Hal ini terlihat dari titik-titik data yang tersebar mengikuti garis diagonal terutama pada bagian tengah data. Meskipun terdapat sedikit penyimpangan pada ekor bagian bawah, Sebagian besar data tetap membentuk pola linier.
Hasil Q-Q Plot untuk Reading score menunjukkan pola distribusi data yang mendekati distribusi normal. Sebagian besar titik data, terutama pada area tengah hingga ekor atas terlihat dekat dengan garis diagonal. Meskipun terdapat sedikit penyimpangan pada ekor bagian bawah di mana beberapa titik data berada sedikit jauh dari garis, hal ini tidak menunjukkan pola non-linear yang ekstrem.
Hasil Q-Q Plot untuk Reading score menunjukkan pola distribusi data yang mendekati distribusi normal. Sebagian besar titik data berada di sepanjang garis diagonal terutama pada bagian tengah distribusi, yang menandakan bahwa Sebagian besar data mengikuti pola setangkup.
H0: data berdistribusi normal multivariat
H1: data tidak berdistribusi normal multivariat
alpha = 5%
## Test Statistic p.value Method MVN
## 1 Henze-Zirkler 0.777 0.321 asymptotic ✓ Normal
Keputusan: p-value (0,354) > alpha (0,05) maka gagal tolak
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa data
berdistribusi normal multivariat.
H0: data berdistribusi normal univariat
H1: data tidak berdistribusi normal univariat
alpha = 5%
## Test Variable Statistic p.value Normality
## 1 Anderson-Darling Math score 0.486 0.221 ✓ Normal
## 2 Anderson-Darling Reading score 0.536 0.166 ✓ Normal
## 3 Anderson-Darling Writing score 0.537 0.165 ✓ Normal
Keputusan: Ketiga p-value > alpha (0,05) maka gagal tolak
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa data
berdistribusi normal multivariat.
H0: Asumsi homogenitas terpenuhi
H1: Asumsi homogenitas tidak terpenuhi
alpha = 5%
## Box's M Test
##
## Chi-Squared Value = 36.21199 , df = 30 and p-value: 0.201
Keputusan: p-value (0,237) > alpha (0,05) maka gagal tolak
H0
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa
matriks varians-kovarians data homogen untuk setiap perlakuan sehingga
asumsi homogenitas terpenuhi.
H0: Tidak terdapat perbedaan pada rata-rata vektor variabel dependen
di antara semua kelompok.
H1: Terdapat perbedaan pada rata-rata vektor variabel dependen di antara
semua kelompok.
alpha = 5%
## Df Pillai approx F num Df den Df Pr(>F)
## data$`Parental level of education` 5 0.18129 1.2091 15 282 0.2638
## Residuals 94
## Df Roy approx F num Df den Df Pr(>F)
## data$`Parental level of education` 5 0.17539 3.2974 5 94 0.008681
## Residuals 94
##
## data$`Parental level of education` **
## Residuals
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Wilks approx F num Df den Df Pr(>F)
## data$`Parental level of education` 5 0.82369 1.2344 15 254.37 0.246
## Residuals 94
## Df Hotelling-Lawley approx F num Df den Df
## data$`Parental level of education` 5 0.20805 1.2576 15 272
## Residuals 94
## Pr(>F)
## data$`Parental level of education` 0.2291
## Residuals
Berdasarkan hasil uji MANOVA dengan tingkat kepercayaan 95%, tiga statistik uji multivariat yaitu Pillai’s Trace, Wilks’ Lambda, dan Hotelling-Lawley Trace menunjukkan bahwa tingkat pendidikan orang tua tidak berpengaruh signifikan secara multivariat terhadap nilai ujian matematika, membaca, dan menulis. Namun, uji Roy’s Largest Root menunjukkan hasil yang berbeda sehingga perlu dilakukan uji lebih lanjut untuk mengetahui secara pasti apakah tingkat pendidikan orang tua berpengaruh signifikan secara multivariat terhadap nilai ujian matematika, membaca, dan menulis atau tidak.
H0: Tidak terdapat perbedaan pada rata-rata vektor variabel dependen
ke-i di antara semua kelompok.
H1: Terdapat perbedaan pada rata-rata vektor variabel dependen ke-i di
antara semua kelompok.
alpha = 5%
## Response 1 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data$`Parental level of education` 5 2482.3 496.45 2.044 0.07948 .
## Residuals 94 22831.1 242.88
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Response 2 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data$`Parental level of education` 5 1714.1 342.82 1.3923 0.2342
## Residuals 94 23144.6 246.22
##
## Response 3 :
## Df Sum Sq Mean Sq F value Pr(>F)
## data$`Parental level of education` 5 2779.7 555.95 2.1184 0.06991 .
## Residuals 94 24669.5 262.44
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat cukup bukti untuk mengatakan bahwa tingkat pendidikan orang tua berpengaruh signifikan secara univariat terhadap nilai ujian matematika, membaca, dan menulis.
## Call:
## pbg(data = data_df[, 2:4], group = data_df[, 1], profile.plot = FALSE)
##
## Hypothesis Tests:
## $`Ho: Profiles are parallel`
## Multivariate.Test Statistic Approx.F num.df den.df p.value
## 1 Wilks 0.8928236 1.084760 10 186 0.37591409
## 2 Pillai 0.1083226 1.076539 10 188 0.38225632
## 3 Hotelling-Lawley 0.1187583 1.092576 10 184 0.36995384
## 4 Roy 0.1067297 2.006518 5 94 0.08475139
##
## $`Ho: Profiles have equal levels`
## Df Sum Sq Mean Sq F value Pr(>F)
## group 5 2279 455.8 1.941 0.0948 .
## Residuals 94 22071 234.8
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $`Ho: Profiles are flat`
## F df1 df2 p-value
## 1 14.01747 2 93 4.776475e-06
H0: Profil antar kelompok sejajar (memiliki bentuk yang sama).
H1: Profil antar kelompok tidak sejajar (memiliki bentuk yang
berbeda).
alpha = 5%
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat perbedaan signifikan antara
H0: Profil yang sejajar berhimpit (memiliki ketinggian yang
sama).
H1: Profil yang sejajar tidak berhimpit (memiliki ketinggian yang
berbeda).
alpha = 5%
Keputusan: P-value (0,0948) > alpha (0,05) maka gagal tolak
H0
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak
terdapat perbedaan signifikan antara profil kelompok. Artinya, pengaruh
tingkat pendidikan orang tua pada nilai ujian matematika, membaca, dan
menulis siswa menghasilkan rata-rata nilai yang sama.
H0: Rata-rata dari semua variabel dependen dalam satu profil
sama.
H1: Rata-rata dari semua variabel dependen dalam satu profil
berbeda.
alpha = 5%
Keputusan: P-value (0,0000048) < alpha (0,05) maka tolak H0
Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa
terdapat indikasi pengaruh yang signifikan antara tingkat pendidikan
orang tua terhadap nilai ujian matematika, membaca, dan menulis
siswa.
Berdasarkan hasil analisis MANOVA, tidak ditemukan pengaruh signifikan tingkat pendidikan orang tua terhadap ketiga nilai akademik siswa secara simultan, sehingga tujuan pertama menunjukkan bahwa perbedaan kelompok tidak cukup kuat memengaruhi kombinasi nilai Matematika, Membaca, dan Menulis. Hasil ANOVA yang juga menerima H0 pada masing-masing mata pelajaran mengonfirmasi bahwa rata-rata nilai akademik secara individual tidak berbeda signifikan antar tingkat pendidikan orang tua, sehingga tujuan kedua mengarah pada kesimpulan bahwa perbedaan pendidikan orang tua tidak menghasilkan perubahan rata-rata yang berarti pada masing-masing skor. Selanjutnya, hasil uji kesejajaran dan keberhimpitan profil yang turut menerima H0 menunjukkan bahwa pola umum hubungan antar nilai akademik serupa di semua kelompok, baik dari segi arah maupun kemiringan profil. Namun, uji kesamaan profil menolak H0, yang berarti meskipun pola hubungan antar skor serupa, terdapat perbedaan level keseluruhan nilai antar kelompok. Dengan demikian, tujuan ketiga menunjukkan bahwa profil nilai memiliki bentuk yang sama tetapi berada pada level yang berbeda, sehingga secara struktural kelompok tidak identik sepenuhnya.
Meskipun tingkat pendidikan orang tua tidak terbukti berpengaruh signifikan terhadap nilai akademik siswa, penelitian ini tetap menunjukkan adanya perbedaan level profil antar kelompok, sehingga disarankan agar sekolah dan pemangku kebijakan lebih fokus pada faktor lain yang lebih langsung memengaruhi capaian belajar, seperti kualitas proses pembelajaran, akses bimbingan belajar, serta dukungan belajar di rumah. Penelitian selanjutnya disarankan untuk mempertimbangkan variabel tambahan seperti motivasi siswa, lingkungan belajar, atau status sosial ekonomi untuk memperoleh gambaran yang lebih komprehensif terkait faktor yang memengaruhi prestasi multidimensi. Selain itu, disarankan menggunakan ukuran sampel yang lebih besar atau melakukan segmentasi kelompok yang lebih detail agar variasi yang lebih halus dapat terdeteksi. Terakhir, penggunaan metode multivariat lainnya seperti analisis diskriminan atau SEM juga bisa dipertimbangkan untuk memperluas pemahaman mengenai hubungan antar variabel akademik dan faktor keluarga.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E.
(2020). Multivariate Data Analysis (8th Edition).
Rencher, A. C., & Christensen, W. F. (2020). Methods of
Multivariate Analysis (3rd Edition).
Stevens, J. P., & Zito, W. (2021). Applied Multivariate Statistics for the Social Sciences.