1 PENDAHULUAN
1.1 Latar Belakang
Pendidikan adalah salah satu faktor penting yang mempengaruhi perkembangan dan kemajuan suatu bangsa. Karena itulah, terus dilakukan penelitian tentang aspek yang mempengaruhi kemajuan pendidikan. Salah satu aspek yang berpotensi besar dalam tingkat pendidikan siswa adalah aspek tingkat pendidikan orang tua. Tingkat pendidikan orang tua dapat mempengaruhi berbagai aspek dalam kehidupan siswa, termasuk sikap mereka terhadap pendidikan, akses ke sumber belajar, dan dukungan akademik. Orang tua yang memiliki tingkat pendidikan lebih tinggi cenderung memiliki pemahaman yang lebih baik tentang pentingnya pendidikan dan lebih mampu memberikan dukungan dan bimbingan akademik kepada siswa. Meskipun telah ada banyak penelitian yang dilakukan pada topik ini, masih diperlukan penelitian lebih lanjut untuk memahami apakah tingkat pendidikan orang tua mempengaruhi secara nyata prestasi akademik siswa dalam 3 hal, yaitu nilai matematika, kemampuan menulis, dan kemampuan membaca. Penelitian ini dapat membantu pendidik dan pembuat kebijakan untuk merancang program yang dapat mendukung kemajuan pendidikan.
Prestasi akademik siswa tidak bisa dilihat dari satu parameter keluaran saja karena tentunya kemampuan siswa tidak akan sama di semua bidang. Pada penelitian ini dibatasi 3 parameter yang menjadi indeks prestasi akademik siswa, yaitu nilai matematika, kemampuan membaca, dan kemampuan menulis. Oleh karena variabel respon yang akan dianalisis lebih dari satu, dilakukan penelitian dengan analisis multivariat. Salah satu analisis multivariat yang paling cocok untuk penelitian ini adalah MANOVA. Dalam analisis ini nantinya dapat diketahui apakah ada perbedaan prestasi akademik siswa pada tingkat pendidikan orang tua yang berbeda-beda.
1.2 Tujuan
- Memahami langkah-langkah analisis dengan MANOVA menggunakan program Rstudio.
- Menganalisis pengaruh perlakuan tingkat pendidikan orang tua terhadap nilai matematika, kemampuan membaca, dan kemampuan menulis siswa.
2 TINJAUAN PUSTAKA
2.1 MANOVA
MANOVA (Multivariate Analysis of Variance) adalah adalah teknik statistika yang digunakan untuk membandingkan rata-rata grup yang memiliki variabel terikat lebih dari satu (Hair, 2002). MANOVA adalah perluasan dari ANOVA untuk kondisi dimana terdapat beberapa variabel terikat/respon. Perbedaan antara ANOVA dan MANOVA terletak pada jumlah variabel dependennya. MANOVA memiliki kemiripan asumsi dengan ANOVA tetapi diperluas untuk kasus multivariat. Dapat diambil kesimpulan bahwa tujuan dari MANOVA adalah untuk menguji apakah vektor rerata dua atau lebih grup sampel diambil dari sampel distribusi yang sama. Berdasar Tanty (2010), model MANOVA satu arah adalah sebagai berikut.
\[ X_{ij}=\mu+\tau_{ik}+\epsilon{ijk}\\ i=1,2,...,t; \ \ j=1,2,...,n_i;\ \ k=1,2,...,p \]
Keterangan :
\(X_{ijk}\) : nilai pengamatan respon ke-k, ulangan ke-j yang memperoleh perlakuan ke-i
t :banyak perlakuan
p :banyak respon
\(n_i\) :banyak ulangan yang memperoleh perlakuan ke-i
\(\mu_k\) :nilai rata-rata yang sesungguhnya dari respon ke-k
\(\tau_{ik}\):pengaruh dari perlakuan ke-i terhadap respon ke-k
\(\epsilon{ijk}\):pengaruh galat yang muncul pada pengukuran \(X_{ijk}\)
Statistik Uji
Terdapat beberapa statistik uji MANOVA, yaitu Wilks’ Lambda, Pillai, Lawley-Hotteling, dan Roy’s Largest Root (Sutrisno dan Wulandari, 2018). Meskipun terdapat beberapa metode, tetapi biasanya keempat statistik uji tersebut menghasilkan kesimpulan yang sama.Salah satu statistik uji yang bisa digunakan untuk menguji hipotesis adalah uji Wilks’ Lambda (\(\Lambda\)-Wilks) yang digunakan jika terdapat dua atau lebih kelompok variabel prediktor dan asumsi homogenitas varian-kovarian terpenuhi dengan rumus sebagai berikut (Irwan & Sauddin, 2021).
\[ \Lambda^*=\frac{|\textbf{W}|}{|\textbf{B}+\textbf{W}|}=\frac{|\sum_{i=1}^n \sum_{j=1}^m (x_{ij}-\overline{x_{i}})(x_{ij}-\overline{x_{i}})'|}{|\sum_{i=1}^n \sum_{j=1}^m(x_{ij}-\overline{x})(x_{ij}-\overline{x})'|}\\ Atau\ dengan\ definisi:\\ \textbf{W}:Matriks\ varian-kovarian\ perlakuan\ pada\ MANOVA\\ \textbf{B}:Matriks\ varian-kovarian\ error\ pada\ MANOVA \]
Statistik uji ini mendekati sebaran t dimana jika \((\frac{\sum n_i-p-1}{p})(\frac{1-\sqrt{\Lambda^*}}{\sqrt{\Lambda^*}})\) lebih besar dari \(F_{Input}\) maka \(H_0\) ditolak yang berarti terdapat perbedaan rata-rata antar kelompok.
Statistik uji lain selain Wilks’ Lambda dijabarkan sebagai berikut (Purnomo dkk., 2021).
Pillai : paling cocok digunakan jika asumsi homogenitas matriks varian-kovarian tidak dipenuhi, ukuran sampel kecil, dan hasil pengujian bertentangan satu sama lain. \[ P=tr\frac{|\textbf{B}|}{|\textbf{B}+\textbf{W}|} \]
Lawley-Hotteling : cocok digunakan jika hanya terdapat dua kelompok variabel prediktor. \[ T=tr(\textbf{W})^{-1}(\textbf{B}) \]
Roy’s Largest Root : hanya digunakan jika asumsi homogenitas varian-kovarian dipenuhi. \[ R=akar\ karakter\ maksimum\ (nilai\ eigen\ terbesar)\ dari\ (\textbf{W})^{-1}(\textbf{B}) \]
Jika dari hasil statistik uji didapatkan bahwa variabel prediktor berpengaruh signifikan terhadap variabel respon, perlu dilakukan uji lanjut dengan analisis profil untuk memahami perbedaan pola karakteristik antara kelompok atau kategori.
2.2 Uji Asumsi
Uji asumsi normalitas Tujuan dari uji normalitas adalah untuk mengetahui apakah distribusi satu unit data mengikuti atau mendekati distribusi normal. Yang diharapkan adalah data yang mempunyai pola seperti distribusi normal. Uji yang bisa digunakan untuk menguji normalitas multivariat, diantaranya uji Mardia, Henze-Zirkler, Royston, Anderson-Darling, dan lain sebagainya. Selain itu, pengujian normalitas juga dapat dilakukan dengan membuat Q-Q plot.
Uji asumsi homogenitas matriks ragam peragam Kesamaan matriks varian-kovarian antargrup variabel respon dapat dikatakan sebagai homoskedastisitas data. Namun jika matriks varian-kovarian antargrup variabel tidak sama, dapat dikatakan bahwa terjadi heteroskedastisitas. Pengujian persyaratan homokedastisitas data dapat menggunakan koefisien Box’s M. Menurut Rencher (2002), uji Box’s M merupakan perluasan dari uji Bartlett. Rumusan untuk menguji homogenitas matriks ragam peragam adalah sebagai berikut.
\[ MC^{-1}=(\sum_{i=1}^g(n_i-1)\ ln|S|-\sum_{i=1}^g(n_i-1)\ ln|S_i|)(1-\frac{2p^2+3p-1}{6(p+1)(g-1)}(\sum_{i=1}^g\frac{1}{n_i-1}-\frac{1}{\sum_{i=1}^g(n_i-1)}))\ \sim\ \chi^2_{(\frac{1}{2}(g-1)p(p+1))} \]
- Asumsi lain Menurut Purnomo dkk. (2021), selain dua asumsi tersebut, terdapat beberapa asumsi lain yang perlu dipenuhi, yaitu :
Terdapat beberapa variabel respon yang seluruh variabelnya kontinu dan satu/dua variabel prediktor berupa kategorik.
Terdapat linieritas di antara variabel prediktor.
Tidak ada multikolinearitas di antara variabel.
Adanya independensi agar perlakuan yang diberikan kepada setiap sampel independen antara satu dengan lainnya.
Sampel acak.
3 DATA (Analisis dan Variabel yang digunakan)
Data yang digunakan bersumber dari website kaggle. Diambil 395 sampel data dari 1000 data yang disediakan. Pada data ini akan dianalisis apakah tingkat pendidikan orang tua berpengaruh terhadap nilai matematika, kemampuan membaca, dan kemampuan menulis siswa. Pemilihan MANOVA sebagai metode analisis yang diterapkan pada data ini didasarkan pada jumlah variabel respon yang lebih dari satu, yaitu 3 variabel (nilai matematika, kemampuan membaca, dan kemampuan menulis), dengan 1 variabel prediktor (tingkat pendidikan orang tua) sebagai perlakuan.
Variabel Prediktor (Perlakuan) Data Nilai Siswa adalah tingkat pendidikan orang tua dengan kategori :
1 : High School (SMA)
2 : Bachelor’s Degree (S1)
3 : Master’s Degree (S2)
Variabel Respon Data Nilai Siswa adalah :
\(Y_1\) : Nilai matematika siswa
\(Y_2\) : Nilai kemampuan membaca siswa
\(Y_3\) : Nilai kemampuan menulis siswa
Sumber Data : https://www.kaggle.com/datasets/rkiattisak/student-performance-in-mathematics
4 SOURCE CODE
4.1 Library
> library(utils)
> library(MVN)
> library(MVTests)4.2 Input Data
> pro <- read.csv("C:/Users/Stray/Downloads/Nilai_Siswa.csv")
> str(pro)
'data.frame': 395 obs. of 4 variables:
$ Parental_Educ: int 2 3 2 3 3 1 1 1 1 3 ...
$ Math : int 57 53 76 55 56 87 66 58 69 32 ...
$ Writing : int 69 50 74 54 46 92 66 52 78 35 ...
$ Reading : int 77 49 76 52 43 81 62 51 75 37 ...
> knitr::kable(head(pro))| Parental_Educ | Math | Writing | Reading |
|---|---|---|---|
| 2 | 57 | 69 | 77 |
| 3 | 53 | 50 | 49 |
| 2 | 76 | 74 | 76 |
| 3 | 55 | 54 | 52 |
| 3 | 56 | 46 | 43 |
| 1 | 87 | 92 | 81 |
4.3 Variabel Prediktor dan Variabel Respon
> y1 <- as.matrix(pro$Math, ncol=1)
>
> y2 <- as.matrix(pro$Writing, ncol=1)
>
> y3 <- as.matrix(pro$Reading, ncol=1)
>
> Perlakuan <- as.matrix(pro$Parental_Educ, ncol=1)
>
> pro_fix <- data.frame(Perlakuan,y1,y2,y3)
> knitr::kable(head(pro_fix))| Perlakuan | y1 | y2 | y3 |
|---|---|---|---|
| 2 | 57 | 69 | 77 |
| 3 | 53 | 50 | 49 |
| 2 | 76 | 74 | 76 |
| 3 | 55 | 54 | 52 |
| 3 | 56 | 46 | 43 |
| 1 | 87 | 92 | 81 |
4.4 Asumsi Normalitas Multivariat
> norm.test = mvn(data = pro, subset = "Parental_Educ", mvnTest = "mardia")
> norm.test$multivariateNormality
$`1`
Test Statistic p value Result
1 Mardia Skewness 11.2620629596415 0.337468770197553 YES
2 Mardia Kurtosis -0.825872100387117 0.408876648567348 YES
3 MVN <NA> <NA> YES
$`2`
Test Statistic p value Result
1 Mardia Skewness 10.4610160355741 0.401018870889612 YES
2 Mardia Kurtosis -1.4650268691766 0.142913587162661 YES
3 MVN <NA> <NA> YES
$`3`
Test Statistic p value Result
1 Mardia Skewness 10.1918631486162 0.423824909025163 YES
2 Mardia Kurtosis -1.349113495884 0.177300514023913 YES
3 MVN <NA> <NA> YES4.5 Asumsi Homogenitas Matriks Ragam Peragam
> ujiboxm<-BoxM(data = pro[,2:4], pro$Parental_Educ)
> summary(ujiboxm)
Box's M Test
Chi-Squared Value = 12.29528 , df = 12 and p-value: 0.422 4.6 Pengujian MANOVA
> ujimanova <- manova(cbind(y1,y2,y3)~Perlakuan,data=pro_fix)
> summary(ujimanova, test="Pillai")
Df Pillai approx F num Df den Df Pr(>F)
Perlakuan 1 0.06919 9.6881 3 391 3.51e-06 ***
Residuals 393
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(ujimanova, test="Roy")
Df Roy approx F num Df den Df Pr(>F)
Perlakuan 1 0.074333 9.6881 3 391 3.51e-06 ***
Residuals 393
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(ujimanova, test="Wilks")
Df Wilks approx F num Df den Df Pr(>F)
Perlakuan 1 0.93081 9.6881 3 391 3.51e-06 ***
Residuals 393
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(ujimanova, test="Hotelling-Lawley")
Df Hotelling-Lawley approx F num Df den Df Pr(>F)
Perlakuan 1 0.074333 9.6881 3 391 3.51e-06 ***
Residuals 393
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 14.7 Pengujian ANOVA Setiap Variabel
> summary.aov(ujimanova)
Response y1 :
Df Sum Sq Mean Sq F value Pr(>F)
Perlakuan 1 2280 2280.40 9.8657 0.001811 **
Residuals 393 90840 231.14
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Response y2 :
Df Sum Sq Mean Sq F value Pr(>F)
Perlakuan 1 588 588.02 3.0764 0.08022 .
Residuals 393 75117 191.14
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Response y3 :
Df Sum Sq Mean Sq F value Pr(>F)
Perlakuan 1 2096 2095.98 9.5679 0.002122 **
Residuals 393 86092 219.06
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 15 HASIL DAN INTERPRETASI
5.1 Uji Asumsi Normalitas Multivariat
\[
>Hipotesis< \\
H_0:Data\ berdistribusi\ normal\ multivariat\\
H_1 :Data\ tidak\ berdistribusi\ normal\ multivariat\\
.\\
>Keputusan< \\
p-value > \alpha\ (0,05)\ \ ,Terima\ H_0
\]
Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa data berdistribusi normal multivariat untuk setiap perlakuan (asumsi normalitas terpenuhi) dan hasil MANOVA dapat diandalkan.
5.2 Uji Asumsi Homogenitas Matriks Ragam Peragam
\[ >Hipotesis< \\ H_0:Matriks\ ragam\ peragam\ homogen\\ H_1 :Matriks\ ragam\ peragam\ tidak\ homogen\\ .\\ >Keputusan< \\ p-value\ (0,422) > \alpha\ (0,05)\ \ ,Terima\ H_0 \] ’
Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa matriks ragam peragam homogen (asumsi homogenitas terpenuhi) dan hasil MANOVA dapat diandalkan.
5.3 Pengujian MANOVA
\[
>Hipotesis< \\
H_0:\mu_1=\mu_2=...=\mu_3 \\
H_1:Paling\ tidak\ ada\ satu\ pasang\ berbeda\ \mu_{ij} \neq \mu_{kl}\
untuk\ ij \neq kl\\
.\\
>Keputusan< \\
p-value\ (3,51 \times 10^{-6}) < \alpha\ (0,05)\ \ ,Tolak\ H_0
\]
Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa tingkat pendidikan orang tua berpengaruh signifikan secara multivariat terhadap nilai matematika, kemampuan membaca, dan kemampuan menulis siswa.
5.4 Pengujian ANOVA Setiap Variabel
\[
>Hipotesis< \\
H_0:\mu_1=\mu_2=\mu_3 \\
H_1:Paling\ tidak\ ada\ satu\ \mu_i\ yang\ berbeda,\ i=1,2,3\\
.\\
>Keputusan< \\
Untuk\ y_1\ dan\ y_3\\
p-value < \alpha\ (0,05)\ \ ,Tolak\ H_0\\
.\\
Untuk\ y_2\\
p-value > \alpha\ (0,05)\ \ ,Terima\ H_0
\]
Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa tingkat pendidikan orang tua berpengaruh signifikan secara univariat terhadap nilai matematika dan kemampuan menulis siswa, tetapi tidak berpengaruh signifikan secara univariat terhadap kemampuan membaca siswa.
6 KESIMPULAN
Kesimpulan yang didapatkan dari hasil analisis di atas, diantaranya :
Terdapat beberapa asumsi yang harus dilakukan dan dipenuhi sebelum dilakukan pengujian MANOVA untuk memastikan bahwa hasil MANOVA valid dan tidak bias.
Secara multivariat, dapat disimpulkan bahwa tingkat pendidikan orang tua memberikan pengaruh signifikan terhadap nilai matematika, kemampuan membaca, dan kemampuan menulis siswa.
Secara univariat, dapat disimpulkan bahwa tingkat pendidikan orang tua memberikan pengaruh signifikan terhadap nilai matematika dan kemampuan menulis siswa, tetapi tidak memberikan pengaruh signifikan terhadap kemampuan membaca siswa.
Karena hasil MANOVA menunjukkan adanya pengaruh signifikan, perlu dilakukan uji lanjut dengan analisis profil untuk memahami pola karakteristik antara kelompok.
7 DAFTAR PUSTAKA
Hair, Joseph F. (2002). Multivariate Data Analysis 5th Edition. New Jersey: Prentice Hall.
Irwan, & Sauddin, A. (2021). Statistika Multivariat. Gowa: Alauddin University Press.
Purnomo, Sutadji, E., Utomo, W., Purnawirawan, O., Farich, R., Sulistianingsih,Fajarwati, R., Carina, A., & Gilang, N. (2021). Analisis Data Multivariat. Banyumas: Omera Pustaka.
Rencher, AR. (2002). Methods of Multivariate Analysis Second Edition. New York: John Wiley & Sons, Inc.
Sutrisno, S., & Wulandari, D. (2018). Multivariate analysis of variance (MANOVA) untuk memperkaya hasil penelitian pendidikan. AKSIOMA: Jurnal Matematika Dan Pendidikan Matematika, 9(1), 37-53.
Tanty, H. (2010). Kandungan Zat Kimia Anorganik Pada Beberapa Proses Filtrasi Air Minum Kemasan dan Isi Ulang Menggunakan One-Way Manova. ComTech: Computer, Mathematics and Engineering Applications, 1(1), 48-60.