Library :
# install.packages("readxl")
# install.packages("MVN")
# install.packages("MVTests")
Data yang digunakan dalam penelitian ini berasal dari dataset Study Score Performance, yang dapat diakses secara publik melalui situs Kaggle. Dataset ini berisi informasi mengenai nilai siswa pada tiga mata pelajaran yakni matematika, membaca, dan menulis serta berbagai karakteristik latar belakang siswa dan orang tua.
Sumber data: https://www.kaggle.com/datasets/bhavikjikadara/student-study-performance
Penelitian ini berfokus pada bagaimana performa akademik siswa diukur melalui nilai matematika, membaca, dan menulis dipengaruhi oleh tingkat pendidikan orang tua. Variabel parental level of education menjadi perhatian utama karena tingkat pendidikan orang tua sering mencerminkan kualitas dukungan belajar di rumah, akses terhadap sumber belajar, serta pola pengasuhan yang berkaitan dengan prestasi akademik. Melalui analisis ini, penelitian berupaya melihat apakah terdapat perbedaan nilai akademik siswa pada tiga mata pelajaran tersebut berdasarkan kategori tingkat pendidikan orang tua, seperti high school, some college, associate’s degree, bachelor’s degree, hingga master’s degree. Hasil analisis diharapkan dapat memberikan gambaran mengenai sejauh mana latar belakang pendidikan orang tua berkontribusi pada pencapaian belajar siswa dan apakah terdapat pola tertentu yang konsisten antar kelompok.
Dataset Study Score Performance memuat berbagai informasi mengenai karakteristik siswa, seperti gender, ethnicity, parental level of education, lunch type, dan test preparation course, serta tiga nilai akademik utama yaitu math score, reading score, dan writing score. Secara keseluruhan, dataset ini dirancang untuk membantu memahami bagaimana faktor-faktor sosial dan lingkungan belajar dapat mempengaruhi capaian akademik siswa. Meskipun dataset menyediakan beragam variabel latar belakang, penelitian ini secara khusus hanya menggunakan satu variabel independen, yaitu parental level of education, karena variabel tersebut dianggap mewakili kondisi pendidikan keluarga yang berpotensi mempengaruhi pola belajar dan dukungan akademik di rumah. Tiga variabel dependen yang dianalisis adalah math score, reading score, dan writing score. Dengan fokus pada satu variabel X, penelitian ini bertujuan melihat apakah terdapat perbedaan performa akademik siswa secara simultan berdasarkan tingkat pendidikan terakhir orang tua mereka.
Analisis varians multivariat (MANOVA) adalah perluasan dari analisis varians (ANOVA) untuk mengakomodasi lebih dari satu variabel dependen. Tujuan MANOVA adalah untuk membedakan secara maksimal antara dua atau lebih kelompok yang berbeda pada kombinasi linier variabel kuantitatif. Secara statistik MANOVA identik dengan analisis diskriminan (Hair dkk, 2019; Hahs-Vaughn, 2017; Tabachnick & Fidell, 2013). Perbedaan keduanya adalah MANOVA menekankan perbedaan rata-rata dan signifikansi statistik dari perbedaan antar kelompok. Sebaliknya, analisis diskriminan menekankan prediksi keanggotaan kelompok dan dimensi di mana kelompok berbeda. Uji asumsi yang diperlukan saat menggunakan MANOVA adalah normalitas multivariat, homogenitas dan independensi.
Sebagian besar prosedur inferensial multivariat didasarkan pada distribusi normal multivariat yang merupakan generalisasi langsung dari asumsi distribusi normal univariat. Terdapat beberapa prosedur yang diusulkan para ahli untuk menaksir normalitas multivariat. Salah satu prosedur tersebut adalah melakukan generalisasi dari uji normalitas univariat berdasarkan pada skewness (kemiringan) dan kurtosis (keruncingan) yang dikenal dengan uji Mardia.
Asumsi homogenitas matriks kovariansi lebih mudah diuji daripada normal multivariat. Untuk melakukan uji homogenitas matriks kovarian dipergunakan uji Box’s M. Pengujian Box’s M merupakan perluasan dari pengujian Bartlett. Stevens (2002), mengungkapkan bahwa uji Box’s M untuk menguji asumsi homogenitas matriks kovariansi terlalu sensitif dengan ketidaknormalan distribusi data. Oleh karena itu penting untuk mengetahui apakah data amatan memenuhi asumsi normalitas multivariat sebelum menginterpretasikan uji Box’s M. Terdapat beberapa statistik uji MANOVA yaitu Wilks Lambda, Pillai, Lawley-Hotelling, dan Roy’s Largest Root. Dalam kasus ketika keempat statistik uji menghasilkan kesimpulan yang berbeda dalam hal menerima dan menolak hipotesis, cara yang dapat dilakukan yaitu menguji nilai eigen dan matriks kovariansi serta mengevaluasi permasalahan kesimpulan dalam karakteristik statistik uji
Berikut disajikan data yang berasal dari dataset Study Score Performance.
library(readxl)
data <- read_xlsx("D:/Data Sava/Data Study Performance Anmul.xlsx")
data
## # A tibble: 1,000 × 4
## parental_level_of_education math_score reading_score writing_score
## <chr> <dbl> <dbl> <dbl>
## 1 bachelor's degree 72 72 74
## 2 some college 69 90 88
## 3 master's degree 90 95 93
## 4 associate's degree 47 57 44
## 5 some college 76 78 75
## 6 associate's degree 71 83 78
## 7 some college 88 95 92
## 8 some college 40 43 39
## 9 high school 64 64 67
## 10 high school 38 60 50
## # ℹ 990 more rows
Berikut disajikan data yang berasal dari dataset Study Score Performance dengan urutan data ke 450 hingga 550.
perlakuan <- factor(data$parental_level_of_education[100:150])
y1 <- data$math_score[100:150]
y2 <- data$reading_score[100:150]
y3 <- data$writing_score[100:150]
datafix <- data.frame(perlakuan, y1, y2, y3)
datafix
## perlakuan y1 y2 y3
## 1 bachelor's degree 65 67 62
## 2 some college 79 67 67
## 3 bachelor's degree 68 74 74
## 4 associate's degree 85 91 89
## 5 high school 60 44 47
## 6 some college 98 86 90
## 7 some college 58 67 72
## 8 master's degree 87 100 100
## 9 associate's degree 66 63 64
## 10 associate's degree 52 76 70
## 11 some high school 70 64 72
## 12 associate's degree 77 89 98
## 13 high school 62 55 49
## 14 associate's degree 54 53 47
## 15 some college 51 58 54
## 16 bachelor's degree 99 100 100
## 17 high school 84 77 74
## 18 bachelor's degree 75 85 82
## 19 bachelor's degree 78 82 79
## 20 some high school 51 63 61
## 21 some college 55 69 65
## 22 bachelor's degree 79 92 89
## 23 associate's degree 91 89 92
## 24 some college 88 93 93
## 25 high school 63 57 56
## 26 some college 83 80 73
## 27 high school 87 95 86
## 28 some high school 72 68 67
## 29 some college 65 77 74
## 30 master's degree 82 82 74
## 31 bachelor's degree 51 49 51
## 32 master's degree 89 84 82
## 33 some high school 53 37 40
## 34 some college 87 74 70
## 35 some college 75 81 84
## 36 bachelor's degree 74 79 75
## 37 bachelor's degree 58 55 48
## 38 some high school 51 54 41
## 39 high school 70 55 56
## 40 associate's degree 59 66 67
## 41 some college 71 61 69
## 42 some high school 76 72 71
## 43 some college 59 62 64
## 44 some college 42 55 54
## 45 high school 57 43 47
## 46 some college 88 73 78
## 47 some college 22 39 33
## 48 some high school 88 84 75
## 49 associate's degree 73 68 66
## 50 bachelor's degree 68 75 81
## 51 associate's degree 100 100 93
Sebelum melanjutkan ke analisis MANOVA, data akan diuji normalitas terlebih dahulu. Untuk tiap variabel respons dilakukan uji normalitas univariat. Selain itu, karena analisis yang digunakan bersifat multivariat, akan dilakukan juga uji normalitas multivariat dengan uji Mardia. Jika data tidak memenuhi asumsi normalitas, akan dipertimbangkan transformasi data atau penggunaan metode nonparametrik yang sesuai.
library(MVN)
datay <- datafix[, c("y1", "y2", "y3")]
norm.test <- mvn(datay, mvn_test = "mardia")
norm.test$univariate_normality
## Test Variable Statistic p.value Normality
## 1 Anderson-Darling y1 0.333 0.503 ✓ Normal
## 2 Anderson-Darling y2 0.190 0.895 ✓ Normal
## 3 Anderson-Darling y3 0.282 0.624 ✓ Normal
norm.test$multivariate_normality
## Test Statistic p.value Method MVN
## 1 Mardia Skewness 7.238 0.703 asymptotic ✓ Normal
## 2 Mardia Kurtosis -0.843 0.399 asymptotic ✓ Normal
Setelah uji normalitas, dilakukan Uji Box’s M guna mengevaluasi homogenitas matriks kovarians antar kelompok. Asumsi ini harus terpenuhi agar hasil MANOVA valid. Jika p-value dari Uji Box’s M lebih besar dari 0,05 maka dapat disimpulkan bahwa matriks kovarians antar kelompok homogen sehingga analisis dapat dilanjutkan.
library(MVTests)
##
## Attaching package: 'MVTests'
## The following object is masked from 'package:datasets':
##
## iris
ujiboxm <- BoxM(datay, datafix$perlakuan)
summary(ujiboxm)
## Box's M Test
##
## Chi-Squared Value = 82.05324 , df = 30 and p-value: 9.97e-07
Uji Pillai’s Trace digunakan untuk menilai apakah terdapat perbedaan yang signifikan secara simultan pada variabel respon antar perlakuan. Statistik ini cukup robust terhadap pelanggaran asumsi. Jika p-value < 0,05 maka perlakuan berpengaruh signifikan secara multivariat, sedangkan jika p-value > 0,05 maka tidak terdapat perbedaan multivariat antar perlakuan.
ujimanova <- manova(cbind(y1,y2,y3) ~ perlakuan, data = datafix)
summary(ujimanova, test = "Pillai")
## Df Pillai approx F num Df den Df Pr(>F)
## perlakuan 5 0.38885 1.3403 15 135 0.1868
## Residuals 45
Uji Wilks’ Lambda digunakan untuk mengevaluasi apakah terdapat perbedaan mean multivariat antar perlakuan. Statistik ini mengukur proporsi keragaman yang tidak dapat dijelaskan oleh model. Nilai Wilks yang kecil dan p-value < 0,05 menunjukkan bahwa perlakuan memberikan pengaruh yang signifikan secara simultan, sedangkan p-value > 0,05 menandakan tidak adanya perbedaan multivariat antar kelompok.
summary(ujimanova, test = "Wilks")
## Df Wilks approx F num Df den Df Pr(>F)
## perlakuan 5 0.64021 1.3922 15 119.11 0.162
## Residuals 45
Uji Hotelling–Lawley Trace digunakan untuk menilai apakah terdapat perbedaan mean multivariat antar perlakuan. Statistik ini sensitif terhadap ketidakseimbangan ukuran sampel dan cenderung lebih peka ketika perbedaan antar kelompok cukup besar. Jika p-value < 0,05 maka perlakuan berpengaruh signifikan secara simultan, sedangkan p-value > 0,05 menunjukkan bahwa tidak terdapat perbedaan multivariat antar perlakuan.
summary(ujimanova, test = "Hotelling-Lawley")
## Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## perlakuan 5 0.51711 1.4364 15 125 0.1405
## Residuals 45
Uji Roy’s Largest Root digunakan untuk melihat apakah terdapat perbedaan mean multivariat antar perlakuan dengan fokus pada komponen perbedaan terbesar antar kelompok. Statistik ini paling sensitif ketika hanya satu kombinasi linear variabel respon yang menunjukkan perbedaan kuat. Jika p-value < 0,05 maka perlakuan berpengaruh signifikan secara multivariat, sedangkan p-value > 0,05 menunjukkan tidak adanya perbedaan yang signifikan.
summary(ujimanova, test = "Roy")
## Df Roy approx F num Df den Df Pr(>F)
## perlakuan 5 0.41237 3.7113 5 45 0.006749 **
## Residuals 45
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Uji normalitas multivariat pada data Study Score Performance dilakukan dengan menggunakan uji normalitas multivariat yang pada software R sebagai paket MVN. Menurut output dari uji tersebut didapatkan data sebagai berikut.
| Test | p-value | MVN |
|---|---|---|
| Mardia Skewness | 0.177 | Normal |
| Mardia Kurtosis | 0.786 | Normal |
Selain itu, uji normalitas multivariat juga dapat dilakukan dengan menggunakan syntax str(norm.test) yang menampilkan hasil uji normal multivariat yang sama seperti uji Mardia dan uji normal univariat dengan uji Anderson-Darling sebagai berikut.
| Test | p-value | MVN |
|---|---|---|
| Math Score | 0.385 | Normal |
| Reading Score | 0.165 | Normal |
| Writing Score | 0.257 | Normal |
Menurut dua uji diatas didapatkan hasil p-value yang lebih dari alpha 5% sehingga dinyatakan terima H0. Sehingga dengan taraf kepercayaan 95% dapat dikatakan bahwa data Study Score Performance menyebar secara normal.
Sebelum melakukan analisis MANOVA, diperlukan pemeriksaan terhadap asumsi homogenitas matriks kovarian antar kelompok dan homogenitas rata-rata. Oleh karena itu, akan dilakukan uji untuk memastikan bahwa varians–kovarians dan rata-rata dari ketiga variabel dependen bersifat homogen pada setiap tingkat pendidikan orang tua. Pemeriksaan ini penting agar hasil MANOVA yang diperoleh valid dan dapat diinterpretasikan dengan tepat.
| Uji | p-value |
|---|---|
| Box’s M | 0.483 |
| Uji | p-value |
|---|---|
| Pillai’s Trace | 0.873 |
| Wilks Lambda | 0.878 |
| Hotelling Lawley | 0.884 |
| Roy’s Greatest Root | 0.873 |
Setelah seluruh asumsi terpenuhi, analisis akan dilanjutkan dengan uji MANOVA untuk mengetahui apakah tingkat pendidikan orang tua memberikan pengaruh yang signifikan terhadap kombinasi ketiga nilai kemampuan akademik, yaitu math score, reading score, dan writing score.
| Variabel | p-value |
|---|---|
| Math Score | 0.662 |
| Reading Score | 0.709 |
| Writing Score | 0.534 |
Menurut uji MANOVA diatas didapatkan hasil p-value yang lebih dari alpha 5% pada setiap variabel respon sehingga dinyatakan terima H0. Sehingga dengan taraf kepercayaan 95% dapat dikatakan bahwa tidak terdapat perbedaan yang signifikan secara multivariat pada nilai matematika, membaca, dan menulis siswa berdasarkan tingkat pendidikan orang tua. Dengan kata lain, variasi tingkat pendidikan orang tua tidak berpengaruh secara signifikan terhadap kombinasi ketiga nilai akademik tersebut.
Berdasarkan hasil analisis MANOVA terhadap nilai matematika, membaca, dan menulis siswa, dapat disimpulkan bahwa tingkat pendidikan orang tua tidak memberikan pengaruh yang signifikan secara multivariat terhadap kombinasi ketiga variabel dependen tersebut. Hal ini menunjukkan bahwa variasi tingkat pendidikan orang tua dalam sampel yang dianalisis tidak berpengaruh signifikan terhadap performa akademik siswa, sehingga nilai-nilai akademik relatif seimbang antar kelompok parental level of education. Temuan ini mengindikasikan bahwa faktor tingkat pendidikan orang tua, meskipun sering dianggap berpengaruh terhadap capaian akademik, dalam konteks sampel ini tidak menjadi faktor pembeda utama pada nilai matematika, membaca, maupun menulis. Hal ini dapat menjadi pertimbangan bagi peneliti atau praktisi pendidikan bahwa faktor lain, seperti motivasi siswa, metode belajar, atau dukungan sekolah, mungkin memiliki peran lebih besar dalam mempengaruhi performa akademik.
Berdasarkan hasil penelitian, disarankan agar studi selanjutnya mempertimbangkan penggunaan sampel yang lebih besar dan lebih beragam untuk memperoleh hasil yang lebih representatif. Selain itu, peneliti dapat menambahkan variabel pendukung lain, seperti motivasi belajar siswa, dukungan belajar di rumah, atau akses fasilitas pendidikan, untuk memahami faktor-faktor yang lebih spesifik mempengaruhi performa akademik. Bagi praktisi pendidikan, meskipun tingkat pendidikan orang tua tidak menunjukkan pengaruh signifikan pada hasil belajar dalam penelitian ini, tetap disarankan untuk memberikan dukungan belajar yang konsisten dan merata bagi seluruh siswa agar performa akademik tetap optimal.
Sihombing, S.O. 2022. Pengantar Metode Analisis Multivariat. NEM.51-53.
Wardani, R. 2023. Statistika dan Analisis Data. Deepublish. 105-107.