Penerapan Multivariate Analysis of Variance (MANOVA) untuk Mengetahui Pengaruh Tipe Pekerjaan terhadap Income, Education, dan Prestige
1 Pendahuluan
1.1 Latar Belakang
Status sosial ekonomi merupakan salah satu aspek penting yang digunakan untuk melihat kedudukan individu dalam struktur masyarakat. Dalam kajian sosial dan ekonomi, status ini umumnya dinilai berdasarkan tiga indikator utama, yaitu pendapatan (income), pendidikan (education), dan prestise pekerjaan (prestige). Pendapatan mencerminkan tingkat kesejahteraan finansial seseorang, pendidikan berkaitan dengan akses terhadap ilmu dan keterampilan formal, sedangkan prestise pekerjaan menunjukkan seberapa dihargainya suatu profesi oleh masyarakat. Ketiga indikator tersebut tidak berdiri sendiri, melainkan saling berkaitan dan membentuk persepsi sosial terhadap posisi individu di dalam masyarakat [1]
Penelitian ini menggunakan Duncan’s Occupational Prestige Dataset, yaitu data yang berisi informasi tentang 45 jenis pekerjaan di Amerika Serikat. Dataset ini merupakan salah satu data klasik dalam studi sosiologi dan tersedia secara resmi dalam package carData pada perangkat lunak R. Variabel-variabel yang digunakan dalam penelitian ini meliputi type (jenis pekerjaan) sebagai variabel independen, dan income, education, serta prestige sebagai variabel dependen. Jenis pekerjaan dikelompokkan ke dalam tiga kategori, yaitu professional, white-collar, dan blue-collar. Dengan memanfaatkan data ini, penelitian bertujuan untuk memahami bagaimana perbedaan jenis pekerjaan berpengaruh terhadap kondisi sosial ekonomi berdasarkan tiga indikator yang diamati.
Untuk menjawab tujuan tersebut, digunakan metode Multivariate Analysis of Variance (MANOVA), yaitu pendekatan analisis multivariat yang memungkinkan pengujian pengaruh satu variabel independen terhadap lebih dari satu variabel dependen secara bersamaan. MANOVA dipilih karena ketiga variabel sosial ekonomi yang digunakan dalam penelitian ini saling berkaitan, sehingga pendekatan ini memungkinkan pemahaman yang lebih utuh terhadap pengaruh jenis pekerjaan. Hasil analisis ini diharapkan dapat memberikan gambaran yang lebih mendalam mengenai keterkaitan antara struktur pekerjaan dan dimensi sosial ekonomi, serta dapat dijadikan sebagai dasar pertimbangan dalam kajian sosial berbasis data[2].
1.2 Rumusan Masalah
- Apakah terdapat perbedaan yang mencolok dalam status sosial ekonomi (pendapatan, pendidikan, dan prestise pekerjaan) berdasarkan jenis pekerjaan (professional, white-collar, dan blue-collar)?
- Bagaimana variasi jenis pekerjaan memengaruhi aspek-aspek status sosial ekonomi, seperti tingkat pendapatan, jenjang pendidikan, dan prestise pekerjaan?
1.3 Tujuan Penelitian
- Menelusuri adanya perbedaan dalam status sosial ekonomi berdasarkan klasifikasi jenis pekerjaan melalui metode Multivariate Analysis of Variance (MANOVA).
- Menilai pengaruh jenis pekerjaan terhadap ketiga indikator sosial ekonomi seperti pendapatan, tingkat pendidikan, dan prestise pekerjaan dalam satu kerangka analisis terpadu.
1.4 Manfaat Penelitian
- Memberikan sudut pandang yang lebih luas mengenai kaitan antara jenis pekerjaan dengan kondisi sosial ekonomi, yang dapat dimanfaatkan dalam studi sosiologis maupun penyusunan kebijakan publik.
- Menyediakan landasan analisis bagi para pembuat kebijakan dalam merancang program pembangunan sosial dan ekonomi yang responsif terhadap ketimpangan berdasarkan jenis pekerjaan.
2 Tinjauan Pustaka
2.1 Statistika Deskriptif
Statistika deskriptif merupakan cabang statistika yang digunakan untuk menghimpun, mengelompokkan, mengolah, dan menyajikan data sehingga dapat memberikan gambaran yang jelas mengenai suatu kondisi atau peristiwa tertentu. Tujuannya adalah untuk mempermudah pemahaman terhadap data melalui penyajian yang informatif, tanpa melakukan penarikan kesimpulan atau generalisasi [3].
2.2 Uji Asumsi MANOVA
2.2.1 Uji Normalitas Multivariat
Uji normalitas multivariat merupakan salah satu uji asumsi dalam MANOVA yang harus dipenuhi. Uji ini digunakan untuk mengetahui apakah distribusi data mendekati distribusi normal multivariat atau tidak. Dalam pengujian normalitas, hipotesis yang digunakan adalah sebagai berikut :
H0: Data berdistribusi normal multivariat.
H1: Data tidak berdistribusi normal multivariat.
Kesimpulan bahwa data berdistribusi normal multivariat atau tidak diputuskan dengan kaidah pengujian tolak H0 jika nilai p-value< \(\alpha\).
2.2.2 Uji Homogenitas Matriks Varians-Kovarians
Uji homogenitas matriks varians-kovarians merupakan uji asumsi multivariat yang harus dipenuhi juga selain normalitas. Uji ini menggunakan uji statistik Box’s M, hipotesis yang digunakan adalah sebagai berikut [4]: \(H_0: \Sigma_1 = \Sigma_2 = \Sigma_3 \quad \text{(struktur matriks varians-kovarians antar kelompok pekerjaan adalah homogen)}\)
\(H_1:\) Minimal satu \(\Sigma_i \ne \Sigma_j\) untuk \(i \ne j\) (terdapat perbedaan struktur matriks varians-kovarians antar kelompok pekerjaan)
Statistik uji Box’s M dihitung menggunakan rumus pada persamaan (1).
\[ X^2 = -2(1 - C1) \left[ \frac{1}{2} \sum_{i=1}^{k} v_i \ln |S_i| - \frac{1}{2} \ln |S_{pool}| \sum_{i=1}^{k} v_i \right] \tag{1} \]
Dimana:
\(k\): banyaknya kelompok tipe
pekerjaan
\(s_i\): varians data pada kelompok
ke-\(i\)
\(v_i\): \(n_i - 1\)
\(n_i\): banyaknya data pada kelompok
ke-\(i\)
Matriks kovarians gabungan (pooled covariance matrix) dihitung sebagai:
\[ S_{pool} = \frac{\sum_{i=1}^{k} v_i S_i}{\sum_{i=1}^{k} S_i} \tag{2} \]
Sedangkan konstanta koreksi \(C_1\) didefinisikan sebagai:
\[ C_1 = \left[ \sum_{i=1}^{k} \frac{1}{v_i} - \frac{1}{\sum_{i=1}^{k} v_i} \right] \left[ \frac{2p^2 + 3p - 1}{6(p+1)(k-1)} \right] \tag{3} \]
Dimana \(p = 3\), jumlah variabel dependen (income, education, prestige). Kesimpulan bahwa data antar kelompok terdapat kesamaan varians-kovarians atau tidak diputuskan dengan kaidah pengujian:
Tolak \(H_0\) jika nilai \(X^2 \geq \chi^2_{\frac{1}{2}(k-1)(p+1)}\) dengan \(p\)-value < \(\alpha\).
2.3 Uji MANOVA (Multivariate Analysis of Variance)
MANOVA satu arah merupakan perluasan dari metode ANOVA satu arah. Metode ini digunakan untuk menguji apakah beberapa kelompok populasi (yang berasal dari populasi yang sama) memiliki rata-rata multivariat yang setara pada sejumlah variabel dependen atau variabel perlakuan yang diamati dalam suatu penelitian [5]. Model umum dari MANOVA satu arah adalah [6]:
\[ Y_{ijk} = \mu_{ik} + \tau_{ik} + \varepsilon_{ijk} \tag{4} \]
Dimana:
\(i = 1, 2, 3\) : Kelompok tipe
pekerjaan (1 = blue collar, 2 = white collar, 3 = professional)
\(j = 1, 2, ..., n_i\) : individu
ke-\(j\) dalam tiap kelompok
pekerjaan
\(k = 1, 2, 3\) : Variabel dependen (1
= income, 2 = education, 3 = prestige)
\(Y_{ijk}\) : nilai pengamatan dari
respon ke-\(k\) dan ulangan ke-\(j\) yang memperoleh perlakuan ke-\(i\)
\(\mu_{ik}\) : nilai rataan umum dari
respon ke-\(k\)
\(\tau_{ik}\) : pengaruh dari perlakuan
(tipe pekerjaan) ke-\(i\) terhadap
respon ke-\(k\)
\(\varepsilon_{ijk}\) : pengaruh galat
yang timbul pada respon ke-\(k\) dari
ulangan ke-\(j\) dan perlakuan ke-\(i\)
Hipotesis yang digunakan dalam uji Manova adalah: \[H_0: \tau_1 = \tau_2 = \cdots = \tau_g = 0\]Artinya tidak terdapat perbedaan rata-rata multivariat antar ketiga kelompok pekerjaan.
\[H_1: \tau_l \ne 0, \quad l = 1, 2, \dots, g\](Minimal terdapat satu kelompok pekerjaan yang memiliki perbedaan rata-rata multivariat terhadap salah satu variabel dependen).
Keputusan yang diambil adalah tolak \(H_0\) jika nilai p-value < \(\alpha\).
Dalam analisis MANOVA, terdapat beberapa jenis statistik uji yang dapat digunakan untuk menentukan perbedaan antar kelompok. Pemilihan statistik uji ini bergantung pada kondisi data dan terpenuhinya asumsi-asumsi dasar, antara lain:
Pillai’s Trace direkomendasikan ketika asumsi homogenitas matriks varians-kovarians tidak terpenuhi, ukuran sampel relatif kecil, atau ketika hasil pengujian antar variabel tidak konsisten, misalnya sebagian variabel menunjukkan perbedaan signifikan sementara yang lain tidak.
Wilks’ Lambda umum digunakan apabila data terdiri atas lebih dari dua kelompok variabel independen dan asumsi homogenitas matriks varians-kovarians terpenuhi, serta dianggap sebagai statistik uji yang paling sering diterapkan dalam praktik.
Hotelling’s Trace lebih sesuai digunakan ketika hanya terdapat dua kelompok pada variabel independen.
Roy’s Largest Root digunakan dalam kondisi di mana asumsi homogenitas matriks varians-kovarians terpenuhi, dan fokus pengujian diarahkan pada variabel yang memberikan kontribusi paling besar terhadap perbedaan antar kelompok.
2.4 Uji Post-Hoc
Metode Linear Discriminant Analysis (LDA) digunakan untuk melakukan ekstraksi fitur dengan tujuan memisahkan data ke dalam beberapa kelas yang berbeda. Teknik ini bekerja dengan memaksimalkan variansi antar kelas (between-class scatter) dan meminimalkan variansi dalam kelas (within-class scatter), sehingga menghasilkan pemisahan yang lebih jelas antar kelompok. Dalam penerapannya, posisi dataset tetap, namun distribusi data antar kelas menjadi lebih terpisah. Hal ini membuat jarak antar kelas meningkat, sementara jarak antar data dalam satu kelas menjadi lebih rapat [7].
2.5 Data
Data yang digunakan adalah data sekunder yang dapat ditemukan dalam pustaka CarData disoftware Rstudio. variabel yang digunakan adalah sebagai berikut.
• Variabel X (Tipe pekerjaan) Terdapat 3 tipe pekerjaan, yaitu:
Blue collar ( Pekerjaan fisik/manual seperti tukang atau mekanik)
White collar (Pekerjaan kantoran seperti staf administrasi)
Professional (Pekerjaan profesional yang memerlukan keahlian khusus, seperti dokter atau pengacara)
• Variabel Y1 (income) : Skor tingkat pendapatan untuk masing-masing pekerjaan dalam rentang skala 0–100
• Variabel Y2 (education): Skor rata-rata lama pendidikan (dalam tahun) yang dibutuhkan untuk masing-masing pekerjaan, dinyatakan dalam skala 0–100.
• Variabel Y3 (prestige): Tingkat prestise sosial suatu pekerjaan berdasarkan penilaian masyarakat (skala 0–100)
Tabel 1 Data Duncan
## Warning: package 'carData' was built under R version 4.4.3
| type | income | education | prestige | |
|---|---|---|---|---|
| accountant | prof | 62 | 86 | 82 |
| pilot | prof | 72 | 76 | 83 |
| architect | prof | 75 | 92 | 90 |
| author | prof | 55 | 90 | 76 |
| chemist | prof | 64 | 86 | 90 |
| minister | prof | 21 | 84 | 87 |
| professor | prof | 64 | 93 | 93 |
| dentist | prof | 80 | 100 | 90 |
| reporter | wc | 67 | 87 | 52 |
| engineer | prof | 72 | 86 | 88 |
| undertaker | prof | 42 | 74 | 57 |
| lawyer | prof | 76 | 98 | 89 |
| physician | prof | 76 | 97 | 97 |
| welfare.worker | prof | 41 | 84 | 59 |
| teacher | prof | 48 | 91 | 73 |
| conductor | wc | 76 | 34 | 38 |
| contractor | prof | 53 | 45 | 76 |
| factory.owner | prof | 60 | 56 | 81 |
| store.manager | prof | 42 | 44 | 45 |
| banker | prof | 78 | 82 | 92 |
| bookkeeper | wc | 29 | 72 | 39 |
| mail.carrier | wc | 48 | 55 | 34 |
| insurance.agent | wc | 55 | 71 | 41 |
| store.clerk | wc | 29 | 50 | 16 |
| carpenter | bc | 21 | 23 | 33 |
| electrician | bc | 47 | 39 | 53 |
| RR.engineer | bc | 81 | 28 | 67 |
| machinist | bc | 36 | 32 | 57 |
| auto.repairman | bc | 22 | 22 | 26 |
| plumber | bc | 44 | 25 | 29 |
| gas.stn.attendant | bc | 15 | 29 | 10 |
| coal.miner | bc | 7 | 7 | 15 |
| streetcar.motorman | bc | 42 | 26 | 19 |
| taxi.driver | bc | 9 | 19 | 10 |
| truck.driver | bc | 21 | 15 | 13 |
| machine.operator | bc | 21 | 20 | 24 |
| barber | bc | 16 | 26 | 20 |
| bartender | bc | 16 | 28 | 7 |
| shoe.shiner | bc | 9 | 17 | 3 |
| cook | bc | 14 | 22 | 16 |
| soda.clerk | bc | 12 | 30 | 6 |
| watchman | bc | 17 | 25 | 11 |
| janitor | bc | 7 | 20 | 8 |
| policeman | bc | 34 | 47 | 41 |
| waiter | bc | 8 | 32 | 10 |
3 Hasil dan Pembahasan
3.1 Library yang dibutuhkan
library yang digunakan dalam analisis data ini sebagai berikut :
## Warning: package 'MVN' was built under R version 4.4.1
## Warning: package 'MVTests' was built under R version 4.4.3
##
## Attaching package: 'MVTests'
## The following object is masked from 'package:datasets':
##
## iris
## Warning: package 'profileR' was built under R version 4.4.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.4.3
## Loading required package: RColorBrewer
## Loading required package: reshape
## Loading required package: lavaan
## Warning: package 'lavaan' was built under R version 4.4.3
## This is lavaan 0.6-19
## lavaan is FREE software! Please report any bugs.
Kegunaan library:
MVN: library ini digunakan untuk menguji data multivariat normal
MVTest: Library ini digunakan untuk menguji hipotesis terkait vektor rata-rata dan matriks kovarians, baik untuk satu sampel, dua sampel independen, maupun sampel berpasangan.
profileR: library ini digunakan untuk melakukan analisis profil melalui pendekatan multivariat. Paket ini membantu membandingkan pola skor antar kelompok, menyediakan visualisasi yang intuitif, serta mendukung validasi silang untuk menguji keandalan model.
carData: library yang digunakan untuk menyediakan kumpulan dataset contoh yang digunakan untuk latihan analisis regresi dan statistik terapan bersama paket car dalam analisis regresi, ANOVA, dan teknik statistik terapan lainnya.
MASS: Library ini digunakan untuk memuat paket MASS (Modern Applied Statistics with S) yang berisi berbagai fungsi statistik lanjutan, seperti regresi, MANOVA, dan analisis diskriminan. Paket ini sering digunakan dalam analisis multivariat maupun pemodelan statistik kompleks.
ggplot2: Library ini digunakan untuk memuat paket ggplot2, yaitu paket visualisasi data yang berbasis konsep grammar of graphics. Dengan ggplot2, pengguna dapat membuat berbagai jenis grafik yang estetis dan informatif seperti scatter plot, bar chart, boxplot, dan lainnya dengan cara yang fleksibel dan mudah disesuaikan.
rmarkdown: Library ini digunakan untuk memuat paket rmarkdown, yang memungkinkan pengguna untuk membuat laporan dinamis dalam berbagai format seperti HTML, PDF, atau Word. Paket ini sangat berguna untuk menggabungkan teks, kode R, dan output analisis dalam satu dokumen yang terstruktur dan otomatis.
3.2 Input Data
Sebelum melakukan pengujian terhadap data, terlebih dahulu dilakukan proses input data dengan memanggil dataset bawaan bernama Duncan dari library carData. Dataset ini kemudian disalin ke dalam objek baru bernama duncan untuk memudahkan analisis selanjutnya. Berikut adalah syntax yang digunakan:
## type income education prestige
## accountant prof 62 86 82
## pilot prof 72 76 83
## architect prof 75 92 90
## author prof 55 90 76
## chemist prof 64 86 90
## minister prof 21 84 87
3.3 Membuat Data Frame
Pada tahap ini, dataset duncan diubah menjadi format data frame yang biasa digunakan dalam analisis data di R. Ini bertujuan agar dataset lebih mudah diakses, dimanipulasi, dan ditampilkan melalui jendela tampilan data (View) di RStudio.
3.4 Memilih Variabel Dependen (Bivariat)
Setelah data berhasil dimuat, langkah selanjutnya adalah menentukan variabel-variabel dependen yang akan dianalisis secara bersamaan melalui uji MANOVA. Dalam analisis ini, variabel dependen yang dipilih harus bersifat numerik dan saling berkorelasi. Hal ini penting karena MANOVA bertujuan untuk menguji perbedaan rata-rata dari beberapa variabel dependen berdasarkan satu atau lebih variabel independen.
## income education prestige
## accountant 62 86 82
## pilot 72 76 83
## architect 75 92 90
## author 55 90 76
## chemist 64 86 90
## minister 21 84 87
3.5 Statistika Deskriptif
Tahap statistik deskriptif dilakukan untuk memahami karakteristik dasar dari masing-masing variabel yang dianalisis. Melalui informasi seperti nilai rata-rata, standar deviasi, serta nilai minimum dan maksimum, peneliti dapat memperoleh gambaran umum mengenai pola dan sebaran data sebelum dilakukan pengujian MANOVA.
## income education prestige
## Min. : 7.00 Min. : 7.00 Min. : 3.00
## 1st Qu.:21.00 1st Qu.: 26.00 1st Qu.:16.00
## Median :42.00 Median : 45.00 Median :41.00
## Mean :41.87 Mean : 52.56 Mean :47.69
## 3rd Qu.:64.00 3rd Qu.: 84.00 3rd Qu.:81.00
## Max. :81.00 Max. :100.00 Max. :97.00
Dari hasil tersebut diperoleh bahwa:
• Rata-rata pendapatan (income) menunjukkan angka 41.87, yang menggambarkan bahwa mayoritas individu dalam dataset memiliki tingkat pendapatan yang termasuk dalam kategori menengah.
• Rata-rata tingkat pendidikan (education) sebesar 52.56 adalah nilai tertinggi di antara ketiga variabel, yang menunjukkan bahwa sebagian besar individu memiliki pendidikan yang cukup tinggi.
• Tingkat prestise rata-rata pekerjaan adalah 47.69, menunjukkan bahwa mayoritas pekerjaan dalam dataset dianggap memiliki status sosial yang relatif baik atau dihargai.
Visualisasi Data dengan Boxplot
Boxplot adalah visualisasi grafis yang digunakan untuk menampilkan distribusi data numerik secara ringkas melalui lima nilai statistik utama: minimum, kuartil pertama, median, kuartil ketiga, dan maksimum. Dalam konteks ini, boxplot digunakan untuk membandingkan variabel seperti income, education, dan prestige antar jenis pekerjaan (blue collar, white collar, dan professional). Visualisasi ini memudahkan dalam melihat perbedaan median, penyebaran data, serta mendeteksi adanya outlier pada masing-masing kelompok pekerjaan.
library(ggplot2)
# Boxplot Income
ggplot(duncan_df, aes(x = type, y = income, fill = type)) +
geom_boxplot() +
scale_fill_manual(values = c("bc" = "salmon", "prof" = "forestgreen", "wc"
= "dodgerblue")) +
labs(title = "Boxplot Income", y = "Income", x = "Type") +
theme_minimal(base_size = 14)
Boxplot variabel income menunjukkan perbedaan distribusi pendapatan di
antara ketiga kelompok pekerjaan. Kelompok professional (prof) memiliki
median pendapatan tertinggi, diikuti oleh white collar (wc), dan blue
collar (bc) memiliki median pendapatan terendah. Rentang interkuartil
(IQR) kelompok professional juga lebih lebar, yang mengindikasikan
variasi pendapatan yang lebih besar dalam kelompok ini. Selain itu,
terdapat outlier pada kelompok blue collar yang menunjukkan adanya
individu dengan pendapatan yang relatif tinggi dibandingkan mayoritas
anggota kelompok tersebut. Distribusi ini mengindikasikan bahwa
pekerjaan professional cenderung mendapatkan penghasilan yang lebih
tinggi dan bervariasi dibandingkan kelompok lainnya.
# Boxplot Education
ggplot(duncan_df, aes(x = type, y = education, fill = type)) +
geom_boxplot() +
scale_fill_manual(values = c("bc" = "salmon", "prof" = "forestgreen", "wc"
= "dodgerblue")) +
labs(title = "Boxplot Education", y = "Education", x = "Type") +
theme_minimal(base_size = 14)
Pada boxplot variabel education, pola serupa terlihat. Kelompok
professional menunjukkan median tingkat pendidikan tertinggi, diikuti
oleh white collar dan blue collar. Kelompok professional juga memiliki
rentang pendidikan yang sempit dan relatif tinggi, mengindikasikan
homogenitas tingkat pendidikan yang tinggi pada kelompok ini.
Sebaliknya, kelompok blue collar memperlihatkan distribusi pendidikan
yang lebih rendah dengan beberapa outlier yang menunjukkan individu
dengan tingkat pendidikan lebih tinggi dibandingkan anggota lain di
kelompok tersebut. Hal ini menegaskan hubungan kuat antara jenis
pekerjaan dan tingkat pendidikan yang diperoleh.
# Boxplot Prestige
ggplot(duncan_df, aes(x = type, y = prestige, fill = type)) +
geom_boxplot() +
scale_fill_manual(values = c("bc" = "salmon", "prof" = "forestgreen", "wc"
= "dodgerblue")) +
labs(title = "Boxplot Prestige", y = "Prestige", x = "Type") +
theme_minimal(base_size = 14)
Untuk variabel prestige, yang menggambarkan prestise pekerjaan, kelompok
professional kembali menempati posisi tertinggi dalam median prestise,
diikuti oleh white collar dan blue collar. Rentang prestise pada
kelompok professional cukup lebar, menandakan variasi prestise yang
cukup signifikan dalam pekerjaan professional. Kelompok blue collar
menunjukkan rentang dan median prestise terendah, serta beberapa outlier
yang menandakan adanya variasi prestise yang tidak biasa di dalam
kelompok ini. Distribusi ini memperlihatkan adanya perbedaan jelas dalam
penghargaan sosial yang diterima oleh ketiga kelompok pekerjaan
tersebut.
Secara keseluruhan, ketiga boxplot ini memberikan gambaran visual yang kuat tentang perbedaan karakteristik pendapatan, pendidikan, dan prestise antar jenis pekerjaan. Kelompok professional secara konsisten menunjukkan nilai median dan rentang yang lebih tinggi pada ketiga variabel, mencerminkan posisi sosial dan ekonomi yang lebih baik dibanding kelompok blue collar dan white collar. Perbedaan ini mendukung hipotesis awal bahwa tipe pekerjaan berpengaruh signifikan terhadap tingkat pendapatan, pendidikan, dan prestise.
3.6 Uji Asumsi Normalitas Multivariat
Uji ini dilaksanakan untuk memastikan bahwa data yang dipakai dalam analisis MANOVA memenuhi asumsi distribusi normal multivariat. Analisis ini menggunakan Mardia’s test karena mampu menguji normalitas multivariat secara langsung melalui skewness dan kurtosis, sehingga sesuai untuk analisis seperti MANOVA yang melibatkan hubungan antar variabel.
# Q-Q Plot Income
qqnorm(duncan_df$income, main = "Q-Q Plot - Income")
qqline(duncan_df$income, col = "black", lwd = 2) # Q-Q Plot Education
qqnorm(duncan_df$education, main = "Q-Q Plot - Education")
qqline(duncan_df$education, col = "black", lwd = 2) # Q-Q Plot Prestige
qqnorm(duncan_df$prestige, main = "Q-Q Plot - Prestige")
qqline(duncan_df$prestige, col = "black", lwd = 2)
Berdasarkan hasil Q-Q plot, distribusi ketiga variabel (income,
education, dan prestige) yaitu variabel income menunjukkan pola sebaran
yang cukup mengikuti garis diagonal, dengan sedikit penyimpangan di
bagian ujung bawah dan atas. Ini mengindikasikan bahwa data income
cenderung mendekati distribusi normal. Hal yang serupa juga terlihat
pada variabel education, di mana sebagian besar titik mengikuti garis
lurus dengan deviasi ringan di ekor distribusi. Oleh karena itu, data
education juga dapat dianggap memiliki distribusi yang hampir
normal.
Sementara itu, variabel prestige menunjukkan penyimpangan yang lebih jelas dari garis diagonal, terutama pada nilai-nilai ekstrim di bagian bawah dan atas plot. Hal ini menunjukkan adanya ketidaksesuaian dengan distribusi normal, kemungkinan karena pengaruh outlier atau bentuk distribusi yang tidak simetris. Dengan demikian, secara keseluruhan dapat disimpulkan bahwa income dan education mendekati distribusi normal, sedangkan prestige menunjukkan deviasi yang lebih besar dan tidak sepenuhnya memenuhi asumsi normalitas. Hasil uji normalitas multivariat menggunakan metode Mardia sebagai berikut.
• Hipotesis
H0 ∶ Data berdistribusi normal multivariat
H1 ∶ Data tidak berdistribusi normal multivariat
• Taraf Signifikansi
α = 0.05
• Daerah Kritis
Tolak H0 jika p-value < α
• Statistik Uji
hasil_normalitas_awal <- mvn(data = bivariat, mvnTest = "mardia",
univariateTest = "SW")
hasil_normalitas_awal$multivariateNormality ## Test Statistic p value Result
## 1 Mardia Skewness 8.18343860802632 0.610924234831225 YES
## 2 Mardia Kurtosis 0.701878260360718 0.482755087538423 YES
## 3 MVN <NA> <NA> YES
• Keputusan
Berdasarkan hasil pengujian di atas didapatkan p-value untuk y1, y2 dan y3 > 0.05 (α), sehingga gagal untuk tolak H0
• Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, didapatkan data gagal tolak H0. Dengan demikian, didapatkan kesimpulan bahwa data berdistribusi normal multivariat.
3.7 Uji Asumsi Homogenitas
Uji asumsi homogenitas dilakukan untuk memastikan bahwa matriks kovarians di antara kelompok dalam analisis multivariat, seperti MANOVA adalah seragam (homogen). Ini penting karena MANOVA menganggap bahwa variasi data antar kelompok adalah serupa. Karena itu, digunakan uji Box’s M yang dirancang khusus untuk menguji kesamaan matriks kovarian di antara beberapa kelompok.
Dari hasil uji homoskedastisitas diatas dapat dilakukan uji hipotesis seperti berikut:
• Hipotesis
H0 ∶ Asumsi Homoskedastisitas terpenuhi
H1 ∶ Asumsi Homoskedastisitas tidak terpenuhi
• Taraf Signifikansi
α = 0.05
• Daerah Kritis
Tolak H0 jika p-value < α
• Statistik Uji
## Box's M Test
##
## Chi-Squared Value = 18.26024 , df = 12 and p-value: 0.108
• Keputusan
p−value(0.108) > α(0.05), Maka gagal untuk tolak H0
• Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, dapat disimpulkan bahwa matriks varians-kovarians data homogen untuk setiap perlakuan maka asumsi homogenitas terpenuhi dan hasil MANOVA dapat diandalkan.
3.8 Uji Manova
Uji MANOVA dilakukan untuk menentukan apakah terdapat perbedaan signifikan pada kombinasi variabel dependen berdasarkan kategori variabel independen. Empat metode diterapkan, yaitu Pillai’s Trace yang paling tahan terhadap pelanggaran asumsi, Wilks’ Lambda yang paling sering digunakan tetapi sensitif terhadap asumsi, Hotelling-Lawley Trace yang ideal untuk data besar, dan Roy’s Largest Root yang menekankan pengaruh terbesar tetapi kurang stabil. Pemanfaatan keempatnya membantu menjamin konsistensi hasil analisis.
Selanjutnya dilakukan uji hipotesis menggunakan analisis MANOVA dengan hasil sebagai berikut.
• Hipotesis
H0 : τ₁ = τ₂ = τ₃ (Artinya: Tipe pekerjaan (blue collar, white collar, dan professional) tidak berpengaruh secara signifikan terhadap income, education, dan prestige)
H1 ∶∃i ≠ j, sehingga τᵢ ≠ τⱼ, dengan i, j ∈ {1, 2, 3} (Artinya, Terdapat minimal satu pasangan tipe pekerjaan yang memiliki pengaruh signifikan terhadap income, education, dan prestige)
• Taraf Signifikansi
α = 0.05
• Daerah Kritis
Tolak H0 jika p-value < α
• Statistik Uji
## Df Pillai approx F num Df den Df Pr(>F)
## type 2 1.2587 23.204 6 82 7.831e-16 ***
## Residuals 42
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Wilks approx F num Df den Df Pr(>F)
## type 2 0.099232 28.993 6 80 < 2.2e-16 ***
## Residuals 42
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## type 2 5.4707 35.559 6 78 < 2.2e-16 ***
## Residuals 42
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Roy approx F num Df den Df Pr(>F)
## type 2 4.7039 64.287 3 41 1.496e-15 ***
## Residuals 42
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
• Keputusan
Tabel 2 Keputusan uji Manova
## Warning: package 'knitr' was built under R version 4.4.3
## Warning: package 'kableExtra' was built under R version 4.4.3
| Metode | P.Value | Tanda | Alpha | Keputusan |
|---|---|---|---|---|
| Pillai | 7.831e-16 | < | 0.05 | Tolak H0 |
| Wilks | < 2.2e-16 | < | 0.05 | Tolak H0 |
| Hotelling-lawley | < 2.2e-16 | < | 0.05 | Tolak H0 |
| Roy | 1.496e-15 | < | 0.05 | Tolak H0 |
• Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, hasil menunjukan tolak H0, yang artinya terdapat minimal satu pasangan tipe pekerjaan (blue collar, white collar, dan professional) yang memiliki pengaruh signifikan terhadap income, education, dan prestige.
3.9 Uji Post Hoc
Nilai p yang mendekati nol dan efek yang besar menunjukkan bahwa terdapat perbedaan signifikan antar kelompok. Tapi, kita belum tahu pasti kelompok mana yang beda. Oleh karena itu, digunakan Linear Discriminant Analysis (LDA) untuk mengidentifikasi pemisahan antar kelompok secara lebih jelas. Dengan menggunakan LDA, hasilnya dapat divisualisasikan dalam bentuk diagram pencar (scatter plot) berdasarkan dua komponen diskriminan utama (LD1 dan LD2). Setiap titik akan diwarnai berdasarkan kategori variabel independen, sehingga pola pemisahan antar kelompok akan terlihat jelas. Analisis ini dapat dilakukan di R menggunakan fungsi lda() dari paket MASS.
## Call:
## lda(type ~ income + education + prestige, data = duncan_df)
##
## Prior probabilities of groups:
## bc prof wc
## 0.4666667 0.4000000 0.1333333
##
## Group means:
## income education prestige
## bc 23.76190 25.33333 22.76190
## prof 60.05556 81.33333 80.44444
## wc 50.66667 61.50000 36.66667
##
## Coefficients of linear discriminants:
## LD1 LD2
## income -0.01290105 0.06741434
## education 0.04563192 0.05629466
## prestige 0.04204763 -0.09607074
##
## Proportion of trace:
## LD1 LD2
## 0.8598 0.1402
Berdasarkan hasil analisis Linear Discriminant Analysis (LDA), kelompok pekerjaan didominasi oleh kategori blue-collar (46,67%) dan professional (40%). Kelompok professional memiliki rata-rata pendapatan, pendidikan, dan prestise yang lebih tinggi dibanding kelompok lainnya. Komponen LD1 paling berpengaruh dalam memisahkan kelompok, terutama dipengaruhi oleh pendidikan dan prestise. LD1 menjelaskan 86% variasi antar kelompok, sehingga menjadi faktor utama dalam membedakan tipe pekerjaan berdasarkan ketiga variabel tersebut. Potongan kode di bawah ini menggunakan fungsi predict() untuk memperoleh nilai dari komponen diskriminan linear (LD1 dan LD2), kemudian hasilnya digabungkan dengan variabel independen agar dapat divisualisasikan berdasarkan kelompoknya.
# Buat data frame hasil prediksi
lda_pred <- predict(lda_model)$x
lda_df <- data.frame(
type = duncan_df$type,
lda = lda_pred
)| type | lda.LD1 | lda.LD2 | |
|---|---|---|---|
| accountant | prof | 2.7090942 | -0.0562745 |
| pilot | prof | 2.1658121 | -0.0411485 |
| architect | prof | 3.1515531 | 0.3893140 |
| author | prof | 2.7296434 | 0.2734282 |
| chemist | prof | 3.0196731 | -0.6900117 |
| minister | prof | 3.3570114 | -3.4132056 |
| professor | prof | 3.4652395 | -0.5841613 |
| dentist | prof | 3.4521033 | 1.1767431 |
| reporter | wc | 1.4287919 | 3.2192140 |
| engineer | prof | 2.8323695 | 0.0414445 |
| undertaker | prof | 1.3683413 | 0.3216711 |
| lawyer | prof | 3.3703960 | 0.8905671 |
| physician | prof | 3.6611451 | 0.0657065 |
| welfare.worker | prof | 1.9216568 | 0.6250619 |
| teacher | prof | 2.7394398 | 0.1460346 |
| conductor | wc | -1.6944763 | 2.1873162 |
| contractor | prof | 0.7020089 | -2.3946604 |
| factory.owner | prof | 1.3238909 | -1.7838724 |
| store.manager | prof | -0.5051880 | -0.2143200 |
| banker | prof | 2.7406260 | -0.1635311 |
| bookkeeper | wc | 0.6879337 | 1.0619686 |
| mail.carrier | wc | -0.5431671 | 1.8661855 |
| insurance.agent | wc | 0.3909698 | 2.5663054 |
| store.clerk | wc | -1.2830641 | 2.0331129 |
| carpenter | bc | -1.6971080 | -1.6593603 |
| electrician | bc | -0.4614718 | -0.9272875 |
| RR.engineer | bc | -0.8133918 | -0.5994315 |
| machinist | bc | -0.4707933 | -2.4471909 |
| auto.repairman | bc | -2.0499744 | -0.9757455 |
| plumber | bc | -2.0707587 | 0.3880418 |
| gas.stn.attendant | bc | -2.3130056 | 0.4835486 |
| coal.miner | bc | -3.0034614 | -1.7746025 |
| streetcar.motorman | bc | -2.4198010 | 1.2702152 |
| taxi.driver | bc | -2.6919186 | -0.4838842 |
| truck.driver | bc | -2.9031160 | -0.1883029 |
| machine.operator | bc | -2.2124324 | -0.9636077 |
| barber | bc | -2.0423261 | -0.5786285 |
| bartender | bc | -2.4976815 | 0.7828805 |
| shoe.shiner | bc | -3.0775158 | 0.0760217 |
| cook | bc | -2.3672423 | -0.5543529 |
| soda.clerk | bc | -2.3968611 | 0.7218831 |
| watchman | bc | -2.4792878 | 0.2971278 |
| janitor | bc | -2.7045798 | -0.3702767 |
| policeman | bc | -0.4332744 | -0.2004678 |
| waiter | bc | -2.0858025 | 0.1805321 |
Hasil LDA menunjukkan bahwa profesi seperti physician, lawyer, dan dentist memiliki nilai LD1 tinggi, menandakan mereka termasuk kelompok professional karena nilai LD1 mereka di atas 2.5. Sebaliknya, pekerjaan seperti coal miner dan cook dengan LD1 rendah termasuk blue collar. Profesi seperti reporter dan insurance agent memiliki LD1 sedang namun LD2 tinggi, sehingga cenderung masuk kelompok white-collar karena menonjol dalam aspek seperti prestise atau gaya kerja. Langkah terakhir dalam uji post-hoc ini adalah memvisualisasikan lda_df di atas dalam bentuk diagram pencar (scatter plot).
# Visualisasi hasil LDA
ggplot(lda_df) +
geom_point(aes(x = lda.LD1, y = lda.LD2, color = type), size = 4) +
theme_classic()Berdasarkan Scatter plot hasil LDA menunjukkan bahwa kelompok pekerjaan dapat dibedakan dengan cukup jelas. Profesional cenderung berada di sisi kanan (LD1 positif), blue-collar di kiri (LD1 negatif), dan white-collar menonjol di atas (LD2 tinggi), menandakan karakteristik yang berbeda antar kelompok.
4 Kesimpulan dan Saran
4.1 Kesimpulan
Berdasarkan hasil analisis MANOVA yang telah dilakukan dengan bantuan software RStudio, dapat disimpulkan bahwa terdapat minimal satu pasangan tipe pekerjaan (blue collar, white collar, dan professional) yang memiliki pengaruh signifikan terhadap income, education, dan prestige. Hasil ini didapatkan setelah dipastikan terlebih dahulu bahwa data telah memenuhi asumsi multivariat, yaitu berdistribusi normal dan homogen.
4.2 Saran
Saran yang diberikan, antara lain:
Untuk penelitian selanjutnya, disarankan menggunakan jumlah sampel yang lebih besar dan seimbang di setiap kelompok tipe pekerjaan agar hasil analisis MANOVA lebih kuat secara statistik dan lebih mudah digeneralisasikan.
Menambahkan variabel dependen yang juga mencerminkan status sosial atau ekonomi, seperti jam kerja, kepuasan kerja, atau pengalaman kerja, untuk memperoleh pemahaman yang lebih menyeluruh.
Hasil ini dapat menjadi acuan bagi pengambil keputusan dalam merancang program pelatihan atau pengembangan karier yang memperhatikan latar belakang pekerjaan individu, karena variasi jenis pekerjaan ternyata memiliki hubungan yang signifikan dengan faktor pendidikan, pendapatan, dan prestise.
5 Daftar Pustaka
Basrowi and S. Juariyah, “ANALISIS KONDISI SOSIAL EKONOMI DAN TINGKAT PENDIDIKAN MASYARAKAT DESA SRIGADING, KECAMATAN LABUHAN MARINGGAI, KABUPATEN LAMPUNG TIMUR,” Apr. 2010, doi: https://doi.org/10.21831/jep.v1i1.577.
B. Dan, Jumlah Proyek Yang Dikerjakan Menggunakan et al., “PENGARUH TINGKAT GAJI TERHADAP RATA-RATA JAM KERJA PER,” Jurnal Sosial Dan Humaniora, vol. 2, no. 2, pp. 89–102, 2024, doi: 10.62017/arima.
L. D. Martias, “STATISTIKA DESKRIPTIF SEBAGAI KUMPULAN INFORMASI,” Fihrs: Jurnal Ilmu Perpustakaan dan Informasi, vol. 16, no. 1, p. 40, Jun. 2021, doi: 10.14421/fhrs.2021.161.40-59.
T. H. Setiawan, “EFEKTIVITAS MEDIA PEMBELAJARAN TERHADAP PENALARAN DAN KOMUNIKASI MATEMATIKA SISWA (Eksperimen pada SMK Islam se-Kota Tangerang Selatan),” Jurnal Saintika Unpam : Jurnal Sains dan Matematika Unpam, vol. 1, no. 1, p. 56, Aug. 2018, doi: 10.32493/jsmu.v1i1.1603.
I. Prameswari Amanda, “ANALISIS PENGARUH GAYA KEPEMIMPINAN DEMOKRATIS, PERMISIF DAN OTORITER TERHADAP KINERJA GURU DAN PROFESIONALITAS GURU PADA SEKOLAH TAMAN DEWASA SE-KODYA YOGYAKARTA DENGAN MANOVA A’yunin Sofro,” 2018.
I. Fauzi Lestari et al., “Program Studi Pendidikan Matematika FKIP UMS ANALISIS MANOVA SATU ARAH PADA DATA STATUS GIZI BALITA DI INDONESIA TAHUN 2015”, [Online]. Available: www.kemkes.go.id.
D. A. Widyati, R. Rizal Isnanto, and A. Riyadi, “Analysis of Recognition Pattern Leaves uses the Method Linear Discriminant Analysis (LDA) and the Distance Minkowski,” TRANSFORMATIKA, vol. 18, no. 2, pp. 225–230, 2021.