Penerapan Multivariate Analysis of Variance (MANOVA) untuk Mengetahui Pengaruh Tipe Pekerjaan terhadap Income, Education, dan Prestige

1 Pendahuluan

1.1 Latar Belakang

Status sosial ekonomi merupakan salah satu aspek penting yang digunakan untuk melihat kedudukan individu dalam struktur masyarakat. Dalam kajian sosial dan ekonomi, status ini umumnya dinilai berdasarkan tiga indikator utama, yaitu pendapatan (income), pendidikan (education), dan prestise pekerjaan (prestige). Pendapatan mencerminkan tingkat kesejahteraan finansial seseorang, pendidikan berkaitan dengan akses terhadap ilmu dan keterampilan formal, sedangkan prestise pekerjaan menunjukkan seberapa dihargainya suatu profesi oleh masyarakat. Ketiga indikator tersebut tidak berdiri sendiri, melainkan saling berkaitan dan membentuk persepsi sosial terhadap posisi individu di dalam masyarakat [1]

Penelitian ini menggunakan Duncan’s Occupational Prestige Dataset, yaitu data yang berisi informasi tentang 45 jenis pekerjaan di Amerika Serikat. Dataset ini merupakan salah satu data klasik dalam studi sosiologi dan tersedia secara resmi dalam package carData pada perangkat lunak R. Variabel-variabel yang digunakan dalam penelitian ini meliputi type (jenis pekerjaan) sebagai variabel independen, dan income, education, serta prestige sebagai variabel dependen. Jenis pekerjaan dikelompokkan ke dalam tiga kategori, yaitu professional, white-collar, dan blue-collar. Dengan memanfaatkan data ini, penelitian bertujuan untuk memahami bagaimana perbedaan jenis pekerjaan berpengaruh terhadap kondisi sosial ekonomi berdasarkan tiga indikator yang diamati.

Untuk menjawab tujuan tersebut, digunakan metode Multivariate Analysis of Variance (MANOVA), yaitu pendekatan analisis multivariat yang memungkinkan pengujian pengaruh satu variabel independen terhadap lebih dari satu variabel dependen secara bersamaan. MANOVA dipilih karena ketiga variabel sosial ekonomi yang digunakan dalam penelitian ini saling berkaitan, sehingga pendekatan ini memungkinkan pemahaman yang lebih utuh terhadap pengaruh jenis pekerjaan. Hasil analisis ini diharapkan dapat memberikan gambaran yang lebih mendalam mengenai keterkaitan antara struktur pekerjaan dan dimensi sosial ekonomi, serta dapat dijadikan sebagai dasar pertimbangan dalam kajian sosial berbasis data[2].

1.2 Rumusan Masalah

Apakah terdapat perbedaan yang mencolok dalam status sosial ekonomi (pendapatan, pendidikan, dan prestise pekerjaan) berdasarkan jenis pekerjaan (professional, white-collar, dan blue-collar)?
Bagaimana variasi jenis pekerjaan memengaruhi aspek-aspek status sosial ekonomi, seperti tingkat pendapatan, jenjang pendidikan, dan prestise pekerjaan?

1.3 Tujuan Penelitian

Menelusuri adanya perbedaan dalam status sosial ekonomi berdasarkan klasifikasi jenis pekerjaan melalui metode Multivariate Analysis of Variance (MANOVA).
Menilai pengaruh jenis pekerjaan terhadap ketiga indikator sosial ekonomi seperti pendapatan, tingkat pendidikan, dan prestise pekerjaan dalam satu kerangka analisis terpadu.

1.4 Manfaat Penelitian

Memberikan sudut pandang yang lebih luas mengenai kaitan antara jenis pekerjaan dengan kondisi sosial ekonomi, yang dapat dimanfaatkan dalam studi sosiologis maupun penyusunan kebijakan publik.
Menyediakan landasan analisis bagi para pembuat kebijakan dalam merancang program pembangunan sosial dan ekonomi yang responsif terhadap ketimpangan berdasarkan jenis pekerjaan.

2 Tinjauan Pustaka

2.1 Statistika Deskriptif

Statistika deskriptif merupakan cabang statistika yang digunakan untuk menghimpun, mengelompokkan, mengolah, dan menyajikan data sehingga dapat memberikan gambaran yang jelas mengenai suatu kondisi atau peristiwa tertentu. Tujuannya adalah untuk mempermudah pemahaman terhadap data melalui penyajian yang informatif, tanpa melakukan penarikan kesimpulan atau generalisasi [3].

2.2 Uji Asumsi MANOVA

2.2.1 Uji Normalitas Multivariat

Uji normalitas multivariat merupakan salah satu uji asumsi dalam MANOVA yang harus dipenuhi. Uji ini digunakan untuk mengetahui apakah distribusi data mendekati distribusi normal multivariat atau tidak. Dalam pengujian normalitas, hipotesis yang digunakan adalah sebagai berikut :

H0: Data berdistribusi normal multivariat.

H1: Data tidak berdistribusi normal multivariat.

Kesimpulan bahwa data berdistribusi normal multivariat atau tidak diputuskan dengan kaidah pengujian tolak H0 jika nilai p-value< \(\alpha\).

2.2.2 Uji Homogenitas Matriks Varians-Kovarians

Uji homogenitas matriks varians-kovarians merupakan uji asumsi multivariat yang harus dipenuhi juga selain normalitas. Uji ini menggunakan uji statistik Box’s M, hipotesis yang digunakan adalah sebagai berikut [4]: \(H_0: \Sigma_1 = \Sigma_2 = \Sigma_3 \quad \text{(struktur matriks varians-kovarians antar kelompok pekerjaan adalah homogen)}\)

\(H_1:\) Minimal satu \(\Sigma_i \ne \Sigma_j\) untuk \(i \ne j\) (terdapat perbedaan struktur matriks varians-kovarians antar kelompok pekerjaan)

Statistik uji Box’s M dihitung menggunakan rumus pada persamaan (1).

\[ X^2 = -2(1 - C1) \left[ \frac{1}{2} \sum_{i=1}^{k} v_i \ln |S_i| - \frac{1}{2} \ln |S_{pool}| \sum_{i=1}^{k} v_i \right] \tag{1} \]

Dimana:
\(k\): banyaknya kelompok tipe pekerjaan
\(s_i\): varians data pada kelompok ke-\(i\)
\(v_i\): \(n_i - 1\)
\(n_i\): banyaknya data pada kelompok ke-\(i\)

Matriks kovarians gabungan (pooled covariance matrix) dihitung sebagai:

\[ S_{pool} = \frac{\sum_{i=1}^{k} v_i S_i}{\sum_{i=1}^{k} S_i} \tag{2} \]

Sedangkan konstanta koreksi \(C_1\) didefinisikan sebagai:

\[ C_1 = \left[ \sum_{i=1}^{k} \frac{1}{v_i} - \frac{1}{\sum_{i=1}^{k} v_i} \right] \left[ \frac{2p^2 + 3p - 1}{6(p+1)(k-1)} \right] \tag{3} \]

Dimana \(p = 3\), jumlah variabel dependen (income, education, prestige). Kesimpulan bahwa data antar kelompok terdapat kesamaan varians-kovarians atau tidak diputuskan dengan kaidah pengujian:

Tolak \(H_0\) jika nilai \(X^2 \geq \chi^2_{\frac{1}{2}(k-1)(p+1)}\) dengan \(p\)-value < \(\alpha\).

2.3 Uji MANOVA (Multivariate Analysis of Variance)

MANOVA satu arah merupakan perluasan dari metode ANOVA satu arah. Metode ini digunakan untuk menguji apakah beberapa kelompok populasi (yang berasal dari populasi yang sama) memiliki rata-rata multivariat yang setara pada sejumlah variabel dependen atau variabel perlakuan yang diamati dalam suatu penelitian [5]. Model umum dari MANOVA satu arah adalah [6]:

\[ Y_{ijk} = \mu_{ik} + \tau_{ik} + \varepsilon_{ijk} \tag{4} \]

Dimana:
\(i = 1, 2, 3\) : Kelompok tipe pekerjaan (1 = blue collar, 2 = white collar, 3 = professional)
\(j = 1, 2, ..., n_i\) : individu ke-\(j\) dalam tiap kelompok pekerjaan
\(k = 1, 2, 3\) : Variabel dependen (1 = income, 2 = education, 3 = prestige)
\(Y_{ijk}\) : nilai pengamatan dari respon ke-\(k\) dan ulangan ke-\(j\) yang memperoleh perlakuan ke-\(i\)
\(\mu_{ik}\) : nilai rataan umum dari respon ke-\(k\)
\(\tau_{ik}\) : pengaruh dari perlakuan (tipe pekerjaan) ke-\(i\) terhadap respon ke-\(k\)
\(\varepsilon_{ijk}\) : pengaruh galat yang timbul pada respon ke-\(k\) dari ulangan ke-\(j\) dan perlakuan ke-\(i\)

Hipotesis yang digunakan dalam uji Manova adalah: \[H_0: \tau_1 = \tau_2 = \cdots = \tau_g = 0\]Artinya tidak terdapat perbedaan rata-rata multivariat antar ketiga kelompok pekerjaan.

\[H_1: \tau_l \ne 0, \quad l = 1, 2, \dots, g\](Minimal terdapat satu kelompok pekerjaan yang memiliki perbedaan rata-rata multivariat terhadap salah satu variabel dependen).

Keputusan yang diambil adalah tolak \(H_0\) jika nilai p-value < \(\alpha\).

Dalam analisis MANOVA, terdapat beberapa jenis statistik uji yang dapat digunakan untuk menentukan perbedaan antar kelompok. Pemilihan statistik uji ini bergantung pada kondisi data dan terpenuhinya asumsi-asumsi dasar, antara lain:

Pillai’s Trace direkomendasikan ketika asumsi homogenitas matriks varians-kovarians tidak terpenuhi, ukuran sampel relatif kecil, atau ketika hasil pengujian antar variabel tidak konsisten, misalnya sebagian variabel menunjukkan perbedaan signifikan sementara yang lain tidak.
Wilks’ Lambda umum digunakan apabila data terdiri atas lebih dari dua kelompok variabel independen dan asumsi homogenitas matriks varians-kovarians terpenuhi, serta dianggap sebagai statistik uji yang paling sering diterapkan dalam praktik.
Hotelling’s Trace lebih sesuai digunakan ketika hanya terdapat dua kelompok pada variabel independen.
Roy’s Largest Root digunakan dalam kondisi di mana asumsi homogenitas matriks varians-kovarians terpenuhi, dan fokus pengujian diarahkan pada variabel yang memberikan kontribusi paling besar terhadap perbedaan antar kelompok.

2.4 Uji Post-Hoc

Metode Linear Discriminant Analysis (LDA) digunakan untuk melakukan ekstraksi fitur dengan tujuan memisahkan data ke dalam beberapa kelas yang berbeda. Teknik ini bekerja dengan memaksimalkan variansi antar kelas (between-class scatter) dan meminimalkan variansi dalam kelas (within-class scatter), sehingga menghasilkan pemisahan yang lebih jelas antar kelompok. Dalam penerapannya, posisi dataset tetap, namun distribusi data antar kelas menjadi lebih terpisah. Hal ini membuat jarak antar kelas meningkat, sementara jarak antar data dalam satu kelas menjadi lebih rapat [7].

2.5 Data

Data yang digunakan adalah data sekunder yang dapat ditemukan dalam pustaka CarData disoftware Rstudio. variabel yang digunakan adalah sebagai berikut.

• Variabel X (Tipe pekerjaan) Terdapat 3 tipe pekerjaan, yaitu:

Blue collar ( Pekerjaan fisik/manual seperti tukang atau mekanik)
White collar (Pekerjaan kantoran seperti staf administrasi)
Professional (Pekerjaan profesional yang memerlukan keahlian khusus, seperti dokter atau pengacara)

• Variabel Y1 (income) : Skor tingkat pendapatan untuk masing-masing pekerjaan dalam rentang skala 0–100

• Variabel Y2 (education): Skor rata-rata lama pendidikan (dalam tahun) yang dibutuhkan untuk masing-masing pekerjaan, dinyatakan dalam skala 0–100.

• Variabel Y3 (prestige): Tingkat prestise sosial suatu pekerjaan berdasarkan penilaian masyarakat (skala 0–100)

Tabel 1 Data Duncan

## Warning: package 'carData' was built under R version 4.4.3

	type	income	education	prestige
accountant	prof	62	86	82
pilot	prof	72	76	83
architect	prof	75	92	90
author	prof	55	90	76
chemist	prof	64	86	90
minister	prof	21	84	87
professor	prof	64	93	93
dentist	prof	80	100	90
reporter	wc	67	87	52
engineer	prof	72	86	88
undertaker	prof	42	74	57
lawyer	prof	76	98	89
physician	prof	76	97	97
welfare.worker	prof	41	84	59
teacher	prof	48	91	73
conductor	wc	76	34	38
contractor	prof	53	45	76
factory.owner	prof	60	56	81
store.manager	prof	42	44	45
banker	prof	78	82	92
bookkeeper	wc	29	72	39
mail.carrier	wc	48	55	34
insurance.agent	wc	55	71	41
store.clerk	wc	29	50	16
carpenter	bc	21	23	33
electrician	bc	47	39	53
RR.engineer	bc	81	28	67
machinist	bc	36	32	57
auto.repairman	bc	22	22	26
plumber	bc	44	25	29
gas.stn.attendant	bc	15	29	10
coal.miner	bc	7	7	15
streetcar.motorman	bc	42	26	19
taxi.driver	bc	9	19	10
truck.driver	bc	21	15	13
machine.operator	bc	21	20	24
barber	bc	16	26	20
bartender	bc	16	28	7
shoe.shiner	bc	9	17	3
cook	bc	14	22	16
soda.clerk	bc	12	30	6
watchman	bc	17	25	11
janitor	bc	7	20	8
policeman	bc	34	47	41
waiter	bc	8	32	10

3 Hasil dan Pembahasan

3.1 Library yang dibutuhkan

library yang digunakan dalam analisis data ini sebagai berikut :

library(MVN)

## Warning: package 'MVN' was built under R version 4.4.1

library(MVTests)

## Warning: package 'MVTests' was built under R version 4.4.3

## 
## Attaching package: 'MVTests'

## The following object is masked from 'package:datasets':
## 
##     iris

library(profileR)

## Warning: package 'profileR' was built under R version 4.4.3

## Loading required package: ggplot2

## Warning: package 'ggplot2' was built under R version 4.4.3

## Loading required package: RColorBrewer

## Loading required package: reshape

## Loading required package: lavaan

## Warning: package 'lavaan' was built under R version 4.4.3

## This is lavaan 0.6-19
## lavaan is FREE software! Please report any bugs.

library(carData)     
library(MASS)       
library(ggplot2)    
library(rmarkdown)

Kegunaan library:

MVN: library ini digunakan untuk menguji data multivariat normal

MVTest: Library ini digunakan untuk menguji hipotesis terkait vektor rata-rata dan matriks kovarians, baik untuk satu sampel, dua sampel independen, maupun sampel berpasangan.

profileR: library ini digunakan untuk melakukan analisis profil melalui pendekatan multivariat. Paket ini membantu membandingkan pola skor antar kelompok, menyediakan visualisasi yang intuitif, serta mendukung validasi silang untuk menguji keandalan model.

carData: library yang digunakan untuk menyediakan kumpulan dataset contoh yang digunakan untuk latihan analisis regresi dan statistik terapan bersama paket car dalam analisis regresi, ANOVA, dan teknik statistik terapan lainnya.

MASS: Library ini digunakan untuk memuat paket MASS (Modern Applied Statistics with S) yang berisi berbagai fungsi statistik lanjutan, seperti regresi, MANOVA, dan analisis diskriminan. Paket ini sering digunakan dalam analisis multivariat maupun pemodelan statistik kompleks.

ggplot2: Library ini digunakan untuk memuat paket ggplot2, yaitu paket visualisasi data yang berbasis konsep grammar of graphics. Dengan ggplot2, pengguna dapat membuat berbagai jenis grafik yang estetis dan informatif seperti scatter plot, bar chart, boxplot, dan lainnya dengan cara yang fleksibel dan mudah disesuaikan.

rmarkdown: Library ini digunakan untuk memuat paket rmarkdown, yang memungkinkan pengguna untuk membuat laporan dinamis dalam berbagai format seperti HTML, PDF, atau Word. Paket ini sangat berguna untuk menggabungkan teks, kode R, dan output analisis dalam satu dokumen yang terstruktur dan otomatis.

3.2 Input Data

Sebelum melakukan pengujian terhadap data, terlebih dahulu dilakukan proses input data dengan memanggil dataset bawaan bernama Duncan dari library carData. Dataset ini kemudian disalin ke dalam objek baru bernama duncan untuk memudahkan analisis selanjutnya. Berikut adalah syntax yang digunakan:

data("Duncan") 
duncan <- Duncan 
head(duncan)

##            type income education prestige
## accountant prof     62        86       82
## pilot      prof     72        76       83
## architect  prof     75        92       90
## author     prof     55        90       76
## chemist    prof     64        86       90
## minister   prof     21        84       87

3.3 Membuat Data Frame

Pada tahap ini, dataset duncan diubah menjadi format data frame yang biasa digunakan dalam analisis data di R. Ini bertujuan agar dataset lebih mudah diakses, dimanipulasi, dan ditampilkan melalui jendela tampilan data (View) di RStudio.

duncan_df <- as.data.frame(duncan) 
View(duncan_df )

3.4 Memilih Variabel Dependen (Bivariat)

Setelah data berhasil dimuat, langkah selanjutnya adalah menentukan variabel-variabel dependen yang akan dianalisis secara bersamaan melalui uji MANOVA. Dalam analisis ini, variabel dependen yang dipilih harus bersifat numerik dan saling berkorelasi. Hal ini penting karena MANOVA bertujuan untuk menguji perbedaan rata-rata dari beberapa variabel dependen berdasarkan satu atau lebih variabel independen.

bivariat <- duncan_df[, c("income", "education", "prestige")] 
head(bivariat)

##            income education prestige
## accountant     62        86       82
## pilot          72        76       83
## architect      75        92       90
## author         55        90       76
## chemist        64        86       90
## minister       21        84       87

3.5 Statistika Deskriptif

Tahap statistik deskriptif dilakukan untuk memahami karakteristik dasar dari masing-masing variabel yang dianalisis. Melalui informasi seperti nilai rata-rata, standar deviasi, serta nilai minimum dan maksimum, peneliti dapat memperoleh gambaran umum mengenai pola dan sebaran data sebelum dilakukan pengujian MANOVA.

summary(bivariat)

##      income        education         prestige    
##  Min.   : 7.00   Min.   :  7.00   Min.   : 3.00  
##  1st Qu.:21.00   1st Qu.: 26.00   1st Qu.:16.00  
##  Median :42.00   Median : 45.00   Median :41.00  
##  Mean   :41.87   Mean   : 52.56   Mean   :47.69  
##  3rd Qu.:64.00   3rd Qu.: 84.00   3rd Qu.:81.00  
##  Max.   :81.00   Max.   :100.00   Max.   :97.00

Dari hasil tersebut diperoleh bahwa:

• Rata-rata pendapatan (income) menunjukkan angka 41.87, yang menggambarkan bahwa mayoritas individu dalam dataset memiliki tingkat pendapatan yang termasuk dalam kategori menengah.

• Rata-rata tingkat pendidikan (education) sebesar 52.56 adalah nilai tertinggi di antara ketiga variabel, yang menunjukkan bahwa sebagian besar individu memiliki pendidikan yang cukup tinggi.

• Tingkat prestise rata-rata pekerjaan adalah 47.69, menunjukkan bahwa mayoritas pekerjaan dalam dataset dianggap memiliki status sosial yang relatif baik atau dihargai.

Visualisasi Data dengan Boxplot

Boxplot adalah visualisasi grafis yang digunakan untuk menampilkan distribusi data numerik secara ringkas melalui lima nilai statistik utama: minimum, kuartil pertama, median, kuartil ketiga, dan maksimum. Dalam konteks ini, boxplot digunakan untuk membandingkan variabel seperti income, education, dan prestige antar jenis pekerjaan (blue collar, white collar, dan professional). Visualisasi ini memudahkan dalam melihat perbedaan median, penyebaran data, serta mendeteksi adanya outlier pada masing-masing kelompok pekerjaan.

library(ggplot2) 
# Boxplot Income 
ggplot(duncan_df, aes(x = type, y = income, fill = type)) + 
geom_boxplot() + 
scale_fill_manual(values = c("bc" = "salmon", "prof" = "forestgreen", "wc" 
= "dodgerblue")) + 
labs(title = "Boxplot Income", y = "Income", x = "Type") + 
theme_minimal(base_size = 14)

Boxplot variabel income menunjukkan perbedaan distribusi pendapatan di antara ketiga kelompok pekerjaan. Kelompok professional (prof) memiliki median pendapatan tertinggi, diikuti oleh white collar (wc), dan blue collar (bc) memiliki median pendapatan terendah. Rentang interkuartil (IQR) kelompok professional juga lebih lebar, yang mengindikasikan variasi pendapatan yang lebih besar dalam kelompok ini. Selain itu, terdapat outlier pada kelompok blue collar yang menunjukkan adanya individu dengan pendapatan yang relatif tinggi dibandingkan mayoritas anggota kelompok tersebut. Distribusi ini mengindikasikan bahwa pekerjaan professional cenderung mendapatkan penghasilan yang lebih tinggi dan bervariasi dibandingkan kelompok lainnya.

# Boxplot Education 
ggplot(duncan_df, aes(x = type, y = education, fill = type)) + 
geom_boxplot() + 
scale_fill_manual(values = c("bc" = "salmon", "prof" = "forestgreen", "wc" 
= "dodgerblue")) + 
labs(title = "Boxplot Education", y = "Education", x = "Type") + 
theme_minimal(base_size = 14)

Pada boxplot variabel education, pola serupa terlihat. Kelompok professional menunjukkan median tingkat pendidikan tertinggi, diikuti oleh white collar dan blue collar. Kelompok professional juga memiliki rentang pendidikan yang sempit dan relatif tinggi, mengindikasikan homogenitas tingkat pendidikan yang tinggi pada kelompok ini. Sebaliknya, kelompok blue collar memperlihatkan distribusi pendidikan yang lebih rendah dengan beberapa outlier yang menunjukkan individu dengan tingkat pendidikan lebih tinggi dibandingkan anggota lain di kelompok tersebut. Hal ini menegaskan hubungan kuat antara jenis pekerjaan dan tingkat pendidikan yang diperoleh.

# Boxplot Prestige 
ggplot(duncan_df, aes(x = type, y = prestige, fill = type)) + 
geom_boxplot() + 
scale_fill_manual(values = c("bc" = "salmon", "prof" = "forestgreen", "wc" 
= "dodgerblue")) + 
labs(title = "Boxplot Prestige", y = "Prestige", x = "Type") + 
theme_minimal(base_size = 14)

Untuk variabel prestige, yang menggambarkan prestise pekerjaan, kelompok professional kembali menempati posisi tertinggi dalam median prestise, diikuti oleh white collar dan blue collar. Rentang prestise pada kelompok professional cukup lebar, menandakan variasi prestise yang cukup signifikan dalam pekerjaan professional. Kelompok blue collar menunjukkan rentang dan median prestise terendah, serta beberapa outlier yang menandakan adanya variasi prestise yang tidak biasa di dalam kelompok ini. Distribusi ini memperlihatkan adanya perbedaan jelas dalam penghargaan sosial yang diterima oleh ketiga kelompok pekerjaan tersebut.

Secara keseluruhan, ketiga boxplot ini memberikan gambaran visual yang kuat tentang perbedaan karakteristik pendapatan, pendidikan, dan prestise antar jenis pekerjaan. Kelompok professional secara konsisten menunjukkan nilai median dan rentang yang lebih tinggi pada ketiga variabel, mencerminkan posisi sosial dan ekonomi yang lebih baik dibanding kelompok blue collar dan white collar. Perbedaan ini mendukung hipotesis awal bahwa tipe pekerjaan berpengaruh signifikan terhadap tingkat pendapatan, pendidikan, dan prestise.

3.6 Uji Asumsi Normalitas Multivariat

Uji ini dilaksanakan untuk memastikan bahwa data yang dipakai dalam analisis MANOVA memenuhi asumsi distribusi normal multivariat. Analisis ini menggunakan Mardia’s test karena mampu menguji normalitas multivariat secara langsung melalui skewness dan kurtosis, sehingga sesuai untuk analisis seperti MANOVA yang melibatkan hubungan antar variabel.

# Q-Q Plot Income 
qqnorm(duncan_df$income, main = "Q-Q Plot - Income") 
qqline(duncan_df$income, col = "black", lwd = 2)

# Q-Q Plot Education 
qqnorm(duncan_df$education, main = "Q-Q Plot - Education") 
qqline(duncan_df$education, col = "black", lwd = 2)

# Q-Q Plot Prestige 
qqnorm(duncan_df$prestige, main = "Q-Q Plot - Prestige") 
qqline(duncan_df$prestige, col = "black", lwd = 2)

Berdasarkan hasil Q-Q plot, distribusi ketiga variabel (income, education, dan prestige) yaitu variabel income menunjukkan pola sebaran yang cukup mengikuti garis diagonal, dengan sedikit penyimpangan di bagian ujung bawah dan atas. Ini mengindikasikan bahwa data income cenderung mendekati distribusi normal. Hal yang serupa juga terlihat pada variabel education, di mana sebagian besar titik mengikuti garis lurus dengan deviasi ringan di ekor distribusi. Oleh karena itu, data education juga dapat dianggap memiliki distribusi yang hampir normal.

Sementara itu, variabel prestige menunjukkan penyimpangan yang lebih jelas dari garis diagonal, terutama pada nilai-nilai ekstrim di bagian bawah dan atas plot. Hal ini menunjukkan adanya ketidaksesuaian dengan distribusi normal, kemungkinan karena pengaruh outlier atau bentuk distribusi yang tidak simetris. Dengan demikian, secara keseluruhan dapat disimpulkan bahwa income dan education mendekati distribusi normal, sedangkan prestige menunjukkan deviasi yang lebih besar dan tidak sepenuhnya memenuhi asumsi normalitas. Hasil uji normalitas multivariat menggunakan metode Mardia sebagai berikut.

• Hipotesis

H0 ∶ Data berdistribusi normal multivariat

H1 ∶ Data tidak berdistribusi normal multivariat

• Taraf Signifikansi

α = 0.05

• Daerah Kritis

Tolak H0 jika p-value < α

• Statistik Uji

hasil_normalitas_awal <- mvn(data = bivariat, mvnTest = "mardia", 
univariateTest = "SW") 
hasil_normalitas_awal$multivariateNormality

##              Test         Statistic           p value Result
## 1 Mardia Skewness  8.18343860802632 0.610924234831225    YES
## 2 Mardia Kurtosis 0.701878260360718 0.482755087538423    YES
## 3             MVN              <NA>              <NA>    YES

• Keputusan

Berdasarkan hasil pengujian di atas didapatkan p-value untuk y1, y2 dan y3 > 0.05 (α), sehingga gagal untuk tolak H0

• Kesimpulan

Dengan menggunakan tingkat kepercayaan 95%, didapatkan data gagal tolak H0. Dengan demikian, didapatkan kesimpulan bahwa data berdistribusi normal multivariat.

3.7 Uji Asumsi Homogenitas

Uji asumsi homogenitas dilakukan untuk memastikan bahwa matriks kovarians di antara kelompok dalam analisis multivariat, seperti MANOVA adalah seragam (homogen). Ini penting karena MANOVA menganggap bahwa variasi data antar kelompok adalah serupa. Karena itu, digunakan uji Box’s M yang dirancang khusus untuk menguji kesamaan matriks kovarian di antara beberapa kelompok.

ujiboxm <- BoxM(data = bivariat, group= duncan_df$type)

Dari hasil uji homoskedastisitas diatas dapat dilakukan uji hipotesis seperti berikut:

• Hipotesis

H0 ∶ Asumsi Homoskedastisitas terpenuhi

H1 ∶ Asumsi Homoskedastisitas tidak terpenuhi

• Taraf Signifikansi

α = 0.05

• Daerah Kritis

Tolak H0 jika p-value < α

• Statistik Uji

summary(ujiboxm)

##        Box's M Test 
## 
## Chi-Squared Value = 18.26024 , df = 12  and p-value: 0.108

• Keputusan

p−value(0.108) > α(0.05), Maka gagal untuk tolak H0

• Kesimpulan

Dengan menggunakan tingkat kepercayaan 95%, dapat disimpulkan bahwa matriks varians-kovarians data homogen untuk setiap perlakuan maka asumsi homogenitas terpenuhi dan hasil MANOVA dapat diandalkan.

3.8 Uji Manova

Uji MANOVA dilakukan untuk menentukan apakah terdapat perbedaan signifikan pada kombinasi variabel dependen berdasarkan kategori variabel independen. Empat metode diterapkan, yaitu Pillai’s Trace yang paling tahan terhadap pelanggaran asumsi, Wilks’ Lambda yang paling sering digunakan tetapi sensitif terhadap asumsi, Hotelling-Lawley Trace yang ideal untuk data besar, dan Roy’s Largest Root yang menekankan pengaruh terbesar tetapi kurang stabil. Pemanfaatan keempatnya membantu menjamin konsistensi hasil analisis.

ujimanova <- manova(cbind(income, education, prestige) ~ type, data = 
duncan_df)

Selanjutnya dilakukan uji hipotesis menggunakan analisis MANOVA dengan hasil sebagai berikut.

• Hipotesis

H0 : τ₁ = τ₂ = τ₃ (Artinya: Tipe pekerjaan (blue collar, white collar, dan professional) tidak berpengaruh secara signifikan terhadap income, education, dan prestige)

H1 ∶∃i ≠ j, sehingga τᵢ ≠ τⱼ, dengan i, j ∈ {1, 2, 3} (Artinya, Terdapat minimal satu pasangan tipe pekerjaan yang memiliki pengaruh signifikan terhadap income, education, dan prestige)

• Taraf Signifikansi

α = 0.05

• Daerah Kritis

Tolak H0 jika p-value < α

• Statistik Uji

summary(ujimanova, test = "Pillai")

##           Df Pillai approx F num Df den Df    Pr(>F)    
## type       2 1.2587   23.204      6     82 7.831e-16 ***
## Residuals 42                                            
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(ujimanova, test = "Wilks")

##           Df    Wilks approx F num Df den Df    Pr(>F)    
## type       2 0.099232   28.993      6     80 < 2.2e-16 ***
## Residuals 42                                              
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(ujimanova, test = "Hotelling-Lawley")

##           Df Hotelling-Lawley approx F num Df den Df    Pr(>F)    
## type       2           5.4707   35.559      6     78 < 2.2e-16 ***
## Residuals 42                                                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(ujimanova, test = "Roy")

##           Df    Roy approx F num Df den Df    Pr(>F)    
## type       2 4.7039   64.287      3     41 1.496e-15 ***
## Residuals 42                                            
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

• Keputusan

Tabel 2 Keputusan uji Manova

## Warning: package 'knitr' was built under R version 4.4.3

## Warning: package 'kableExtra' was built under R version 4.4.3

Tabel 2 Keputusan uji Manova
Metode	P.Value	Tanda	Alpha	Keputusan
Pillai	7.831e-16	<	0.05	Tolak H0
Wilks	< 2.2e-16	<	0.05	Tolak H0
Hotelling-lawley	< 2.2e-16	<	0.05	Tolak H0
Roy	1.496e-15	<	0.05	Tolak H0

• Kesimpulan

Dengan menggunakan tingkat kepercayaan 95%, hasil menunjukan tolak H0, yang artinya terdapat minimal satu pasangan tipe pekerjaan (blue collar, white collar, dan professional) yang memiliki pengaruh signifikan terhadap income, education, dan prestige.

3.9 Uji Post Hoc

Nilai p yang mendekati nol dan efek yang besar menunjukkan bahwa terdapat perbedaan signifikan antar kelompok. Tapi, kita belum tahu pasti kelompok mana yang beda. Oleh karena itu, digunakan Linear Discriminant Analysis (LDA) untuk mengidentifikasi pemisahan antar kelompok secara lebih jelas. Dengan menggunakan LDA, hasilnya dapat divisualisasikan dalam bentuk diagram pencar (scatter plot) berdasarkan dua komponen diskriminan utama (LD1 dan LD2). Setiap titik akan diwarnai berdasarkan kategori variabel independen, sehingga pola pemisahan antar kelompok akan terlihat jelas. Analisis ini dapat dilakukan di R menggunakan fungsi lda() dari paket MASS.

lda_model <- lda(type ~ income + education + prestige, data = duncan_df)
lda_model

## Call:
## lda(type ~ income + education + prestige, data = duncan_df)
## 
## Prior probabilities of groups:
##        bc      prof        wc 
## 0.4666667 0.4000000 0.1333333 
## 
## Group means:
##        income education prestige
## bc   23.76190  25.33333 22.76190
## prof 60.05556  81.33333 80.44444
## wc   50.66667  61.50000 36.66667
## 
## Coefficients of linear discriminants:
##                   LD1         LD2
## income    -0.01290105  0.06741434
## education  0.04563192  0.05629466
## prestige   0.04204763 -0.09607074
## 
## Proportion of trace:
##    LD1    LD2 
## 0.8598 0.1402

Berdasarkan hasil analisis Linear Discriminant Analysis (LDA), kelompok pekerjaan didominasi oleh kategori blue-collar (46,67%) dan professional (40%). Kelompok professional memiliki rata-rata pendapatan, pendidikan, dan prestise yang lebih tinggi dibanding kelompok lainnya. Komponen LD1 paling berpengaruh dalam memisahkan kelompok, terutama dipengaruhi oleh pendidikan dan prestise. LD1 menjelaskan 86% variasi antar kelompok, sehingga menjadi faktor utama dalam membedakan tipe pekerjaan berdasarkan ketiga variabel tersebut. Potongan kode di bawah ini menggunakan fungsi predict() untuk memperoleh nilai dari komponen diskriminan linear (LD1 dan LD2), kemudian hasilnya digabungkan dengan variabel independen agar dapat divisualisasikan berdasarkan kelompoknya.

# Buat data frame hasil prediksi
lda_pred <- predict(lda_model)$x
lda_df <- data.frame(
  type = duncan_df$type,
  lda = lda_pred
)

Tabel 2 Hasil LDA
	type	lda.LD1	lda.LD2
accountant	prof	2.7090942	-0.0562745
pilot	prof	2.1658121	-0.0411485
architect	prof	3.1515531	0.3893140
author	prof	2.7296434	0.2734282
chemist	prof	3.0196731	-0.6900117
minister	prof	3.3570114	-3.4132056
professor	prof	3.4652395	-0.5841613
dentist	prof	3.4521033	1.1767431
reporter	wc	1.4287919	3.2192140
engineer	prof	2.8323695	0.0414445
undertaker	prof	1.3683413	0.3216711
lawyer	prof	3.3703960	0.8905671
physician	prof	3.6611451	0.0657065
welfare.worker	prof	1.9216568	0.6250619
teacher	prof	2.7394398	0.1460346
conductor	wc	-1.6944763	2.1873162
contractor	prof	0.7020089	-2.3946604
factory.owner	prof	1.3238909	-1.7838724
store.manager	prof	-0.5051880	-0.2143200
banker	prof	2.7406260	-0.1635311
bookkeeper	wc	0.6879337	1.0619686
mail.carrier	wc	-0.5431671	1.8661855
insurance.agent	wc	0.3909698	2.5663054
store.clerk	wc	-1.2830641	2.0331129
carpenter	bc	-1.6971080	-1.6593603
electrician	bc	-0.4614718	-0.9272875
RR.engineer	bc	-0.8133918	-0.5994315
machinist	bc	-0.4707933	-2.4471909
auto.repairman	bc	-2.0499744	-0.9757455
plumber	bc	-2.0707587	0.3880418
gas.stn.attendant	bc	-2.3130056	0.4835486
coal.miner	bc	-3.0034614	-1.7746025
streetcar.motorman	bc	-2.4198010	1.2702152
taxi.driver	bc	-2.6919186	-0.4838842
truck.driver	bc	-2.9031160	-0.1883029
machine.operator	bc	-2.2124324	-0.9636077
barber	bc	-2.0423261	-0.5786285
bartender	bc	-2.4976815	0.7828805
shoe.shiner	bc	-3.0775158	0.0760217
cook	bc	-2.3672423	-0.5543529
soda.clerk	bc	-2.3968611	0.7218831
watchman	bc	-2.4792878	0.2971278
janitor	bc	-2.7045798	-0.3702767
policeman	bc	-0.4332744	-0.2004678
waiter	bc	-2.0858025	0.1805321

Hasil LDA menunjukkan bahwa profesi seperti physician, lawyer, dan dentist memiliki nilai LD1 tinggi, menandakan mereka termasuk kelompok professional karena nilai LD1 mereka di atas 2.5. Sebaliknya, pekerjaan seperti coal miner dan cook dengan LD1 rendah termasuk blue collar. Profesi seperti reporter dan insurance agent memiliki LD1 sedang namun LD2 tinggi, sehingga cenderung masuk kelompok white-collar karena menonjol dalam aspek seperti prestise atau gaya kerja. Langkah terakhir dalam uji post-hoc ini adalah memvisualisasikan lda_df di atas dalam bentuk diagram pencar (scatter plot).

# Visualisasi hasil LDA 
ggplot(lda_df) +
  geom_point(aes(x = lda.LD1, y = lda.LD2, color = type), size = 4) +
  theme_classic()

Berdasarkan Scatter plot hasil LDA menunjukkan bahwa kelompok pekerjaan dapat dibedakan dengan cukup jelas. Profesional cenderung berada di sisi kanan (LD1 positif), blue-collar di kiri (LD1 negatif), dan white-collar menonjol di atas (LD2 tinggi), menandakan karakteristik yang berbeda antar kelompok.

4 Kesimpulan dan Saran

4.1 Kesimpulan

Berdasarkan hasil analisis MANOVA yang telah dilakukan dengan bantuan software RStudio, dapat disimpulkan bahwa terdapat minimal satu pasangan tipe pekerjaan (blue collar, white collar, dan professional) yang memiliki pengaruh signifikan terhadap income, education, dan prestige. Hasil ini didapatkan setelah dipastikan terlebih dahulu bahwa data telah memenuhi asumsi multivariat, yaitu berdistribusi normal dan homogen.

4.2 Saran

Saran yang diberikan, antara lain:

Untuk penelitian selanjutnya, disarankan menggunakan jumlah sampel yang lebih besar dan seimbang di setiap kelompok tipe pekerjaan agar hasil analisis MANOVA lebih kuat secara statistik dan lebih mudah digeneralisasikan.
Menambahkan variabel dependen yang juga mencerminkan status sosial atau ekonomi, seperti jam kerja, kepuasan kerja, atau pengalaman kerja, untuk memperoleh pemahaman yang lebih menyeluruh.
Hasil ini dapat menjadi acuan bagi pengambil keputusan dalam merancang program pelatihan atau pengembangan karier yang memperhatikan latar belakang pekerjaan individu, karena variasi jenis pekerjaan ternyata memiliki hubungan yang signifikan dengan faktor pendidikan, pendapatan, dan prestise.

5 Daftar Pustaka

Basrowi and S. Juariyah, “ANALISIS KONDISI SOSIAL EKONOMI DAN TINGKAT PENDIDIKAN MASYARAKAT DESA SRIGADING, KECAMATAN LABUHAN MARINGGAI, KABUPATEN LAMPUNG TIMUR,” Apr. 2010, doi: https://doi.org/10.21831/jep.v1i1.577.
B. Dan, Jumlah Proyek Yang Dikerjakan Menggunakan et al., “PENGARUH TINGKAT GAJI TERHADAP RATA-RATA JAM KERJA PER,” Jurnal Sosial Dan Humaniora, vol. 2, no. 2, pp. 89–102, 2024, doi: 10.62017/arima.
L. D. Martias, “STATISTIKA DESKRIPTIF SEBAGAI KUMPULAN INFORMASI,” Fihrs: Jurnal Ilmu Perpustakaan dan Informasi, vol. 16, no. 1, p. 40, Jun. 2021, doi: 10.14421/fhrs.2021.161.40-59.
T. H. Setiawan, “EFEKTIVITAS MEDIA PEMBELAJARAN TERHADAP PENALARAN DAN KOMUNIKASI MATEMATIKA SISWA (Eksperimen pada SMK Islam se-Kota Tangerang Selatan),” Jurnal Saintika Unpam : Jurnal Sains dan Matematika Unpam, vol. 1, no. 1, p. 56, Aug. 2018, doi: 10.32493/jsmu.v1i1.1603.
I. Prameswari Amanda, “ANALISIS PENGARUH GAYA KEPEMIMPINAN DEMOKRATIS, PERMISIF DAN OTORITER TERHADAP KINERJA GURU DAN PROFESIONALITAS GURU PADA SEKOLAH TAMAN DEWASA SE-KODYA YOGYAKARTA DENGAN MANOVA A’yunin Sofro,” 2018.
I. Fauzi Lestari et al., “Program Studi Pendidikan Matematika FKIP UMS ANALISIS MANOVA SATU ARAH PADA DATA STATUS GIZI BALITA DI INDONESIA TAHUN 2015”, [Online]. Available: www.kemkes.go.id.
D. A. Widyati, R. Rizal Isnanto, and A. Riyadi, “Analysis of Recognition Pattern Leaves uses the Method Linear Discriminant Analysis (LDA) and the Distance Minkowski,” TRANSFORMATIKA, vol. 18, no. 2, pp. 225–230, 2021.