set.seed(2025)
<- data.frame(
sosial_data pendapatan = sample(100:1000, 100, replace=TRUE),
pendidikan = sample(8:20, 100, replace = TRUE),
pengalaman = sample(1:30, 100, replace = TRUE),
jam_kerja_per_minggu = sample(30:60, 100, replace = TRUE),
jumlah_anak = sample(0:5, 100, replace = TRUE),
usia = sample(22:60, 100, replace = TRUE),
status_pernikahan = sample(0:1, 100, replace = TRUE),
lokasi_kota = sample(0:1, 100, replace = TRUE),
industri = sample(0:1, 100, replace = TRUE),
pelatihan_profesional = sample(0:1, 100, replace = TRUE),
keterampilan_teknis = sample(0:1, 100, replace = TRUE)
)
Uji Asumsi Klasik
Pengertian
Uji asumsi klasik adalah serangkaian pengujian statistik yang digunakan dalam analisis regresi linier untuk memastikan bahwa model yang digunakan valid dan menghasilkan estimasi yang tidak bias. Jika asumsi-asumsi ini tidak terpenuhi, maka hasil regresi bisa menjadi tidak akurat.
Mengapa harus menggunakan uji asumsi klasik?
Uji asumsi klasik harus digunakan untuk memastikan bahwa model regresi BLUE (Best Linear Unbiased Estimator), yang berarti estimasi yang dihasilkan:
Tidak bias
Efisien (memiliki variansi terkecil)
Konsisten dalam memprediksi hubungan antar variabel
Kapan menggunakannya?
Jika melakukan regresi linier berganda untuk melihat hubungan lebih dari satu variabel.
Jika ingin memastikan hasil regresi tidak bias dan dapat diandalkan.
Jika menggunakan OLS (Ordinary Least Squares) sebagai metode estimasi dalam regresi.
Jenis-jenis uji asumsi klasik
Uji Normalitas: Untuk memastikan residual berdistribusi normal.
Digunakan untuk memvalidasi bahwa metode OLS (Ordinary Least Squares) bekerja optimal.
Contoh metode uji: Kolmogorov-Smirnov, Shapiro-Wilk, atau grafik Q-Q Plot.
Kriteria keputusan: Jika p-value > 0.05 → Data berdistribusi normal.
Uji Multikolinearitas: Untuk mendeteksi hubungan antar variabel independen.
Jika variabel independen berkorelasi tinggi, maka regresi bisa memberikan hasil yang salah.
Contoh metode uji: VIF (Variance Inflation Factor).
Kriteria keputusan: Jika VIF < 10 → Tidak ada masalah multikolinearitas.
Uji Heteroskedastisitas: Untuk mendeteksi apakah varians residual tidak konstan.
Jika heteroskedastisitas terjadi, maka model tidak efisien.
Contoh metode uji: Uji Breusch-Pagan, Uji White, atau grafik plot residual.
Kriteria keutusan: Jika p-value > 0.05 → Tidak ada heteroskedastisitas.
Uji Autokorelasi: Untuk melihat apakah residual memiliki pola tertentu dalam urutan waktu.
Jika ada autokorelasi, maka model regresi tidak valid untuk data time-series.
Contoh metode uji: Durbin-Watson test.
Jika nilai DW mendekati 2 → Tidak ada autokorelasi.
Jika nilai DW < 1 atau > 3 → Ada autokorelasi (perlu koreksi).
Contoh kasus
Uji Normalitas
Apakah residual dalam regresi antara pendapatan
dan pendidikan
berdistribusi normal?
<- lm(pendapatan~pendidikan, data=sosial_data)
model
shapiro.test(model$residuals)
Shapiro-Wilk normality test
data: model$residuals
W = 0.95114, p-value = 0.0009865
Uji Multikolinearitas
Apakah terdapat hubungan tinggi antara variabel independen dalam regresi berganda?
library(car)
<- lm(pendapatan~., data = sosial_data)
model1
vif(model1)
pendidikan pengalaman jam_kerja_per_minggu
1.102220 1.039936 1.111950
jumlah_anak usia status_pernikahan
1.054983 1.057570 1.076770
lokasi_kota industri pelatihan_profesional
1.079520 1.063853 1.012451
keterampilan_teknis
1.064316
Uji Heteroskedastisitas
Apakah varians residual tetap konstan?
library(lmtest)
Loading required package: zoo
Attaching package: 'zoo'
The following objects are masked from 'package:base':
as.Date, as.Date.numeric
bptest(model)
studentized Breusch-Pagan test
data: model
BP = 2.6502, df = 1, p-value = 0.1035
Uji Autokorelasi
Apakah residual berkorelasi satu sama lain dalam data time-series?
dwtest(model)
Durbin-Watson test
data: model
DW = 1.6724, p-value = 0.04657
alternative hypothesis: true autocorrelation is greater than 0