Analisis regresi linear berganda digunakan untuk memodelkan hubungan antara satu variabel dependen (terikat) dengan dua atau lebih variabel independen (bebas). Tujuannya adalah untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen. Dalam kasus ini, kita ingin memahami bagaimana jumlah pekerja dan jumlah susu memengaruhi total produksi.
Produksi= β0+ β1(Pekerja)+β2 (Susu)+ε
Berdasarkan data yang dimiliki:
• Variabel Dependen (Y): produksi. Ini adalah variabel yang ingin kita prediksi atau jelaskan.
• Variabel Independen (X1): pekerja. Variabel ini diasumsikan memengaruhi produksi.
• Variabel Independen (X2): susu. Variabel ini juga diasumsikan memengaruhi produksi.
data_produksi <- data.frame(
pekerja = c(5, 6, 4, 7, 6, 8, 5, 7, 6, 4),
susu = c(100, 120, 90, 130, 110, 150, 95, 140, 125, 85),
produksi = c(800, 950, 700, 1000, 870, 1150, 760, 1050, 940, 690)
)
Gunakan fungsi lm() (linear model) di R untuk membuat model regresi.
model_regresi <- lm(produksi ~ pekerja + susu, data = data_produksi)
Gunakan fungsi summary() untuk melihat ringkasan lengkap dari model regresi yang telah dibuat.
summary(model_regresi)
##
## Call:
## lm(formula = produksi ~ pekerja + susu, data = data_produksi)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.986 -8.396 -6.164 7.588 24.871
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 124.9932 25.8827 4.829 0.001901 **
## pekerja 33.9242 14.1559 2.396 0.047713 *
## susu 4.9716 0.8455 5.880 0.000612 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 13.01 on 7 degrees of freedom
## Multiple R-squared: 0.9944, Adjusted R-squared: 0.9928
## F-statistic: 625.1 on 2 and 7 DF, p-value: 1.288e-08
Berdasarkan hasil estimasi, diperoleh model:
\[ \hat{Y} = 124.9932 + 33.9242 \cdot \text{pekerja} + 4.9716 \cdot \text{susu} \]
Dimana:
•Intercept (124.9932): Ketika pekerja dan susu = 0. Nilai p-value yang sangat kecil (0.001901) menunjukkan bahwa nilai konstanta ini signifikan secara statistik.
•Koefisien pekerja (33.9242): Tiap penambahan 1 orang pekerja meningkatkan produksi rata-rata 33.9 unit, dengan asumsi susu tetap/konstan.p-value: 0.047713. Nilai p-value kurang dari 0.05 (0.047713 < 0.05),yang ditandai dengan *. Ini menunjukkan bahwa variabel pekerja memiliki pengaruh yang signifikan secara statistik terhadap produksi.
•Koefisien susu (4.9716): Tiap tambahan 1 liter susu meningkatkan produksi rata-rata 4.97 unit, dengan asumsi pekerja tetap.p-value: 0.000612. Nilai ini sangat kecil, jauh di bawah 0.05, yang ditandai dengan ***. Ini menunjukkan bahwa variabel susu memiliki pengaruh yang sangat signifikan secara statistik terhadap produksi.
•Residual standard error: 13.01. Ini adalah rata-rata kesalahan prediksi model. Artinya, rata-rata perbedaan antara nilai produksi yang diprediksi oleh model dengan nilai produksi yang sebenarnya adalah sekitar 13.01 unit.
•Multiple R-squared: 0.9944. Ini berarti 99.44% dari total variasi pada variabel produksi dapat dijelaskan oleh variasi pada variabel pekerja dan susu secara bersamaan. Angka ini sangat tinggi, menunjukkan model yang sangat cocok dengan data.
•Adjusted R-squared: 0.9928. Ini adalah versi R-squared yang disesuaikan untuk jumlah variabel independen. Nilainya sedikit lebih rendah dari R-squared dan sering dianggap sebagai ukuran yang lebih baik.
•F-statistic: 625.1. Uji F menguji apakah setidaknya satu dari variabel independen (pekerja atau susu) memiliki pengaruh yang signifikan terhadap produksi.
•p-value: 1.288e-08. Nilai ini sangat, sangat kecil (hampir nol). Karena p-value ini jauh di bawah 0.05, kita dapat menyimpulkan bahwa model regresi ini secara keseluruhan signifikan. Artinya, pekerja dan susu secara bersama-sama memiliki pengaruh signifikan terhadap produksi.
Sebelum melakukan analisis, ada beberapa asumsi yang harus dipenuhi agar hasil model regresi menjadi valid dan tidak bias. Asumsi ini sering disebut asumsi OLS (Ordinary Least Squares) atau asumsi klasik regresi linear.
library(car)
## Loading required package: carData
vif(model_regresi)
## pekerja susu
## 18.46035 18.46035
Interpretasi Multikolinearitas:
Nilai VIF > 10 menandakan potensi multikolinearitas tinggi.Artinya: kedua variabel independen saling berkorelasi tinggi satu sama lain.
plot(model_regresi, which = 2)
Interpretasi Normalitas Residual:
Jika titik-titik mendekati garis diagonal, residual bersifat normal.
plot(model_regresi, which = 1)
Interpretasi Homoskedastisitas:
Uji visual (Residual vs Fitted - plot 1): Titik-titik menyebar acak → indikasi tidak terjadi heteroskedastisitas.
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
dwtest(model_regresi)
##
## Durbin-Watson test
##
## data: model_regresi
## DW = 1.7355, p-value = 0.3323
## alternative hypothesis: true autocorrelation is greater than 0
Interpretasi Non-Autokorelasi:
DW = 1.736: Nilai mendekati 2 → tidak terdapat autokorelasi serius pada residual.