Teori Analisis Linear Berganda

Analisis regresi linear berganda digunakan untuk memodelkan hubungan antara satu variabel dependen (terikat) dengan dua atau lebih variabel independen (bebas). Tujuannya adalah untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen. Dalam kasus ini, kita ingin memahami bagaimana jumlah pekerja dan jumlah susu memengaruhi total produksi.

Produksi= β0+ β1(Pekerja)+β2 (Susu)+ε

Variabel dalam data

Berdasarkan data yang dimiliki:

• Variabel Dependen (Y): produksi. Ini adalah variabel yang ingin kita prediksi atau jelaskan.

• Variabel Independen (X1): pekerja. Variabel ini diasumsikan memengaruhi produksi.

• Variabel Independen (X2): susu. Variabel ini juga diasumsikan memengaruhi produksi.

Langkah-langkah untuk Analisis Linear Berganda di R

1. Memasukkan Data ke R

data_produksi <- data.frame(
  pekerja = c(5, 6, 4, 7, 6, 8, 5, 7, 6, 4),
  susu = c(100, 120, 90, 130, 110, 150, 95, 140, 125, 85),
  produksi = c(800, 950, 700, 1000, 870, 1150, 760, 1050, 940, 690)
)

2. Membuat Model Regresi

Gunakan fungsi lm() (linear model) di R untuk membuat model regresi.

model_regresi <- lm(produksi ~ pekerja + susu, data = data_produksi)

3. Mendapatkan Estimasi Parameter dan Ringkasan Model

Gunakan fungsi summary() untuk melihat ringkasan lengkap dari model regresi yang telah dibuat.

summary(model_regresi)
## 
## Call:
## lm(formula = produksi ~ pekerja + susu, data = data_produksi)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -9.986 -8.396 -6.164  7.588 24.871 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 124.9932    25.8827   4.829 0.001901 ** 
## pekerja      33.9242    14.1559   2.396 0.047713 *  
## susu          4.9716     0.8455   5.880 0.000612 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 13.01 on 7 degrees of freedom
## Multiple R-squared:  0.9944, Adjusted R-squared:  0.9928 
## F-statistic: 625.1 on 2 and 7 DF,  p-value: 1.288e-08

Interpretasi

1. Koefisien

Berdasarkan hasil estimasi, diperoleh model:

\[ \hat{Y} = 124.9932 + 33.9242 \cdot \text{pekerja} + 4.9716 \cdot \text{susu} \]

Dimana:

  • \(\hat{Y}\): nilai prediksi produksi es krim
  • \(\text{pekerja}\): jumlah pekerja
  • \(\text{susu}\): jumlah susu (liter)
  • \(\beta_0 = 124.9932\): intercept (konstanta)
  • \(\beta_1 = 33.9242\): koefisien regresi untuk pekerja
  • \(\beta_2 = 4.9716\): koefisien regresi untuk susuu

•Intercept (124.9932): Ketika pekerja dan susu = 0. Nilai p-value yang sangat kecil (0.001901) menunjukkan bahwa nilai konstanta ini signifikan secara statistik.

•Koefisien pekerja (33.9242): Tiap penambahan 1 orang pekerja meningkatkan produksi rata-rata 33.9 unit, dengan asumsi susu tetap/konstan.p-value: 0.047713. Nilai p-value kurang dari 0.05 (0.047713 < 0.05),yang ditandai dengan *. Ini menunjukkan bahwa variabel pekerja memiliki pengaruh yang signifikan secara statistik terhadap produksi.

•Koefisien susu (4.9716): Tiap tambahan 1 liter susu meningkatkan produksi rata-rata 4.97 unit, dengan asumsi pekerja tetap.p-value: 0.000612. Nilai ini sangat kecil, jauh di bawah 0.05, yang ditandai dengan ***. Ini menunjukkan bahwa variabel susu memiliki pengaruh yang sangat signifikan secara statistik terhadap produksi.

2. Akurasi dan Kecocokan Model

•Residual standard error: 13.01. Ini adalah rata-rata kesalahan prediksi model. Artinya, rata-rata perbedaan antara nilai produksi yang diprediksi oleh model dengan nilai produksi yang sebenarnya adalah sekitar 13.01 unit.

•Multiple R-squared: 0.9944. Ini berarti 99.44% dari total variasi pada variabel produksi dapat dijelaskan oleh variasi pada variabel pekerja dan susu secara bersamaan. Angka ini sangat tinggi, menunjukkan model yang sangat cocok dengan data.

•Adjusted R-squared: 0.9928. Ini adalah versi R-squared yang disesuaikan untuk jumlah variabel independen. Nilainya sedikit lebih rendah dari R-squared dan sering dianggap sebagai ukuran yang lebih baik.

3. Uji Signifikansi Simultan (Uji F)

•F-statistic: 625.1. Uji F menguji apakah setidaknya satu dari variabel independen (pekerja atau susu) memiliki pengaruh yang signifikan terhadap produksi.

•p-value: 1.288e-08. Nilai ini sangat, sangat kecil (hampir nol). Karena p-value ini jauh di bawah 0.05, kita dapat menyimpulkan bahwa model regresi ini secara keseluruhan signifikan. Artinya, pekerja dan susu secara bersama-sama memiliki pengaruh signifikan terhadap produksi.

Asumsi Klasik dalam Regresi

Sebelum melakukan analisis, ada beberapa asumsi yang harus dipenuhi agar hasil model regresi menjadi valid dan tidak bias. Asumsi ini sering disebut asumsi OLS (Ordinary Least Squares) atau asumsi klasik regresi linear.

1. Multikolinearitas: Tidak ada hubungan linear yang sempurna atau sangat kuat antara variabel independen (X1 dan X2).

library(car)
## Loading required package: carData
vif(model_regresi)
##  pekerja     susu 
## 18.46035 18.46035

Interpretasi Multikolinearitas:

Nilai VIF > 10 menandakan potensi multikolinearitas tinggi.Artinya: kedua variabel independen saling berkorelasi tinggi satu sama lain.

2. Normalitas Residual: Residual (error) model terdistribusi secara normal.

plot(model_regresi, which = 2)

Interpretasi Normalitas Residual:

Jika titik-titik mendekati garis diagonal, residual bersifat normal.

3. Homoskedastisitas: Varians dari residual bersifat konstan di sepanjang nilai variabel independen.

plot(model_regresi, which = 1)

Interpretasi Homoskedastisitas:

Uji visual (Residual vs Fitted - plot 1): Titik-titik menyebar acak → indikasi tidak terjadi heteroskedastisitas.

4. Non-autokorelasi: Tidak ada korelasi antara residual dari satu observasi dengan observasi lainnya.

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(model_regresi)
## 
##  Durbin-Watson test
## 
## data:  model_regresi
## DW = 1.7355, p-value = 0.3323
## alternative hypothesis: true autocorrelation is greater than 0

Interpretasi Non-Autokorelasi:

DW = 1.736: Nilai mendekati 2 → tidak terdapat autokorelasi serius pada residual.