Tujuan
Memahami konsep dasar analisis regresi berganda.
Mempelajari model matematis dan asumsi regresi berganda.
Menggunakan R untuk membangun model regresi berganda.
Menginterpretasi output regresi (koefisien, uji F, uji t, R²).
Melatih keterampilan analisis data menggunakan dataset nyata.
1. Ringkasan Teori
Definisi
Analisis regresi berganda digunakan untuk mempelajari hubungan antara satu variabel dependen (Y) dengan dua atau lebih variabel independen (X₁, X₂, …, Xₖ) .
Model Matematis
\[
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_k X_k + \epsilon
\]
\(Y\) : variabel dependen (respons)
\(X_1, X_2, \ldots, X_k\) : variabel independen (prediktor)
\(\beta_0\) : intercept
\(\beta_i\) : koefisien regresi
\(\epsilon\) : galat acak
Asumsi Regresi
Hubungan antara X dan Y bersifat linear .
Galat (\(\epsilon\) ) berdistribusi normal dengan rataan 0.
Varians galat homogen (homoskedastisitas).
Antar variabel independen tidak berkorelasi sempurna.
Uji Signifikansi
Uji F : menguji apakah semua variabel independen berpengaruh secara bersama-sama terhadap Y.
Uji t : menguji pengaruh masing-masing variabel independen terhadap Y.
R² dan Adjusted R² : mengukur seberapa baik model menjelaskan variasi Y.
2. Contoh Dataset
Gunakan dataset iris
untuk memprediksi Sepal.Length berdasarkan Sepal.Width, Petal.Length, dan Petal.Width .
# Dataset iris
head (iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
# Analisis regresi berganda
model_iris <- lm (Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width, data = iris)
summary (model_iris)
Call:
lm(formula = Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width,
data = iris)
Residuals:
Min 1Q Median 3Q Max
-0.82816 -0.21989 0.01875 0.19709 0.84570
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.85600 0.25078 7.401 9.85e-12 ***
Sepal.Width 0.65084 0.06665 9.765 < 2e-16 ***
Petal.Length 0.70913 0.05672 12.502 < 2e-16 ***
Petal.Width -0.55648 0.12755 -4.363 2.41e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.3145 on 146 degrees of freedom
Multiple R-squared: 0.8586, Adjusted R-squared: 0.8557
F-statistic: 295.5 on 3 and 146 DF, p-value: < 2.2e-16
3. Interpretasi Output Regresi
Output summary(model)
pada R memberikan informasi:
Koefisien (\(\beta\) ) :
Menunjukkan arah (+/-) dan besar pengaruh masing-masing X terhadap Y.
Contoh: jika \(\beta_1\) = \(0.5\) , maka setiap kenaikan 1 unit \(X_1\) akan menaikkan \(Y\) sebesar 0.5 (dengan asumsi variabel lain konstan).
Uji t dan p-value :
Jika p-value < 0.05 → variabel X berpengaruh signifikan terhadap Y.
Uji F :
Tercantum pada bagian F-statistic .
Jika signifikan (p-value < 0.05) → minimal ada satu variabel X yang memengaruhi Y.
R² dan Adjusted R² :
R²: proporsi variasi Y yang dapat dijelaskan oleh model.
Adjusted R²: R² yang sudah menyesuaikan jumlah prediktor (lebih baik untuk regresi berganda).
5. Visualisasi Hasil Regresi
# Plot residual untuk memeriksa asumsi
par (mfrow= c (2 ,2 ))
plot (model_iris)
Interpretasi:
6. Latihan Soal
Gunakan dataset mtcars
dan analisis pengaruh hp (horsepower) dan wt (weight) terhadap mpg (mile per gallon) .
Hitung R² dan interpretasikan.
Lakukan uji F dan uji t, apa kesimpulannya?
Dari output regresi dataset iris
, variabel mana saja yang berpengaruh signifikan terhadap Sepal.Length ?