Analisis regresi linier sederhana merupakan metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel independen dan satu variabel dependen. Berbeda dengan analisis korelasi yang hanya mengukur keeratan dan arah hubungan, analisis regresi bertujuan untuk menjelaskan pengaruh serta membentuk model prediksi.
Pada pembahasan ini, regresi linier sederhana diterapkan menggunakan
dataset mtcars, dengan variabel berat mobil sebagai
prediktor dan efisiensi bahan bakar sebagai respon.
Model regresi linier sederhana dinyatakan dalam bentuk persamaan:
\[ Y = \beta_0 + \beta_1 X + \varepsilon \]
dengan: - \(Y\) adalah variabel
dependen
- \(X\) adalah variabel
independen
- \(\beta_0\) adalah intersep
- \(\beta_1\) adalah koefisien
regresi
- \(\varepsilon\) adalah galat acak
Dalam analisis ini, variabel \(Y\) adalah efisiensi bahan bakar (mpg) dan variabel \(X\) adalah berat mobil (wt).
Intersep (\(\beta_0\)) menggambarkan nilai rata-rata variabel respon ketika variabel prediktor bernilai nol. Interpretasi ini bersifat matematis dan tidak selalu bermakna secara praktis.
Koefisien regresi (\(\beta_1\)) menunjukkan besarnya perubahan rata-rata variabel respon akibat perubahan satu satuan variabel prediktor. Tanda koefisien menunjukkan arah pengaruh.
Estimasi parameter regresi dilakukan menggunakan Metode Kuadrat Terkecil (MKT) atau Ordinary Least Squares. Metode ini bertujuan untuk meminimalkan jumlah kuadrat selisih antara nilai observasi dan nilai prediksi model.
Fungsi objektif MKT dapat dituliskan sebagai:
\[ \min \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2 \]
Estimator koefisien regresi linier sederhana diberikan oleh:
\[ \hat{\beta}_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})} {\sum (X_i - \bar{X})^2} \]
\[ \hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X} \]
Dalam analisis regresi, terdapat dua jenis variabel utama, yaitu variabel dependen dan variabel independen. Kedua variabel ini memiliki peran yang berbeda dalam pembentukan model regresi.
Variabel dependen, yang sering dilambangkan dengan \(Y\), merupakan variabel yang nilainya dipengaruhi atau dijelaskan oleh variabel lain dalam model regresi. Variabel ini juga sering disebut sebagai variabel respon.
Tujuan utama analisis regresi adalah memodelkan dan memprediksi nilai variabel dependen berdasarkan informasi yang diberikan oleh variabel independen.
Variabel independen, yang dilambangkan dengan \(X\), merupakan variabel yang digunakan untuk menjelaskan variasi pada variabel dependen. Variabel ini sering disebut sebagai variabel prediktor atau variabel penjelas.
Perubahan pada variabel independen diharapkan berhubungan dengan perubahan pada variabel dependen sesuai dengan model yang dibentuk.
Di bawah asumsi klasik regresi linier, estimator MKT memiliki sifat: - tak bias - konsisten - efisien (berdasarkan Teorema Gauss–Markov)
Pengujian hipotesis dilakukan untuk menilai signifikansi parameter regresi.
Uji simultan digunakan untuk menguji apakah variabel independen secara keseluruhan berpengaruh terhadap variabel dependen.
Hipotesis: - \(H_0: \beta_1 = 0\) - \(H_1: \beta_1 \neq 0\)
Uji parsial digunakan untuk menguji signifikansi masing-masing koefisien regresi secara individual menggunakan statistik uji t.
Koefisien determinasi (\(R^2\)) menunjukkan proporsi variasi variabel dependen yang dapat dijelaskan oleh variabel independen dalam model regresi.
Pada regresi linier sederhana, hanya terdapat satu variabel independen dan satu variabel dependen. Hubungan antara kedua variabel tersebut dinyatakan dalam bentuk persamaan:
\[ Y = \beta_0 + \beta_1 X + \varepsilon \]
Dalam konteks analisis ini, variabel dependen (\(Y\)) adalah efisiensi bahan bakar (mpg), sedangkan variabel independen (\(X\)) adalah berat mobil (wt).
# Memuat dataset
data(mtcars)
# Membentuk model regresi linier sederhana
model <- lm(mpg ~ wt, data = mtcars)
# Menampilkan ringkasan hasil regresi
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
Fungsi lm() yang digunakan dalam analisis regresi linier
sederhana merupakan bagian dari package bawaan R, yaitu
stats. Oleh karena itu, penggunaan fungsi ini tidak
memerlukan instalasi package tambahan dan dapat langsung dijalankan pada
lingkungan R standar.
library(ggplot2)
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
labs(
x = "Berat Mobil (wt)",
y = "Efisiensi Bahan Bakar (mpg)",
title = "Hubungan Berat Mobil dan Efisiensi Bahan Bakar"
)
## `geom_smooth()` using formula = 'y ~ x'
# Data baru (misalnya berat mobil = 3)
data_baru <- data.frame(wt = 3)
# Melakukan prediksi
prediksi <- predict(model, newdata = data_baru)
prediksi
## 1
## 21.25171
Hasil analisis regresi linier sederhana menunjukkan bahwa berat mobil berpengaruh signifikan terhadap efisiensi bahan bakar. Model regresi yang dibentuk mampu menjelaskan hubungan antarvariabel secara kuantitatif dan dapat digunakan sebagai dasar analisis lanjutan.