Pendahuluan

Analisis regresi linier sederhana merupakan metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel independen dan satu variabel dependen. Berbeda dengan analisis korelasi yang hanya mengukur keeratan dan arah hubungan, analisis regresi bertujuan untuk menjelaskan pengaruh serta membentuk model prediksi.

Pada pembahasan ini, regresi linier sederhana diterapkan menggunakan dataset mtcars, dengan variabel berat mobil sebagai prediktor dan efisiensi bahan bakar sebagai respon.

Model Regresi Linier Sederhana

Model regresi linier sederhana dinyatakan dalam bentuk persamaan:

\[ Y = \beta_0 + \beta_1 X + \varepsilon \]

dengan: - \(Y\) adalah variabel dependen
- \(X\) adalah variabel independen
- \(\beta_0\) adalah intersep
- \(\beta_1\) adalah koefisien regresi
- \(\varepsilon\) adalah galat acak

Dalam analisis ini, variabel \(Y\) adalah efisiensi bahan bakar (mpg) dan variabel \(X\) adalah berat mobil (wt).

Interpretasi Parameter Regresi

Intersep (\(\beta_0\)) menggambarkan nilai rata-rata variabel respon ketika variabel prediktor bernilai nol. Interpretasi ini bersifat matematis dan tidak selalu bermakna secara praktis.

Koefisien regresi (\(\beta_1\)) menunjukkan besarnya perubahan rata-rata variabel respon akibat perubahan satu satuan variabel prediktor. Tanda koefisien menunjukkan arah pengaruh.

Metode Kuadrat Terkecil

Estimasi parameter regresi dilakukan menggunakan Metode Kuadrat Terkecil (MKT) atau Ordinary Least Squares. Metode ini bertujuan untuk meminimalkan jumlah kuadrat selisih antara nilai observasi dan nilai prediksi model.

Fungsi objektif MKT dapat dituliskan sebagai:

\[ \min \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2 \]

Estimasi Koefisien Regresi

Estimator koefisien regresi linier sederhana diberikan oleh:

\[ \hat{\beta}_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})} {\sum (X_i - \bar{X})^2} \]

\[ \hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X} \]

Variabel dalam Analisis Regresi

Dalam analisis regresi, terdapat dua jenis variabel utama, yaitu variabel dependen dan variabel independen. Kedua variabel ini memiliki peran yang berbeda dalam pembentukan model regresi.

Variabel Dependen

Variabel dependen, yang sering dilambangkan dengan \(Y\), merupakan variabel yang nilainya dipengaruhi atau dijelaskan oleh variabel lain dalam model regresi. Variabel ini juga sering disebut sebagai variabel respon.

Tujuan utama analisis regresi adalah memodelkan dan memprediksi nilai variabel dependen berdasarkan informasi yang diberikan oleh variabel independen.

Variabel Independen

Variabel independen, yang dilambangkan dengan \(X\), merupakan variabel yang digunakan untuk menjelaskan variasi pada variabel dependen. Variabel ini sering disebut sebagai variabel prediktor atau variabel penjelas.

Perubahan pada variabel independen diharapkan berhubungan dengan perubahan pada variabel dependen sesuai dengan model yang dibentuk.

Sifat Estimasi

Di bawah asumsi klasik regresi linier, estimator MKT memiliki sifat: - tak bias - konsisten - efisien (berdasarkan Teorema Gauss–Markov)

Pengujian Hipotesis

Pengujian hipotesis dilakukan untuk menilai signifikansi parameter regresi.

Uji Simultan

Uji simultan digunakan untuk menguji apakah variabel independen secara keseluruhan berpengaruh terhadap variabel dependen.

Hipotesis: - \(H_0: \beta_1 = 0\) - \(H_1: \beta_1 \neq 0\)

Uji Parsial

Uji parsial digunakan untuk menguji signifikansi masing-masing koefisien regresi secara individual menggunakan statistik uji t.

Koefisien Determinasi

Koefisien determinasi (\(R^2\)) menunjukkan proporsi variasi variabel dependen yang dapat dijelaskan oleh variabel independen dalam model regresi.

Penerapan Regresi Linier Sederhana di R

Hubungan Variabel dalam Regresi Linier Sederhana

Pada regresi linier sederhana, hanya terdapat satu variabel independen dan satu variabel dependen. Hubungan antara kedua variabel tersebut dinyatakan dalam bentuk persamaan:

\[ Y = \beta_0 + \beta_1 X + \varepsilon \]

Dalam konteks analisis ini, variabel dependen (\(Y\)) adalah efisiensi bahan bakar (mpg), sedangkan variabel independen (\(X\)) adalah berat mobil (wt).

# Memuat dataset
data(mtcars)

# Membentuk model regresi linier sederhana
model <- lm(mpg ~ wt, data = mtcars)

# Menampilkan ringkasan hasil regresi
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

Fungsi lm() yang digunakan dalam analisis regresi linier sederhana merupakan bagian dari package bawaan R, yaitu stats. Oleh karena itu, penggunaan fungsi ini tidak memerlukan instalasi package tambahan dan dapat langsung dijalankan pada lingkungan R standar.

library(ggplot2)
ggplot(mtcars, aes(x = wt, y = mpg)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  labs(
    x = "Berat Mobil (wt)",
    y = "Efisiensi Bahan Bakar (mpg)",
    title = "Hubungan Berat Mobil dan Efisiensi Bahan Bakar"
  )
## `geom_smooth()` using formula = 'y ~ x'

# Data baru (misalnya berat mobil = 3)
data_baru <- data.frame(wt = 3)

# Melakukan prediksi
prediksi <- predict(model, newdata = data_baru)

prediksi
##        1 
## 21.25171

Kesimpulan

Hasil analisis regresi linier sederhana menunjukkan bahwa berat mobil berpengaruh signifikan terhadap efisiensi bahan bakar. Model regresi yang dibentuk mampu menjelaskan hubungan antarvariabel secara kuantitatif dan dapat digunakan sebagai dasar analisis lanjutan.