Analisis regresi adalah metode statistik yang digunakan untuk menganalisis hubungan antara satu atau lebih variabel bebas (predictor) dengan variabel terikat (response). Dalam ilmu pertanian dan biologi, analisis regresi sering digunakan untuk memodelkan hubungan antara variabel seperti jumlah pupuk yang digunakan dan hasil tanaman, atau antara kadar nutrisi dalam tanah dengan kesehatan tanaman.
Pada materi ini, kita akan membahas regresi linier sederhana, yang merupakan bentuk paling dasar dari model regresi, serta penerapan teknik-teknik dasar dalam analisis regresi yang digunakan untuk menguji hubungan antar variabel.
Model Regresi Linier Sederhana
Model regresi linier sederhana digunakan untuk memodelkan hubungan antara satu variabel independen \(X\) dan satu variabel dependen \(Y\) dengan persamaan:
\[
Y = \beta_0 + \beta_1 X + \epsilon
\]
Dimana: - \(Y\) adalah peubah tak bebas (dependent variable), - \(X\) adalah peubah bebas (independent variable), - \(\beta_0\) adalah intersep (nilai \(Y\) saat \(X = 0\)), - \(\beta_1\) adalah koefisien kemiringan garis regresi (slope), dan - \(\epsilon\) adalah kesalahan atau residual.
Interpretasi Parameter Regresi
\(\beta_0\): Menggambarkan nilai rata-rata \(Y\) ketika \(X = 0\). Dalam konteks pertanian, ini bisa berarti hasil tanaman saat tidak ada perlakuan pupuk.
\(\beta_1\): Mengukur seberapa banyak perubahan rata-rata \(Y\) ketika \(X\) berubah satu satuan.
Metode Kuadrat Terkecil (MKT)
Metode Kuadrat Terkecil digunakan untuk meminimalkan jumlah kuadrat dari kesalahan prediksi antara nilai yang diamati dan nilai yang diprediksi oleh model regresi. Dalam hal ini, kita ingin menemukan nilai terbaik dari \(\beta_0\) dan \(\beta_1\) sehingga garis regresi kita seakurat mungkin.
Rumus Estimasi Koefisien
Koefisien regresi \(\beta_1\) dan \(\beta_0\) dapat dihitung menggunakan rumus berikut:
Di mana: - \(y_i\) adalah nilai \(Y\) pada pengamatan ke-\(i\), - \(x_i\) adalah nilai \(X\) pada pengamatan ke-\(i\), - \(\bar{y}\) dan \(\bar{x}\) adalah rata-rata dari \(Y\) dan \(X\) masing-masing.
Sifat-sifat Estimasi
Tidak Bias: Estimasi \(\hat{\beta}_1\) dan \(\hat{\beta}_0\) tidak bias, artinya rata-rata dari estimasi tersebut akan mendekati nilai sebenarnya.
Efisien: Estimasi memiliki varians yang minimal dibandingkan estimasi lainnya.
Konsisten: Dengan bertambahnya ukuran sampel, estimasi akan semakin mendekati nilai sebenarnya.
Pengujian Hipotesis
Uji Simultan (Uji F)
Untuk menguji apakah model regresi secara keseluruhan signifikan, kita dapat melakukan Uji F. Hipotesis yang diuji adalah:
\[
H_0: \beta_1 = \beta_2 = \dots = \beta_k = 0
\quad \text{(Tidak ada pengaruh seluruh variabel $X$ terhadap $Y$)}
\]
\[
H_1: \text{Paling tidak ada satu } \beta_j \neq 0
\quad \text{(Minimal ada satu variabel $X$ yang berpengaruh terhadap $Y$)}
\]
Uji Parsial (Uji t)
Untuk menguji apakah koefisien regresi \(\beta_j\) secara individu signifikan, kita melakukan Uji t. Hipotesis yang diuji adalah:
\[
H_0: \beta_j = 0
\quad \text{(Tidak ada pengaruh variabel $X_j$ terhadap $Y$)}
\]
\[
H_1: \beta_j \neq 0
\quad \text{(Ada pengaruh variabel $X_j$ terhadap $Y$)}
\]
Koefisien Determinasi (\(R^2\))
Koefisien determinasi \(R^2\) digunakan untuk mengukur sejauh mana model regresi mampu menjelaskan variabilitas data. Nilai \(R^2\) berkisar antara 0 hingga 1, di mana nilai 1 berarti model sangat baik dalam menjelaskan data.
# 2. Membuat model regresi linier sederhanamodel <-lm(Hasil ~ Pupuk, data = data)# Menampilkan ringkasan hasil modelsummary(model)
Call:
lm(formula = Hasil ~ Pupuk, data = data)
Residuals:
Min 1Q Median 3Q Max
-1.0727 -0.2712 0.1061 0.3076 0.7030
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.2667 0.3816 5.939 0.000346 ***
Pupuk 0.3612 0.0123 29.363 1.96e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.5587 on 8 degrees of freedom
Multiple R-squared: 0.9908, Adjusted R-squared: 0.9897
F-statistic: 862.2 on 1 and 8 DF, p-value: 1.961e-09
# 3. Prediksi nilai Hasil berdasarkan Pupukprediksi <-predict(model, newdata = data)# Menambahkan kolom prediksi ke dalam data aslidata$Prediksi <- prediksi# Menampilkan hasil prediksihead(data)
# 4. Visualisasi model regresiplot(data$Pupuk, data$Hasil, main ="Regresi Linier Sederhana", xlab ="Jumlah Pupuk", ylab ="Hasil Pertanian", pch =19, col ="blue")abline(model, col ="red")
# 5. Uji Simultan (Uji F)# Dapat dilihat dari output summary(model) bahwa nilai p untuk F-test akan menunjukkan signifikansi model# 6. Uji Parsial (Uji t)# Uji t untuk koefisien regresi (Pupuk)# Nilai p untuk Pupuk dapat dilihat pada output summary(model)