Perkembangan analisis data saat ini menuntut teknik perhitungan yang tidak hanya akurat, tetapi juga efisien. Salah satu metode yang banyak digunakan untuk memahami hubungan antar variabel adalah analisis regresi linear. Dalam praktikum ini, regresi dihitung menggunakan pendekatan matriks, yaitu metode yang menyajikan proses estimasi parameter secara lebih terstruktur.
\[ \hat{\beta} = (X'X)^{-1}X'Y \]
Pendekatan tersebut memberikan gambaran matematis yang jelas mengenai bagaimana koefisien regresi diperoleh, sehingga pemahaman konsep menjadi lebih mendalam.
Regresi linear digunakan untuk memodelkan hubungan antara satu
variabel respons dengan beberapa variabel penjelas.
Model regresi berganda dituliskan sebagai:
\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_k X_k + \varepsilon \]
Setiap koefisien menggambarkan bagaimana perubahan pada satu variabel X akan memengaruhi nilai Y secara rata-rata.
Bagian ini menampilkan proses pembuatan dataset simulasi yang akan
digunakan untuk analisis.
Data terdiri dari tiga variabel:
Sebanyak 200 observasi dihasilkan secara acak agar regresi dapat dianalisis dengan lebih stabil.
set.seed(123)
n <- 200
X1 <- runif(n, 2, 10)
X2 <- runif(n, 3, 10)
Y <- 15 + 3*X1 + 2*X2 + rnorm(n, 0, 4)
data_reg <- data.frame(X1, X2, Y)
head(data_reg, 10)
## X1 X2 Y
## 1 4.300620 4.671082 46.03927
## 2 8.306441 9.736513 64.64200
## 3 5.271815 7.209560 44.17399
## 4 9.064139 6.605208 57.57561
## 5 9.523738 5.818013 53.54988
## 6 2.364452 9.161726 38.51182
## 7 6.224844 5.548643 41.61741
## 8 9.139352 5.017675 50.07494
## 9 6.411480 4.194517 49.22710
## 10 5.652918 4.205202 40.15305