Penelitian ini bertujuan untuk mengetahui pengaruh Penguasaan Kosa Kata (X1), Pemahaman Tema (X2), dan Pengetahuan Tata Bahasa (X3) terhadap Kemampuan Menulis (Y) siswa SMA.
Metode yang digunakan adalah regresi linier berganda dengan persamaan umum:
\[ Y = b_0 + b_1 X_1 + b_2 X_2 + b_3 X_3 + e \]
# Data penelitian
X1 <- c(3,3,2,4,5,6,7,7,4,8,2)
X2 <- c(2,3,4,5,4,5,6,7,4,8,8)
X3 <- c(4,7,3,4,5,3,4,7,4,4,8)
Y <- c(8,7,8,7,8,7,8,8,6,9,9)
data <- data.frame(X1, X2, X3, Y)
data
## X1 X2 X3 Y
## 1 3 2 4 8
## 2 3 3 7 7
## 3 2 4 3 8
## 4 4 5 4 7
## 5 5 4 5 8
## 6 6 5 3 7
## 7 7 6 4 8
## 8 7 7 7 8
## 9 4 4 4 6
## 10 8 8 4 9
## 11 2 8 8 9
# Membuat model regresi
model <- lm(Y ~ X1 + X2 + X3, data = data)
# Melihat ringkasan hasil regresi
summary(model)
##
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.4298 -0.4253 0.1802 0.5389 1.0857
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.41656 1.11150 5.773 0.000682 ***
## X1 -0.06280 0.16434 -0.382 0.713693
## X2 0.28914 0.18300 1.580 0.158126
## X3 0.02696 0.18611 0.145 0.888905
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.868 on 7 degrees of freedom
## Multiple R-squared: 0.3554, Adjusted R-squared: 0.07911
## F-statistic: 1.286 on 3 and 7 DF, p-value: 0.3514
Dari output di atas, kita dapat menuliskan persamaan regresi sebagai:
\[ \hat{Y} = b_0 + b_1 X_1 + b_2 X_2 + b_3 X_3 \]
dengan nilai koefisien sesuai hasil summary(model).
Keputusan diambil berdasarkan nilai p-value: - Jika p-value < 0,05 → tolak H0 (signifikan) - Jika p-value ≥ 0,05 → gagal tolak H0 (tidak signifikan)
anova(model)
## Analysis of Variance Table
##
## Response: Y
## Df Sum Sq Mean Sq F value Pr(>F)
## X1 1 0.1900 0.18998 0.2521 0.6310
## X2 1 2.7018 2.70185 3.5859 0.1001
## X3 1 0.0158 0.01581 0.0210 0.8889
## Residuals 7 5.2742 0.75345
r2 <- summary(model)$r.squared
adj_r2 <- summary(model)$adj.r.squared
r2
## [1] 0.3553782
adj_r2
## [1] 0.07911172
Interpretasi: - Nilai R² menunjukkan proporsi variasi Y yang dapat dijelaskan oleh X1, X2, dan X3. - Nilai Adjusted R² digunakan untuk memperbaiki bias akibat jumlah variabel.