Penelitian ini bertujuan untuk mengetahui pengaruh Penguasaan Kosa Kata (X1), Pemahaman Tema (X2), dan Pengetahuan Tata Bahasa (X3) terhadap Kemampuan Menulis (Y) siswa SMA.
Metode yang digunakan adalah regresi linier berganda dengan persamaan umum:
\[ Y = b_0 + b_1 X_1 + b_2 X_2 + b_3 X_3 + e \]
# Data penelitian
X1 <- c(3,3,2,4,5,6,7,7,4,8,2)
X2 <- c(2,3,4,5,4,5,6,7,4,8,8)
X3 <- c(4,7,3,4,5,3,4,7,4,4,8)
Y <- c(8,7,8,7,8,7,8,8,6,9,9)
data <- data.frame(X1, X2, X3, Y)
data
## X1 X2 X3 Y
## 1 3 2 4 8
## 2 3 3 7 7
## 3 2 4 3 8
## 4 4 5 4 7
## 5 5 4 5 8
## 6 6 5 3 7
## 7 7 6 4 8
## 8 7 7 7 8
## 9 4 4 4 6
## 10 8 8 4 9
## 11 2 8 8 9
model <- lm(Y ~ X1 + X2 + X3, data = data)
summary(model)
##
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.4298 -0.4253 0.1802 0.5389 1.0857
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.41656 1.11150 5.773 0.000682 ***
## X1 -0.06280 0.16434 -0.382 0.713693
## X2 0.28914 0.18300 1.580 0.158126
## X3 0.02696 0.18611 0.145 0.888905
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.868 on 7 degrees of freedom
## Multiple R-squared: 0.3554, Adjusted R-squared: 0.07911
## F-statistic: 1.286 on 3 and 7 DF, p-value: 0.3514
coeffs <- coef(model)
cat("Persamaan regresi linear: Ŷ =", round(coeffs[1],3), "+",
round(coeffs[2],3),"* X1 +",
round(coeffs[3],3),"* X2 +",
round(coeffs[4],3),"* X3\n")
## Persamaan regresi linear: Ŷ = 6.417 + -0.063 * X1 + 0.289 * X2 + 0.027 * X3
pvalues <- summary(model)$coefficients[,4]
for (i in 2:length(pvalues)) {
var_name <- names(pvalues)[i]
if(pvalues[i] < 0.05){
cat(var_name, "signifikan secara dua arah (p=", round(pvalues[i],4), ")\n")
} else {
cat(var_name, "tidak signifikan secara dua arah (p=", round(pvalues[i],4), ")\n")
}
}
## X1 tidak signifikan secara dua arah (p= 0.7137 )
## X2 tidak signifikan secara dua arah (p= 0.1581 )
## X3 tidak signifikan secara dua arah (p= 0.8889 )
pvalues_one <- pvalues[-1]/2
var_names <- names(coeffs)[-1]
for (i in 1:length(pvalues_one)) {
if(coeffs[i+1] > 0 & pvalues_one[i] < 0.05){
cat(var_names[i], "berpengaruh positif signifikan terhadap Y (p=", round(pvalues_one[i],4), ")\n")
} else if(coeffs[i+1] < 0 & pvalues_one[i] < 0.05){
cat(var_names[i], "berpengaruh negatif signifikan terhadap Y (p=", round(pvalues_one[i],4), ")\n")
} else {
cat(var_names[i], "tidak signifikan secara satu arah (p=", round(pvalues_one[i],4), ")\n")
}
}
## X1 tidak signifikan secara satu arah (p= 0.3568 )
## X2 tidak signifikan secara satu arah (p= 0.0791 )
## X3 tidak signifikan secara satu arah (p= 0.4445 )
anova(model)
## Analysis of Variance Table
##
## Response: Y
## Df Sum Sq Mean Sq F value Pr(>F)
## X1 1 0.1900 0.18998 0.2521 0.6310
## X2 1 2.7018 2.70185 3.5859 0.1001
## X3 1 0.0158 0.01581 0.0210 0.8889
## Residuals 7 5.2742 0.75345
r2 <- summary(model)$r.squared
adj_r2 <- summary(model)$adj.r.squared
cat("Koefisien Determinasi (R²):", round(r2,4), "\n")
## Koefisien Determinasi (R²): 0.3554
cat("Koefisien Determinasi Disesuaikan (Adjusted R²):", round(adj_r2,4), "\n")
## Koefisien Determinasi Disesuaikan (Adjusted R²): 0.0791
coeff_table <- data.frame(
Variabel = var_names,
Koefisien = round(coeffs[-1],3),
P_value_dua_arah = round(pvalues[-1],4),
P_value_satu_arah = round(pvalues_one,4)
)
coeff_table
## Variabel Koefisien P_value_dua_arah P_value_satu_arah
## X1 X1 -0.063 0.7137 0.3568
## X2 X2 0.289 0.1581 0.0791
## X3 X3 0.027 0.8889 0.4445
r2 <- summary(model)$r.squared
adj_r2 <- summary(model)$adj.r.squared
r2
## [1] 0.3553782
adj_r2
## [1] 0.07911172
Interpretasi: - Koefisien X1, X2, dan X3 menunjukkan
seberapa besar perubahan Y jika masing-masing variabel naik 1 satuan
dengan variabel lain tetap. - P-value uji t dua arah dan satu arah
menunjukkan variabel mana yang berpengaruh signifikan terhadap Y. -
Koefisien determinasi R² sebesar r2 menunjukkan persentase
variasi kemampuan menulis (Y) yang dijelaskan oleh X1, X2, dan X3. -
Adjusted R² memperbaiki bias akibat jumlah variabel, memberikan estimasi
lebih realistis.
Kesimpulan: 1. Model regresi linier berganda terbentuk dan dapat digunakan untuk memprediksi Y. 2. Variabel yang berpengaruh signifikan terhadap Y ditentukan dari hasil uji t dan p-value. 3. Uji F menunjukkan apakah pengaruh variabel secara simultan signifikan. 4. Nilai R² dan Adjusted R² menunjukkan bahwa sebagian besar variasi Y dapat dijelaskan oleh variabel X, sedangkan sisanya dipengaruhi faktor lain di luar model.