library(readxl)
data <- read_excel("Downloads/Data Latihan 1.xlsx")
data
## # A tibble: 35 × 8
## PPM RLS IPM PPK ASL TPT PDRB UHH
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 11.7 7.09 70.4 10534 76.4 9.97 91944588. 73.9
## 2 13.7 7.63 72.4 11546 80.0 6.05 40686808. 73.8
## 3 16.2 7.25 69.2 10032 76.3 6.05 17731438. 73.2
## 4 16.2 6.75 67.9 9407 40.8 5.86 15536478. 74.3
## 5 17.8 7.55 70.0 9028 89.0 6.03 20253059. 73.6
## 6 12.4 8.21 73.0 10275 79.8 3.59 13582556. 74.9
## 7 17.7 6.82 68.4 10760 53.3 5.26 14064765. 71.9
## 8 11.9 7.79 70.1 9440 78.4 5.03 23661713. 73.9
## 9 10.6 7.85 74.4 13031 87.7 5.09 23447366. 76.0
## 10 13.5 8.81 76.1 12017 95.4 5.48 28531109. 76.9
## # ℹ 25 more rows
colnames(data) <- c("Y", paste0("X", 1:8))
head(data)
## # A tibble: 6 × 8
## Y X1 X2 X3 X4 X5 X6 X7
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 11.7 7.09 70.4 10534 76.4 9.97 91944588. 73.9
## 2 13.7 7.63 72.4 11546 80.0 6.05 40686808. 73.8
## 3 16.2 7.25 69.2 10032 76.3 6.05 17731438. 73.2
## 4 16.2 6.75 67.9 9407 40.8 5.86 15536478. 74.3
## 5 17.8 7.55 70.0 9028 89.0 6.03 20253059. 73.6
## 6 12.4 8.21 73.0 10275 79.8 3.59 13582556. 74.9
n <- nrow(data)
plot(data$X1, data$Y,
main = "Plot Rata-Rata Lama Sekolah (tahun) vs Penduduk Miskin (%)",
xlab = "Rata-Rata Lama Sekolah (tahun)",
ylab = "Penduduk Miskin (persen)")
summary(data$Y)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.560 8.415 10.680 11.393 13.575 17.830
boxplot(data$Y)
summary(data$X1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6.220 7.140 7.630 7.979 8.650 10.900
boxplot(data$X1)
x <- data$X1
y <- data$Y
b1 <- (sum(x*y)-sum(x)*sum(y)/n)/(sum(x^2)-(sum(x)^2/n))
b0 <- mean(y)-b1*mean(x)
cat("Koefisien b0:", b0, "\n")
## Koefisien b0: 26.73929
cat("Koefisien b1:", b1, "\n")
## Koefisien b1: -1.923285
galat <- y-(b0+b1*x)
ragam_galat <- sum(galat^2)/(n-2)
se_b0 <- sqrt(ragam_galat*(1/n+mean(x)^2/sum((x-mean(x))^2)))
se_b1 <- sqrt(ragam_galat/sum((x-mean(x))^2))
cat("Standar error b0:", se_b0, "\n")
## Standar error b0: 2.966081
cat("Standar error b1:", se_b1, "\n")
## Standar error b1: 0.3673938
t_b0 <- b0/se_b0
t_b1 <- b1/se_b1
p_b0 <- 2*pt(-abs(t_b0 ),df<-n-2)
p_b1 <- 2*pt(-abs(t_b1 ),df<-n-2)
cat("Nilai t pada b0 adalah", t_b0, "dengan nilai p sebesar", p_b0, "\n")
## Nilai t pada b0 adalah 9.015022 dengan nilai p sebesar 2.032569e-10
cat("Nilai t pada b1 adalah", t_b1, "dengan nilai p sebesar", p_b1, "\n")
## Nilai t pada b1 adalah -5.234941 dengan nilai p sebesar 9.22464e-06
r <- (sum(x*y)-sum(x)*sum(y)/n)/
sqrt((sum(x^2)-(sum(x)^2/n))*(sum(y^2)-(sum(y)^2/n)))
Koef_det <- r^2
Koef_det
## [1] 0.4536841
Adj_R2 <- 1-((1-Koef_det)*(n-1)/(n-1-1))
Adj_R2
## [1] 0.4371291
galat<-y-(b0+b1*x)
JKG <- sum((y - (b0+b1*x))^2)
JKReg <- sum(((b0+b1*x)- mean(y))^2)
JKT <- sum((y - mean(y))^2)
JKT <- JKReg+JKG
dbReg <- 1
dbg <- n-2
dbt <- n-1
(Fhit <- (JKReg/dbReg)/(JKG/dbg))
## [1] 27.40461
(p_Fhit <- 1-pf(Fhit, dbReg, dbg, lower.tail <- F))
## [1] 9.22464e-06
model <- lm(Y~X1, data <- data)
summary(model)
##
## Call:
## lm(formula = Y ~ X1, data = data <- data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.6955 -1.9861 -0.5266 2.0245 5.6115
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 26.7393 2.9661 9.015 2.03e-10 ***
## X1 -1.9233 0.3674 -5.235 9.22e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.668 on 33 degrees of freedom
## Multiple R-squared: 0.4537, Adjusted R-squared: 0.4371
## F-statistic: 27.4 on 1 and 33 DF, p-value: 9.225e-06
anova(model)
## Analysis of Variance Table
##
## Response: Y
## Df Sum Sq Mean Sq F value Pr(>F)
## X1 1 195.09 195.095 27.405 9.225e-06 ***
## Residuals 33 234.93 7.119
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Kesimpulan:
Model yang terbentuk adalah sebagai berikut:Y^=26.7393-1.9233X1 dengan Y adalah persentase penduduk miskin dan X1 adalah rata-rata lama sekolah.
Didapatkan nilai 𝛽0^=26.7393 artinya nilai dugaan rataan persentase penduduk miskin ketika rata-rata lama sekolah bernilai 0 persen adalah 26.7393%, akan tetapi nilai 0 tidak ada dalam selang pengamatan persentase akses sanitasi layak sehingga 𝛽0^ tidak dapat didefinisikan lebih lanjut
Nilai 𝛽1^=−1.9233 artinya nilai dugaan perubahan dugaan rataan persentase penduduk miskin jika rata-rata lama sekolah berubah satu satuan adalah sebesar −1.9233%
Koefisien determinasi yang dihasilkan adalah 0.4537 atau 45.37% artinya keragaman persentase penduduk miskin yang dapat dijelaskan oleh persentase akses sanitasi layak adalah sebesar 45.37%, sisanya yaitu 54.63% dijelaskan oleh peubah lain yang tidak dimasukkan dalam model.