Data yang digunakan ialah data mengenai Persentase Rumah Tangga dengan Akses Air Minum Layak Menurut Kabupaten/Kota Sumatera Utara pada tahun 2020 hingga 2023.
Sumber: Badan Pusat Statistik Provinsi Sumatera Utara ( https://sumut.bps.go.id/id/publication/2024/07/19/7ac5c095d82a3117156f85c2/statistik-kesehatan-dan-perumahan-provinsi-sumatera-utara-2023.html )
library(tidyverse)
library(readxl)
# 1. Baca file Excel
data_air<- read_excel("C:/Users/asus/Documents/KULIAH STELLA/SEMESTER 5/PERMINATAN_SL/air sumut.xlsx")
names(data_air)
## [1] "Kabupaten/Kota" "2020" "2021" "2022"
## [5] "2023"
head(data_air)
## # A tibble: 6 × 5
## `Kabupaten/Kota` `2020` `2021` `2022` `2023`
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Nias 49.5 47.8 51.6 51.3
## 2 Mandailing Natal 68.0 73.8 75.5 78.9
## 3 Tapanuli Selatan 68.1 67.4 73.2 75.8
## 4 Tapanuli Tengah 80.7 68.8 79.3 78.3
## 5 Tapanuli Utara 89.3 89.1 92.9 90.8
## 6 Toba Samosir 92.7 95.0 96.0 96.0
# 2. Ubah ke format long (agar dapat digunakan untuk time series)
data_long <- data_air %>%
pivot_longer(cols = `2020`:`2023`,
names_to = "Tahun",
values_to = "Persentase") %>%
rename(KabupatenKota = `Kabupaten/Kota`)
# 3. Ubah Tahun ke numeric
data_long$Tahun <- as.numeric(data_long$Tahun)
head(data_long)
## # A tibble: 6 × 3
## KabupatenKota Tahun Persentase
## <chr> <dbl> <dbl>
## 1 Nias 2020 49.5
## 2 Nias 2021 47.8
## 3 Nias 2022 51.6
## 4 Nias 2023 51.3
## 5 Mandailing Natal 2020 68.0
## 6 Mandailing Natal 2021 73.8
Melakukan visualisasi boxplot digunakan untuk :
Melihat distribusi persentase akses air minum layak di seluruh kabupaten/kota per tahun.
Mengidentifikasi apakah terdapat outlier atau tidak.
boxplot(Persentase ~ Tahun, data = data_long,
col = c("royalblue3", "salmon", "forestgreen", "wheat"),
border = "black",
main = "Boxplot Akses Air Minum Layak Antar Tahun di Sumatera Utara",
xlab = "Tahun",
ylab = "Persentase Rumah Tangga (%)",
cex.axis = 0.9, # ukuran font sumbu
cex.lab = 0.9, # ukuran font label sumbu
cex.main = 1.0) # ukuran font judul
Median (ditunjukkan dengan garis tebal hitam) pada setiap tahun berada pada tingkat yang relatif tinggi, yakni di atas 80%. Hal ini menunjukkan bahwa sebagian besar kabupaten/kota telah memiliki capaian akses air minum layak yang tergolong baik. Dengan kata lain, distribusi akses air minum layak di tingkat daerah menunjukkan pencapaian yang cukup merata pada level menengah ke atas, sehingga dapat disimpulkan bahwa secara umum kondisi layanan air minum di Sumatera Utara telah memenuhi standar dasar kebutuhan masyarakat.
Whisker pada tahun 2020 tampak lebih panjang dibandingkan dengan tahun-tahun lainnya, maka data ditahun 2020 terdapat variasi capaian akses air minum layak antar kabupaten/kota. Hal ini menunjukkan bahwa pada tahun tersebut masih terdapat daerah dengan tingkat akses yang sangat rendah, sementara di sisi lain terdapat daerah yang telah mencapai akses sangat tinggi.
Pada periode 2021–2023, whisker terlihat lebih pendek dan distribusi data antar kabupaten/kota menjadi lebih rapat. Kondisi ini mengindikasikan bahwa perbedaan capaian akses air minum layak antarwilayah semakin mengecil. Dengan kata lain, kesenjangan antar kabupaten/kota dalam hal penyediaan akses air minum layak mulai berkurang.
Selain itu, di tahun 2023 masih terdapat outlier dengan capaian akses air minum layak di bawah 60%. Hal ini menunjukkan bahwa masih ada daerah tertentu yang memiliki capaian jauh lebih rendah.
Secara umum, distribusi capaian akses air minum layak cenderung lebih homogen mulai tahun 2021 ke 2023, ditunjukkan dengan panjang whisker yang hampir mirip yakni lebih pendek dan sebaran data yang lebih rapat. Kondisi ini berbeda dengan tahun 2020 yang memperlihatkan variasi lebih besar, di mana terdapat perbedaan cukup jauh antar kabupaten/kota.
bartlett.test(Persentase ~ Tahun, data = data_long)
##
## Bartlett test of homogeneity of variances
##
## data: Persentase by Tahun
## Bartlett's K-squared = 3.6221, df = 3, p-value = 0.3053
Berdasarkan hasil output diatas :
P-value sebesar 0,3053 > 0,05 sehingga dapat diputuskan bahwa gagal menolak \(H_0\) . Hal ini berarti varians persentase rumah tangga dengan akses air minum layak pada tahun 2020, 2021, 2022, dan 2023 di Kabupaten/kota Sumatera Utara dapat dianggap homogen atau memenuhi asumsi homogenitas varians.
library(car)
data_long$Tahun <- as.factor(data_long$Tahun)
leveneTest(Persentase ~ Tahun, data = data_long)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 1.1485 0.3322
## 128
Berdasarkan hasil output diatas :
P-value sebesar 0.3322 > 0.05 sehingga dapat diputuskan bahwa gagal menolak \(H_0\) . Hal ini berarti varians persentase rumah tangga dengan akses air minum layak pada tahun 2020, 2021, 2022, dan 2023 di Kabupaten/kota Sumatera Utara dapat dianggap homogen atau memenuhi asumsi homogenitas varians.
anova_sumut <- aov(Persentase ~ Tahun, data = data_long)
summary(anova_sumut)
## Df Sum Sq Mean Sq F value Pr(>F)
## Tahun 3 565 188.5 0.91 0.438
## Residuals 128 26497 207.0
Nilai p-value 0.438 > 0.05, sehingga gagal menolak \(H_0\) . Dapat diartikan tidak terdapat perbedaan yang signifikan pada rata-rata persentase rumah tangga dengan akses air minum layak antar tahun (2020, 2021, 2022, dan 2023). Dengan kata lain, hasil uji statistik ANOVA menunjukkan bahwa tingkat akses air minum layak di Sumatera Utara relatif stabil dari tahun ke tahun.
library(dplyr)
library(forecast)
library(ggfortify)
# Hitung rata-rata capaian per tahun
avg_year <- data_long %>%
group_by(Tahun) %>%
summarise(rata2 = mean(Persentase, na.rm = TRUE))
# Ubah jadi time series (2020–2023)
avg_year$Tahun <- as.numeric(as.character(avg_year$Tahun))
# Buat time series
data_ts <- ts(avg_year$rata2, start = min(avg_year$Tahun), frequency = 1)
# Holt’s method
fit_holt <- holt(data_ts, h = 10) # h = jumlah tahun ke depan
summary(fit_holt)
##
## Forecast method: Holt's method
##
## Model Information:
## Holt's method
##
## Call:
## holt(y = data_ts, h = 10)
##
## Smoothing parameters:
## alpha = 0.2141
## beta = 1
##
## Initial states:
## l = 81.707
## b = 1.8161
##
## sigma: 1.1952
## Error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -0.6176237 1.195237 1.111139 -0.7554679 1.3258 0.6856319
## ACF1
## Training set -0.03520017
##
## Forecasts:
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 2024 88.32985 86.79809 89.86161 85.98723 90.67247
## 2025 89.61704 87.20775 92.02632 85.93235 93.30172
## 2026 90.90422 86.74412 95.06432 84.54189 97.26655
## 2027 92.19141 85.74593 98.63689 82.33390 102.04892
## 2028 93.47859 84.35661 102.60057 79.52773 107.42945
## 2029 94.76578 82.64151 106.89004 76.22331 113.30824
## 2030 96.05296 80.63872 111.46720 72.47891 119.62701
## 2031 97.34015 78.37422 116.30607 68.33427 126.34602
## 2032 98.62733 75.86745 121.38721 63.81909 133.43557
## 2033 99.91451 73.13375 126.69528 58.95686 140.87217
# Plot hasil forecast
autoplot(fit_holt) +
ggtitle("Forecast Persentase Rumah Tangga dengan Akses Air Minum Layak\nSumatera Utara dengan Holt’s method") +
xlab("Tahun") +
ylab("Persentase (%)") +
theme_minimal(base_size = 14) +
theme(
plot.title = element_text(hjust = 0.5, face = "bold", size = 12),
axis.title = element_text(face = "bold"),
panel.grid.minor = element_blank(),
panel.grid.major = element_line(color = "gray85")
) +
scale_x_continuous(breaks = seq(2020, 2028, 1)) +
scale_y_continuous(labels = function(x) paste0(x, "%")) +
scale_colour_manual(values = c("tomato4")) +
scale_fill_manual(values = c("salmon", "lightgray"))
## Scale for y is already present.
## Adding another scale for y, which will replace the existing scale.
RMSE: 1.195 → kesalahan prediksi rata-rata sekitar ± 1.2 poin.
MAPE: 1.32% → cukup kecil, artinya model memiliki tingkat akurasi yang baik.
Dalam empat tahun terakhir yakni 2020 - 2023, akses rumah tangga terhadap air minum layak menunjukkan tren meningkat. Jika pola ini berlanjut,maka pada tahun 2030 diproyeksikan mencapai lebih dari 95%, mendekati universal access. Namun, interval prediksi melebar (shaded area di grafik) hal ini menunjukkan ketidakpastian semakin besar untuk jangka panjang.
Oleh karena itu, kebijakan yang dapat ditempuh pemerintah daerah adalah menjaga konsistensi program penyediaan air bersih, sehingga proyeksi peningkatan akses dapat tercapai, meskipun ketidakpastian di tahun-tahun mendatang masih cukup tinggi.