STEP 1 IDENTIFIKASI DATA

Data yang digunakan ialah data mengenai Persentase Rumah Tangga dengan Akses Air Minum Layak Menurut Kabupaten/Kota Sumatera Utara pada tahun 2020 hingga 2023.

Sumber: Badan Pusat Statistik Provinsi Sumatera Utara ( https://sumut.bps.go.id/id/publication/2024/07/19/7ac5c095d82a3117156f85c2/statistik-kesehatan-dan-perumahan-provinsi-sumatera-utara-2023.html )

Input Data

library(tidyverse)
library(readxl)
# 1. Baca file Excel
data_air<- read_excel("C:/Users/asus/Documents/KULIAH STELLA/SEMESTER 5/PERMINATAN_SL/air sumut.xlsx")
names(data_air)
## [1] "Kabupaten/Kota" "2020"           "2021"           "2022"          
## [5] "2023"
head(data_air)
## # A tibble: 6 × 5
##   `Kabupaten/Kota` `2020` `2021` `2022` `2023`
##   <chr>             <dbl>  <dbl>  <dbl>  <dbl>
## 1 Nias               49.5   47.8   51.6   51.3
## 2 Mandailing Natal   68.0   73.8   75.5   78.9
## 3 Tapanuli Selatan   68.1   67.4   73.2   75.8
## 4 Tapanuli Tengah    80.7   68.8   79.3   78.3
## 5 Tapanuli Utara     89.3   89.1   92.9   90.8
## 6 Toba Samosir       92.7   95.0   96.0   96.0
# 2. Ubah ke format long (agar dapat digunakan untuk time series)
data_long <- data_air %>%
  pivot_longer(cols = `2020`:`2023`,
               names_to = "Tahun",
               values_to = "Persentase") %>%
  rename(KabupatenKota = `Kabupaten/Kota`)

# 3. Ubah Tahun ke numeric
data_long$Tahun <- as.numeric(data_long$Tahun)
head(data_long)
## # A tibble: 6 × 3
##   KabupatenKota    Tahun Persentase
##   <chr>            <dbl>      <dbl>
## 1 Nias              2020       49.5
## 2 Nias              2021       47.8
## 3 Nias              2022       51.6
## 4 Nias              2023       51.3
## 5 Mandailing Natal  2020       68.0
## 6 Mandailing Natal  2021       73.8

STEP 2 VISUALISASI DATA (BOXPLOT)

Melakukan visualisasi boxplot digunakan untuk :

boxplot(Persentase ~ Tahun, data = data_long,
        col = c("royalblue3", "salmon", "forestgreen", "wheat"), 
        border = "black",         
        main = "Boxplot Akses Air Minum Layak Antar Tahun di Sumatera Utara",
        xlab = "Tahun",
        ylab = "Persentase Rumah Tangga (%)",
        cex.axis = 0.9,            # ukuran font sumbu
        cex.lab = 0.9,             # ukuran font label sumbu
        cex.main = 1.0)            # ukuran font judul

Interpretasi Hasil Visualisasi Boxplot

  1. Median (ditunjukkan dengan garis tebal hitam) pada setiap tahun berada pada tingkat yang relatif tinggi, yakni di atas 80%. Hal ini menunjukkan bahwa sebagian besar kabupaten/kota telah memiliki capaian akses air minum layak yang tergolong baik. Dengan kata lain, distribusi akses air minum layak di tingkat daerah menunjukkan pencapaian yang cukup merata pada level menengah ke atas, sehingga dapat disimpulkan bahwa secara umum kondisi layanan air minum di Sumatera Utara telah memenuhi standar dasar kebutuhan masyarakat.

  2. Whisker pada tahun 2020 tampak lebih panjang dibandingkan dengan tahun-tahun lainnya, maka data ditahun 2020 terdapat variasi capaian akses air minum layak antar kabupaten/kota. Hal ini menunjukkan bahwa pada tahun tersebut masih terdapat daerah dengan tingkat akses yang sangat rendah, sementara di sisi lain terdapat daerah yang telah mencapai akses sangat tinggi.

  3. Pada periode 2021–2023, whisker terlihat lebih pendek dan distribusi data antar kabupaten/kota menjadi lebih rapat. Kondisi ini mengindikasikan bahwa perbedaan capaian akses air minum layak antarwilayah semakin mengecil. Dengan kata lain, kesenjangan antar kabupaten/kota dalam hal penyediaan akses air minum layak mulai berkurang.

  4. Selain itu, di tahun 2023 masih terdapat outlier dengan capaian akses air minum layak di bawah 60%. Hal ini menunjukkan bahwa masih ada daerah tertentu yang memiliki capaian jauh lebih rendah.

  5. Secara umum, distribusi capaian akses air minum layak cenderung lebih homogen mulai tahun 2021 ke 2023, ditunjukkan dengan panjang whisker yang hampir mirip yakni lebih pendek dan sebaran data yang lebih rapat. Kondisi ini berbeda dengan tahun 2020 yang memperlihatkan variasi lebih besar, di mana terdapat perbedaan cukup jauh antar kabupaten/kota.

STEP 3 UJI STATISTIK (Bartlett’s Test)

bartlett.test(Persentase ~ Tahun, data = data_long)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Persentase by Tahun
## Bartlett's K-squared = 3.6221, df = 3, p-value = 0.3053

Interpretasi Hasil Uji Bartlett

Berdasarkan hasil output diatas :

P-value sebesar 0,3053 > 0,05 sehingga dapat diputuskan bahwa gagal menolak \(H_0\) . Hal ini berarti varians persentase rumah tangga dengan akses air minum layak pada tahun 2020, 2021, 2022, dan 2023 di Kabupaten/kota Sumatera Utara dapat dianggap homogen atau memenuhi asumsi homogenitas varians.

STEP 4 UJI STATISTIK (Levene’s Test)

library(car)
data_long$Tahun <- as.factor(data_long$Tahun)
leveneTest(Persentase ~ Tahun, data = data_long)
## Levene's Test for Homogeneity of Variance (center = median)
##        Df F value Pr(>F)
## group   3  1.1485 0.3322
##       128

Interpretasi Hasil Uji Levene

Berdasarkan hasil output diatas :

P-value sebesar 0.3322 > 0.05 sehingga dapat diputuskan bahwa gagal menolak \(H_0\) . Hal ini berarti varians persentase rumah tangga dengan akses air minum layak pada tahun 2020, 2021, 2022, dan 2023 di Kabupaten/kota Sumatera Utara dapat dianggap homogen atau memenuhi asumsi homogenitas varians.

STEP 5 UJI STATISTIK ANOVA

anova_sumut <- aov(Persentase ~ Tahun, data = data_long)
summary(anova_sumut)
##              Df Sum Sq Mean Sq F value Pr(>F)
## Tahun         3    565   188.5    0.91  0.438
## Residuals   128  26497   207.0

Interpretasi Hasil Uji ANOVA

Nilai p-value 0.438 > 0.05, sehingga gagal menolak \(H_0\) . Dapat diartikan tidak terdapat perbedaan yang signifikan pada rata-rata persentase rumah tangga dengan akses air minum layak antar tahun (2020, 2021, 2022, dan 2023). Dengan kata lain, hasil uji statistik ANOVA menunjukkan bahwa tingkat akses air minum layak di Sumatera Utara relatif stabil dari tahun ke tahun.

STEP 6 UJI STATISTIK FORECASTING (Holt’s Method)

library(dplyr)
library(forecast)
library(ggfortify)
# Hitung rata-rata capaian per tahun
avg_year <- data_long %>%
  group_by(Tahun) %>%
  summarise(rata2 = mean(Persentase, na.rm = TRUE))

# Ubah jadi time series (2020–2023)
avg_year$Tahun <- as.numeric(as.character(avg_year$Tahun))

# Buat time series
data_ts <- ts(avg_year$rata2, start = min(avg_year$Tahun), frequency = 1)

# Holt’s method
fit_holt <- holt(data_ts, h = 10)   # h = jumlah tahun ke depan
summary(fit_holt)
## 
## Forecast method: Holt's method
## 
## Model Information:
## Holt's method 
## 
## Call:
## holt(y = data_ts, h = 10)
## 
##   Smoothing parameters:
##     alpha = 0.2141 
##     beta  = 1 
## 
##   Initial states:
##     l = 81.707 
##     b = 1.8161 
## 
##   sigma:  1.1952
## Error measures:
##                      ME     RMSE      MAE        MPE   MAPE      MASE
## Training set -0.6176237 1.195237 1.111139 -0.7554679 1.3258 0.6856319
##                     ACF1
## Training set -0.03520017
## 
## Forecasts:
##      Point Forecast    Lo 80     Hi 80    Lo 95     Hi 95
## 2024       88.32985 86.79809  89.86161 85.98723  90.67247
## 2025       89.61704 87.20775  92.02632 85.93235  93.30172
## 2026       90.90422 86.74412  95.06432 84.54189  97.26655
## 2027       92.19141 85.74593  98.63689 82.33390 102.04892
## 2028       93.47859 84.35661 102.60057 79.52773 107.42945
## 2029       94.76578 82.64151 106.89004 76.22331 113.30824
## 2030       96.05296 80.63872 111.46720 72.47891 119.62701
## 2031       97.34015 78.37422 116.30607 68.33427 126.34602
## 2032       98.62733 75.86745 121.38721 63.81909 133.43557
## 2033       99.91451 73.13375 126.69528 58.95686 140.87217
# Plot hasil forecast
autoplot(fit_holt) +
  ggtitle("Forecast Persentase Rumah Tangga dengan Akses Air Minum Layak\nSumatera Utara dengan Holt’s method") +
  xlab("Tahun") +
  ylab("Persentase (%)") +
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 12),
    axis.title = element_text(face = "bold"),
    panel.grid.minor = element_blank(),
    panel.grid.major = element_line(color = "gray85")
  ) +
  scale_x_continuous(breaks = seq(2020, 2028, 1)) +
  scale_y_continuous(labels = function(x) paste0(x, "%")) +
  scale_colour_manual(values = c("tomato4")) +
  scale_fill_manual(values = c("salmon", "lightgray"))
## Scale for y is already present.
## Adding another scale for y, which will replace the existing scale.

Interpretasi Hasil Holt’s method

  1. RMSE: 1.195 → kesalahan prediksi rata-rata sekitar ± 1.2 poin.

    MAPE: 1.32% → cukup kecil, artinya model memiliki tingkat akurasi yang baik.

  2. Dalam empat tahun terakhir yakni 2020 - 2023, akses rumah tangga terhadap air minum layak menunjukkan tren meningkat. Jika pola ini berlanjut,maka pada tahun 2030 diproyeksikan mencapai lebih dari 95%, mendekati universal access. Namun, interval prediksi melebar (shaded area di grafik) hal ini menunjukkan ketidakpastian semakin besar untuk jangka panjang.

  3. Oleh karena itu, kebijakan yang dapat ditempuh pemerintah daerah adalah menjaga konsistensi program penyediaan air bersih, sehingga proyeksi peningkatan akses dapat tercapai, meskipun ketidakpastian di tahun-tahun mendatang masih cukup tinggi.