1. Pendahuluan

Hipertensi merupakan salah satu penyakit tidak menular yang menjadi masalah kesehatan utama karena prevalensinya yang terus meningkat dan dampaknya yang serius terhadap kesehatan masyarakat. Peningkatan jumlah kasus hipertensi dari waktu ke waktu menimbulkan tantangan bagi sistem pelayanan kesehatan, khususnya dalam perencanaan program pencegahan, pengendalian, serta penyediaan sumber daya kesehatan yang memadai.

Jumlah kasus hipertensi yang tercatat secara bulanan umumnya menunjukkan pola fluktuatif dan tidak selalu stasioner, sehingga sulit dianalisis hanya dengan metode statistik sederhana. Oleh karena itu, analisis deret waktu menjadi penting untuk mengidentifikasi pola perubahan data secara kronologis. Metode Autoregressive Integrated Moving Average (ARIMA) digunakan karena mampu menangani data tidak stasioner dan memberikan peramalan jangka pendek yang cukup akurat.

Tujuan dari analisis ini adalah untuk membangun model ARIMA yang sesuai dalam memodelkan jumlah kasus hipertensi serta melakukan peramalan jumlah kasus pada periode mendatang. Hasil peramalan diharapkan dapat memberikan informasi kuantitatif yang bermanfaat sebagai dasar pertimbangan dalam perencanaan dan pengambilan keputusan di bidang kesehatan.

2. Deskripsi Data dan Sumber Data

Data yang digunakan dalam analisis ini merupakan data sekunder jumlah kasus hipertensi bulanan periode 2022–2025 yang diperoleh dari Dashboard Kesehatan Kota Semarang, yaitu LEKMINKES (Laporan Eksekutif dan Informasi Kesehatan) yang dikelola oleh Dinas Kesehatan Kota Semarang.

Data jumlah kasus hipertensi diambil langsung dari halaman Dashboard Kesehatan Kota Semarang melalui LEKMINKES (https://lekminkes.dinkes.semarangkota.go.id/home). Data ini telah teragregasi menurut bulan dan tahun sehingga sesuai untuk analisis deret waktu (time series).

Langkah awal sebelum melakukan analisis, data diimpor ke dalam R dari file Excel menggunakan paket readxl untuk memudahkan proses analisis selanjutnya.

library(tseries)
## Warning: package 'tseries' was built under R version 4.4.3
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
library(forecast)
## Warning: package 'forecast' was built under R version 4.4.3
library(readr)
## Warning: package 'readr' was built under R version 4.4.2
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
data <- read_excel("C:/Users/ASUS Vivobook/Downloads/hipertensi smg 22-25.xlsx")
data
## # A tibble: 48 × 2
##    Periode             `Jumlah Kasus`
##    <dttm>                       <dbl>
##  1 2022-01-01 00:00:00          25049
##  2 2022-02-01 00:00:00          27296
##  3 2022-03-01 00:00:00          27034
##  4 2022-04-01 00:00:00          26245
##  5 2022-05-01 00:00:00          23187
##  6 2022-06-01 00:00:00          26237
##  7 2022-07-01 00:00:00          27542
##  8 2022-08-01 00:00:00          15735
##  9 2022-09-01 00:00:00          21051
## 10 2022-10-01 00:00:00          26544
## # ℹ 38 more rows

3. Exploratory Data Analysis (EDA)

3.1 Statistika Deskriptif

Analisis deskriptif dilakukan untuk menggambarkan karakteristik data hipertensi secara umum. Statistik deskriptif seperti nilai minimum, maksimum, rata-rata, dan sebaran data digunakan untuk memberikan gambaran awal mengenai tingkat variasi data selama periode pengamatan.

summary(data$`Jumlah Kasus`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15735   24976   26459   26112   28741   31203

Statistik deskriptif menunjukkan bahwa jumlah kasus hipertensi bervariasi selama periode pengamatan, dengan nilai minimum 15.735 kasus dan maksimum 31.203 kasus. Nilai rata-rata yang mendekati median menunjukkan sebaran data yang relatif seimbang. Variasi data dari waktu ke waktu mendukung penggunaan analisis time series.

3.2 Plot Time Series

Visualisasi data dilakukan menggunakan plot time series untuk mengamati pola perkembangan jumlah kasus hipertensi dari waktu ke waktu. Grafik ini digunakan untuk mengidentifikasi adanya tren meningkat atau menurun, fluktuasi data, serta kemungkinan pola musiman selama periode pengamatan.

hipertensi_ts <- ts(
  data$`Jumlah Kasus`,
  start = c(2022, 1),
  frequency = 12
)

plot.ts(hipertensi_ts)

4. Metode Analisis

4.1 Uji Stasioneritas

Uji stasioneritas dilakukan untuk mengetahui apakah data jumlah kasus hipertensi bersifat stasioner atau tidak. Pengujian dilakukan menggunakan Augmented Dickey-Fuller (ADF). Uji ini bertujuan untuk memastikan kestasioneran data sebelum dilakukan analisis time series.

Hipotesis: H₀: Data mengandung unit root, sehingga data tidak stasioner. H₁: Data tidak mengandung unit root, sehingga data stasioner

Kriteria uji: Jika p-value < 0,05, maka H₀ ditolak dan data dinyatakan stasioner. Jika p-value ≥ 0,05, maka H₀ gagal ditolak dan data dinyatakan tidak stasioner.

adf.test(hipertensi_ts)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  hipertensi_ts
## Dickey-Fuller = -1.0742, Lag order = 3, p-value = 0.917
## alternative hypothesis: stationary

Hasil uji ADF menunjukkan nilai p-value 0,917 (> 0,05), sehingga data dinyatakan tidak stasioner. Oleh karena itu, diperlukan proses differencing sebelum dilakukan analisis time series lebih lanjut.

#Differencing dan test kestasioneran ulang
hipertensi_diff <- diff(hipertensi_ts)
adf.test(hipertensi_diff)
## Warning in adf.test(hipertensi_diff): p-value smaller than printed p-value
## 
##  Augmented Dickey-Fuller Test
## 
## data:  hipertensi_diff
## Dickey-Fuller = -4.2749, Lag order = 3, p-value = 0.01
## alternative hypothesis: stationary

Hasil uji ADF setelah differencing menunjukkan nilai p-value 0,01 (< 0,05), sehingga data dinyatakan stasioner dan layak digunakan dalam pemodelan ARIMA.

4.2 Identifikasi Model (ACF dan PACF)

Setelah data dinyatakan stasioner melalui proses differencing, tahap selanjutnya adalah identifikasi model ARIMA. Identifikasi ini dilakukan dengan menganalisis pola Autocorrelation Function (ACF) dan Partial Autocorrelation Function (PACF) pada data yang telah stasioner.

#Plot ACF dan PACF data yg sudah stasioner
acf(hipertensi_diff, main = "ACF Data Differencing")

pacf(hipertensi_diff, main = "PACF Data Differencing")

Hasil analisis menunjukkan bahwa plot PACF mengalami cut-off pada lag ke-1, sedangkan plot ACF menunjukkan pola peluruhan secara bertahap. Pola tersebut mengindikasikan bahwa model ARIMA(1,1,0) merupakan kandidat awal yang layak untuk dipertimbangkan.

Namun demikian, identifikasi model berdasarkan ACF dan PACF bersifat indikatif, sehingga diperlukan evaluasi lanjutan melalui estimasi beberapa model alternatif dengan orde rendah.

4.3 Estimasi Model Terbaik

Pada tahap estimasi model, penelitian ini menguji tiga kandidat model ARIMA yang dipilih berdasarkan hasil identifikasi menggunakan plot ACF dan PACF, yaitu ARIMA(1,1,0), ARIMA(0,1,1), dan ARIMA(1,1,1). Ketiga model tersebut dipilih karena memiliki orde rendah dan secara teoritis sesuai dengan karakteristik data.

m110 <- arima(hipertensi_ts, order = c(1,1,0))
m011 <- arima(hipertensi_ts, order = c(0,1,1))
m111 <- arima(hipertensi_ts, order = c(1,1,1))

4.4 Pemilihan Model Terbaik

Pemilihan model terbaik dilakukan dengan membandingkan nilai Akaike Information Criterion (AIC) dan Bayesian Information Criterion (BIC) dari masing-masing model. Model dengan nilai AIC dan BIC yang lebih kecil dipandang memiliki keseimbangan yang lebih baik antara kecocokan model dan kompleksitas parameter.

AIC(m110, m011, m111)
##      df      AIC
## m110  2 897.7693
## m011  2 891.3546
## m111  3 891.9310
BIC(m110, m011, m111)
##      df      BIC
## m110  2 901.4696
## m011  2 895.0549
## m111  3 897.4815

Hasil analisis menunjukkan bahwa model ARIMA(0,1,1) menghasilkan nilai AIC sebesar 891,35 dan BIC sebesar 895,05, yang lebih kecil dibandingkan dengan model ARIMA(1,1,0) (AIC = 897,77; BIC = 901,47) dan ARIMA(1,1,1) (AIC = 891,93; BIC = 897,48).

Berdasarkan hasil tersebut, dari tiga model yang diuji, model ARIMA(0,1,1) dipilih sebagai model terbaik.

5. Hasil dan Pembahasan

5.1 Ringkasan model

summary(m011)
## 
## Call:
## arima(x = hipertensi_ts, order = c(0, 1, 1))
## 
## Coefficients:
##           ma1
##       -0.5981
## s.e.   0.1309
## 
## sigma^2 estimated as 9180449:  log likelihood = -443.68,  aic = 891.35
## 
## Training set error measures:
##                     ME   RMSE      MAE       MPE    MAPE      MASE       ACF1
## Training set -205.1292 2998.2 2300.879 -2.244534 9.72192 0.8768166 0.09587978

Berdasarkan hasil estimasi model ARIMA(0,1,1), diperoleh koefisien MA(1) sebesar -0,5981 dengan standar error 0,1309. Nilai koefisien tersebut menunjukkan bahwa komponen kesalahan pada periode sebelumnya memiliki pengaruh terhadap perubahan jumlah kasus pada periode berjalan. Besarnya nilai koefisien yang relatif jauh dari nol dengan standar error yang kecil mengindikasikan bahwa parameter MA(1) berperan penting dalam model.

Evaluasi kinerja model menunjukkan nilai RMSE sebesar 2.998,2 dan MAE sebesar 2.300,9, sedangkan nilai MAPE sebesar 9,72% mengindikasikan bahwa tingkat kesalahan prediksi relatif rendah. Selain itu, nilai ACF residual lag pertama sebesar 0,096 menunjukkan tidak adanya autokorelasi yang kuat pada residual, sehingga residual cenderung bersifat acak. Dengan demikian, model ARIMA(0,1,1) dapat dikatakan telah mampu merepresentasikan pola data dengan baik dan layak digunakan untuk analisis lanjutan.

5.2 Uji Diagnostik Residual

Setelah diperoleh model ARIMA terbaik, langkah selanjutnya adalah melakukan uji diagnostik residual untuk mengevaluasi kelayakan model. Uji diagnostik residual bertujuan untuk memastikan bahwa residual yang dihasilkan model tidak mengandung pola tertentu dan telah memenuhi asumsi white noise.

Hipotesis: H₀: Tidak terdapat autokorelasi pada residual hingga lag tertentu (residual bersifat white noise). H₁: Terdapat autokorelasi pada residual (residual tidak bersifat white noise).

Kriteria pengambilan keputusan dalam uji Ljung–Box didasarkan pada nilai p-value dengan tingkat signifikansi 5%. Jika nilai p-value lebih besar dari 0,05, maka hipotesis nol tidak ditolak dan residual dinyatakan tidak memiliki autokorelasi atau bersifat white noise. Sebaliknya, jika nilai p-value kurang dari atau sama dengan 0,05, maka hipotesis nol ditolak dan residual dinyatakan mengandung autokorelasi.

checkresiduals(m011)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,1)
## Q* = 12.071, df = 9, p-value = 0.2093
## 
## Model df: 1.   Total lags used: 10

Berdasarkan hasil uji diagnostik terhadap residual model ARIMA(0,1,1), hasil pengujian menunjukkan nilai statistik Ljung–Box sebesar 12,071 dengan derajat kebebasan 9 dan p-value sebesar 0,2093. Karena nilai p-value lebih besar dari tingkat signifikansi 5% (0,05), maka hipotesis nol tidak ditolak, yang berarti residual tidak menunjukkan adanya autokorelasi sehingga data layak dianalisis lebih lanjut.

5.3 Forecasting

Setelah model ARIMA(0,1,1) dinyatakan sebagai model terbaik dan telah memenuhi asumsi diagnostik residual, tahap selanjutnya adalah melakukan peramalan (forecasting). Peramalan bertujuan untuk memprediksi nilai jumlah kasus hipertensi pada beberapa periode ke depan berdasarkan pola historis data yang telah dimodelkan.

Pada tahap ini, peramalan dilakukan menggunakan model ARIMA(0,1,1) yang telah terestimasi. Hasil peramalan mencakup nilai prediksi dan interval kepercayaan, yang digunakan untuk menggambarkan tingkat ketidakpastian prediksi pada setiap periode ramalan.

fc <- forecast(m011, h = 12)
plot(fc)

Berdasarkan grafik hasil peramalan menggunakan model ARIMA(0,1,1), terlihat bahwa nilai prediksi jumlah kasus hipertensi pada periode mendatang cenderung berada pada kisaran yang relatif stabil dibandingkan fluktuasi pada data historis. Garis ramalan menunjukkan kecenderungan yang tidak mengalami peningkatan maupun penurunan yang tajam, sehingga mengindikasikan bahwa pola perubahan jumlah kasus pada periode ke depan diperkirakan mengikuti pola terakhir yang terbentuk pada data sebelumnya.

Selain itu, pita interval kepercayaan pada grafik peramalan terlihat semakin melebar seiring bertambahnya horizon waktu ramalan. Hal ini menunjukkan bahwa tingkat ketidakpastian prediksi meningkat untuk periode yang lebih jauh, yang merupakan karakteristik umum dalam peramalan deret waktu. Meskipun demikian, hasil peramalan masih berada dalam rentang yang wajar dan konsisten dengan variasi data historis, sehingga model ARIMA(0,1,1) dinilai cukup memadai untuk memproyeksikan jumlah kasus hipertensi pada periode mendatang.

6. Kesimpulan

Berdasarkan hasil analisis deret waktu terhadap data jumlah kasus hipertensi bulanan di Kota Semarang periode 2022–2025, dapat disimpulkan bahwa data awal bersifat tidak stasioner sehingga diperlukan proses differencing satu kali untuk mencapai kestasioneran. Hasil uji Augmented Dickey-Fuller (ADF) setelah differencing menunjukkan bahwa data telah stasioner dan memenuhi syarat untuk dilakukan pemodelan menggunakan metode ARIMA. Identifikasi awal melalui plot ACF dan PACF menghasilkan beberapa kandidat model dengan orde rendah yang selanjutnya diuji secara empiris.

Dari tiga model ARIMA yang diestimasi, yaitu ARIMA(1,1,0), ARIMA(0,1,1), dan ARIMA(1,1,1), model ARIMA(0,1,1) terpilih sebagai model terbaik berdasarkan nilai Akaike Information Criterion (AIC) dan Bayesian Information Criterion (BIC) yang paling kecil. Hasil uji diagnostik residual menunjukkan bahwa residual model bersifat white noise dan tidak mengandung autokorelasi, sehingga model dinyatakan layak digunakan untuk peramalan. Hasil peramalan menunjukkan bahwa jumlah kasus hipertensi pada periode mendatang cenderung relatif stabil dengan tingkat ketidakpastian yang meningkat seiring bertambahnya horizon waktu. Dengan demikian, model ARIMA(0,1,1) dapat digunakan sebagai alat bantu dalam memproyeksikan jumlah kasus hipertensi dan mendukung perencanaan kebijakan serta pengambilan keputusan di bidang kesehatan.

7. Referensi

Dinas Kesehatan Kota Semarang. (2026). Dashboard Kesehatan Kota Semarang – LEKMINKES.
https://lekminkes.dinkes.semarangkota.go.id/home

Agustin, Verly Ria. (2024). Penerapan Metode Autoregressive Integrated Moving Average (ARIMA) dalam Meramalkan Jumlah Penderita Demam Berdarah Dengue di Kota Kediri. Skripsi Sarjana (S1), IAIN Kediri. https://etheses.iainkediri.ac.id/13627/

Fathoni, F., Marshella, S. H., & Risyahputri, A. (2025). Implementasi Metode ARIMA dalam Peramalan Jumlah Kasus Penderita Penyakit HIV/AIDS. JATI (Jurnal Mahasiswa Teknik Informatika). https://ejournal.itn.ac.id/jati/article/view/14136/7888