Pendahuluan

Kesehatan masyarakat merupakan salah satu indikator utama dalam pembangunan sumber daya manusia. Tingginya angka kejadian penyakit menular masih menjadi permasalahan serius di berbagai daerah di Indonesia, termasuk di Provinsi Jawa Barat. Salah satu penyakit menular yang memiliki tingkat prevalensi cukup tinggi adalah Tuberkulosis (TB).(Maleachi Randa et al., 2023)

Tuberkulosis merupakan penyakit menular yang disebabkan oleh Mycobacterium tuberculosis dan dapat berdampak pada penurunan kualitas hidup masyarakat apabila tidak ditangani dengan baik. Tingginya kasus TB sering kali berkaitan dengan kondisi kesehatan lingkungan, penyakit penyerta, serta faktor sosial ekonomi masyarakat.(Maleachi Randa et al., 2023)

Selain TB, terdapat berbagai penyakit menular lain seperti pneumonia, demam berdarah dengue (DBD), HIV/AIDS, malaria, diare, dan hepatitis yang juga berpotensi memengaruhi tingkat kejadian TB. Oleh karena itu, diperlukan analisis kuantitatif untuk mengetahui hubungan antara kasus TB dan penyakit menular lainnya.(Azizah et al., 2024)

Berdasarkan hal tersebut, penelitian ini bertujuan untuk menganalisis faktor-faktor yang memengaruhi jumlah kasus TB di kabupaten/kota Provinsi Jawa Barat menggunakan metode regresi linier berganda.

Deskripsi dan Sumber Data

Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari Dinas Kesehatan Provinsi Jawa Barat. Data tersebut berisi informasi mengenai jumlah kasus berbagai jenis penyakit menular yang tercatat pada 27 kabupaten/kota di Provinsi Jawa Barat.

Periode data yang digunakan adalah tahun 2019, sehingga data bersifat data penampang (cross section), yaitu data yang diamati pada satu periode waktu tertentu dengan unit analisis berupa wilayah administratif kabupaten/kota.

library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(car)
## Warning: package 'car' was built under R version 4.5.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.5.2
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.5.2
## corrplot 0.95 loaded
# Load data (pilih manual dari folder)
data <- read_excel(file.choose())

str(data)
## tibble [27 × 13] (S3: tbl_df/tbl/data.frame)
##  $ kabupaten_kota: chr [1:27] "Kab. Bogor" "Kab. Sukabumi" "Kab. Cianjur" "Kab. Bandung" ...
##  $ TB            : num [1:27] 6738 6337 7365 4287 6445 ...
##  $ PNEUMONIA     : num [1:27] 2112 4656 6523 3476 3366 ...
##  $ CAMPAK        : num [1:27] 32 36 299 99 42 205 71 156 158 157 ...
##  $ DBD           : num [1:27] 3537 622 2218 1381 3488 ...
##  $ HIV_AIDS      : num [1:27] 331 145 275 394 520 246 334 123 274 266 ...
##  $ MALARIA       : num [1:27] 62 55 114 26 137 180 116 155 175 145 ...
##  $ DIARE         : num [1:27] 6657 6811 12654 4519 5045 ...
##  $ KUSTA         : num [1:27] 8 32 17 24 24 2 23 10 49 20 ...
##  $ TETANUS       : num [1:27] 1 9 0 1 1 10 2 8 0 3 ...
##  $ HEPATITIS     : num [1:27] 792 127 263 467 665 333 479 350 334 771 ...
##  $ POLIO         : num [1:27] 0 0 0 0 0 0 0 0 0 0 ...
##  $ FLU_BURUNG    : num [1:27] 0 1 3 2 2 2 2 1 0 3 ...
head(data)
## # A tibble: 6 × 13
##   kabupaten_kota      TB PNEUMONIA CAMPAK   DBD HIV_AIDS MALARIA DIARE KUSTA
##   <chr>            <dbl>     <dbl>  <dbl> <dbl>    <dbl>   <dbl> <dbl> <dbl>
## 1 Kab. Bogor        6738      2112     32  3537      331      62  6657     8
## 2 Kab. Sukabumi     6337      4656     36   622      145      55  6811    32
## 3 Kab. Cianjur      7365      6523    299  2218      275     114 12654    17
## 4 Kab. Bandung      4287      3476     99  1381      394      26  4519    24
## 5 Kab. Garut        6445      3366     42  3488      520     137  5045    24
## 6 Kab. Tasikmalaya  6649      6266    205  2864      246     180  4139     2
## # ℹ 4 more variables: TETANUS <dbl>, HEPATITIS <dbl>, POLIO <dbl>,
## #   FLU_BURUNG <dbl>
summary(data)
##  kabupaten_kota           TB         PNEUMONIA        CAMPAK     
##  Length:27          Min.   :1672   Min.   :1457   Min.   : 32.0  
##  Class :character   1st Qu.:3932   1st Qu.:3421   1st Qu.:118.0  
##  Mode  :character   Median :6003   Median :4669   Median :158.0  
##                     Mean   :5301   Mean   :4706   Mean   :169.1  
##                     3rd Qu.:6870   3rd Qu.:6358   3rd Qu.:234.5  
##                     Max.   :7796   Max.   :7373   Max.   :299.0  
##       DBD          HIV_AIDS        MALARIA          DIARE           KUSTA      
##  Min.   : 579   Min.   : 61.0   Min.   :  1.0   Min.   : 4139   Min.   : 2.00  
##  1st Qu.:1106   1st Qu.:229.5   1st Qu.: 61.0   1st Qu.: 5855   1st Qu.: 9.50  
##  Median :2056   Median :321.0   Median :115.0   Median : 7562   Median :23.00  
##  Mean   :2054   Mean   :330.8   Mean   :111.5   Mean   : 8716   Mean   :24.15  
##  3rd Qu.:2900   3rd Qu.:474.5   3rd Qu.:155.0   3rd Qu.:11810   3rd Qu.:39.50  
##  Max.   :3947   Max.   :579.0   Max.   :194.0   Max.   :14808   Max.   :49.00  
##     TETANUS         HEPATITIS         POLIO     FLU_BURUNG   
##  Min.   : 0.000   Min.   :127.0   Min.   :0   Min.   :0.000  
##  1st Qu.: 1.000   1st Qu.:264.0   1st Qu.:0   1st Qu.:1.000  
##  Median : 3.000   Median :369.0   Median :0   Median :2.000  
##  Mean   : 4.148   Mean   :427.2   Mean   :0   Mean   :1.556  
##  3rd Qu.: 8.000   3rd Qu.:627.0   3rd Qu.:0   3rd Qu.:2.500  
##  Max.   :10.000   Max.   :792.0   Max.   :0   Max.   :3.000

Exploratory Data Analysis (EDA)

Exploratory Data Analysis (EDA) dilakukan untuk memahami karakteristik dasar data, pola sebaran, serta hubungan antarvariabel. Analisis deskriptif dilakukan melalui statistik ringkasan dan visualisasi data.(Makrifah, B. A., 2015)

# Histogram kasus TB
ggplot(data, aes(x = TB)) +
geom_histogram(bins = 10) +
labs(
title = "Distribusi Jumlah Kasus TB di Jawa Barat",
x = "Jumlah Kasus TB",
y = "Frekuensi"
)

Selanjutnya, dilakukan analisis korelasi antarvariabel numerik untuk melihat hubungan awal antara TB dan variabel independen.

# Matriks korelasi

data_num <- data %>% select(-kabupaten_kota)
cor_matrix <- cor(data_num)
## Warning in cor(data_num): the standard deviation is zero

Pada proses perhitungan matriks korelasi, muncul peringatan bahwa terdapat variabel dengan standar deviasi nol. Hal ini disebabkan oleh adanya variabel yang memiliki nilai konstan, seperti Polio, sehingga tidak memiliki variasi data. Variabel dengan nilai konstan tersebut tidak memberikan kontribusi informasi dalam analisis korelasi dan tidak memengaruhi interpretasi hubungan antarvariabel lainnya.

corrplot(cor_matrix, method = "color", type = "upper")

Hasil EDA menunjukkan bahwa terdapat variasi jumlah kasus TB antar kabupaten/kota serta adanya korelasi yang berbeda-beda antara TB dan penyakit menular lainnya. Informasi ini menjadi dasar dalam pemodelan regresi linier berganda.

Metode Analisis Data

Metode analisis yang digunakan dalam penelitian ini adalah regresi linier berganda. Metode ini digunakan untuk mengetahui pengaruh lebih dari satu variabel independen terhadap satu variabel dependen secara simultan.(Binus Univeristy.,2021)

Model regresi linier berganda dalam penelitian ini dirumuskan sebagai berikut:

TBi = β0 + β1Pneumoniai + β2DBDi + β3HIV_AIDSi + β4Malariai + β5Diarei + β6Hepatitisi + εi

Tahapan analisis meliputi:

1.Estimasi model regresi linier berganda

2.Uji signifikansi parameter

3.Uji kelayakan model

4.Uji asumsi multikolinearitas menggunakan Variance Inflation Factor (VIF)

# Estimasi model regresi linier berganda

model_tb <- lm(
TB ~ PNEUMONIA + DBD + HIV_AIDS + MALARIA + DIARE + HEPATITIS,
data = data
)

summary(model_tb)
## 
## Call:
## lm(formula = TB ~ PNEUMONIA + DBD + HIV_AIDS + MALARIA + DIARE + 
##     HEPATITIS, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2964.5 -1489.1   312.1  1432.4  3277.9 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)  
## (Intercept) 6201.13075 2765.92596   2.242   0.0365 *
## PNEUMONIA     -0.06659    0.24569  -0.271   0.7891  
## DBD           -0.11099    0.40423  -0.275   0.7865  
## HIV_AIDS      -1.92733    3.16817  -0.608   0.5498  
## MALARIA        6.09734    8.74767   0.697   0.4938  
## DIARE         -0.18544    0.14262  -1.300   0.2083  
## HEPATITIS      2.84394    2.07761   1.369   0.1862  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2111 on 20 degrees of freedom
## Multiple R-squared:  0.1563, Adjusted R-squared:  -0.09676 
## F-statistic: 0.6177 on 6 and 20 DF,  p-value: 0.7138
# Uji multikolinearitas

vif(model_tb)
## PNEUMONIA       DBD  HIV_AIDS   MALARIA     DIARE HEPATITIS 
##  1.127685  1.125370  1.492570  1.294016  1.532028  1.102509

Hasil dan Pembahasan

Hasil estimasi regresi linier berganda menunjukkan bahwa secara simultan variabel Pneumonia, DBD, HIV/AIDS, Malaria, Diare, dan Hepatitis belum memberikan pengaruh yang signifikan terhadap jumlah kasus TB di kabupaten/kota Provinsi Jawa Barat.

Nilai koefisien determinasi (R-squared) sebesar 0,1563 menunjukkan bahwa sekitar 15,63% variasi jumlah kasus TB dapat dijelaskan oleh variabel independen dalam model, sedangkan sisanya dipengaruhi oleh faktor lain di luar model.

Hasil uji multikolinearitas menunjukkan bahwa seluruh nilai VIF berada di bawah 10, sehingga dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas dalam model regresi yang digunakan.

Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan bahwa model regresi linier berganda yang digunakan belum mampu menjelaskan variasi jumlah kasus TB secara kuat di kabupaten/kota Provinsi Jawa Barat.

Meskipun demikian, model ini tetap memberikan gambaran awal mengenai hubungan antara TB dan penyakit menular lainnya. Penelitian selanjutnya disarankan untuk menambahkan variabel lain seperti faktor lingkungan, kepadatan penduduk, dan kondisi sosial ekonomi agar hasil analisis menjadi lebih komprehensif.

Referensi

Dinas Kesehatan Provinsi Jawa Barat. (2019). https://opendata.jabarprov.go.id/id/dataset/jumlah-kasus-penyakit-berdasarkan-jenis-penyakit-di-jawa-barat

Azizah, R. N., Nisak, U. K., & indahyanti, U. (2024). Analisis Jumlah Prediksi Penyebaran HIV/AIDS di Kabupaten Sidoarjo menggunakan Metode Multiple Linier Regression. Physical Sciences, Life Science and Engineering, 1(1), 11. https://doi.org/10.47134/pslse.v1i1.163

Maleachi Randa, T., Maria Tinungki, G., Nurtiti Sunusi, dan, Statistika, D., & Matematika Dan Ilmu Pengetahuan Alam, F. (2023). Penerapan LASSO Least Trimmed Squares untuk Mengidentifikasi Peubah yang Berpengaruh Penyebaran Penyakit di Sulawesi Selatan. Journal of Mathematics, 6(2), 138–148. http://www.ojs.unm.ac.id/jmathcos

Makrifah, B. A. (2015). Analisis biplot berdasarkan prevalensi penyakit menular langsung di Kabupaten Gresik tahun 2013 [Tugas akhir Diploma III, Institut Teknologi Sepuluh Nopember]. Repository ITS. https://repository.its.ac.id/63210/1/1312030053-Undergraduate.pdf

School of Accounting BINUS University. (2021, 12 Agustus). Memahami Analisis Regresi Linear Berganda. https://accounting.binus.ac.id/2021/08/12/memahami-analisis-regresi-linear-berganda/