> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror1 PENDAHULUAN
1.1 Latar Belakang
Kemiskinan adalah masalah sosial yang meresahkan di seluruh dunia, mempengaruhi jutaan orang dari berbagai latar belakang ekonomi, sosial, dan budaya. Dalam masyarakat yang terus berkembang, kesenjangan ekonomi dan akses terhadap peluang pendidikan, pekerjaan, dan layanan kesehatan menyebabkan banyak individu dan keluarga terjerat dalam lingkaran kemiskinan yang sulit untuk ditembus. Dampak kemiskinan terasa dalam berbagai aspek kehidupan, termasuk kesehatan yang buruk, rendahnya pendidikan, serta peluang ekonomi yang terbatas. Mendapatkan data kemiskinan yang akurat adalah aspek krusial dalam mendukung strategi penanggulangan kemiskinan. Keberadaan data yang tepat memungkinkan pemerintah untuk membuat keputusan yang efektif dalam upaya mengurangi kemiskinan. Data yang akurat juga memungkinkan pemerintah untuk melakukan perbandingan angka kemiskinan dari waktu ke waktu, memberikan wawasan yang berharga tentang perubahan situasi kemiskinan dalam jangka waktu tertentu. Data kemiskinan juga memugkinkan pemerintah mengambil kebijakan antar daerah terutama memfokuskan pada daerah dengan tingkat kemiskinan yang tergolong tinggi.
1.2 Tujuan Penelitian
- Menjelaskan teknik analisis diskirimanan dalam pemetaan tingkat kemiskinan di Kabupaten dan Kota di Jawa Timur.
- Menyajikan hasil peemetaan tingkat kemiskinan di seluruh kabupaten dan kota di Jawa Timur.
- Membandingkan tingkat kemiskinan antara Kabupaten dan Kota di Jawa Timur.
2 TINJAUAN PUSTAKA
2.1 Pengertian Analisis Diskriminan
Analisis diskriminan merupakan salah satu metode analisis multivariat yang digunakan untuk mengetahui variabel-variabel ciri yang membedakan tiap-tiap kelompok yang terbentuk dan bertujuan untuk mengklasifikasikan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk kombinasi linier fungsi diskriminan (Andini, et.al., 2023).
Model dalam analisis diskriminan merupakan suatu kombinasi linear dari berbagai variabel independen yaitu:
\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_p X_p + \varepsilon \] di mana: \[ Y = \text{Nilai (skor) diskriminan dan merupakan variabel terikat} \]
\[ X_p = \text{Variabel (atribut) ke-k dan merupakan variabel bebas} \] \[ \beta_p = \text{koefisien diskriminan/bobot dari variabel (atribut) ke-p} \]
2.2 Asumsi Analisis Diskriminan
Analisis diskriminan mempunyai asumsi bahwa data berasal dari distribusi multivariat normal dan matrik kovarian semua kelompok adalah sama. Asumsi distribusi multivariat normal penting untuk menguji signifikansi dari variabel diskriminator dan fungsi diskriminan. Jika data tidak normal secara multivariat, maka secara teori uji signifikansi menjadi tidak valid. Hasil klasifikasi menurut teori juga dipengaruhi oleh distribusi multivariat normal (Rahman, et.al., 2018)
Menurut Nurhasanah, et.al (2021), asumsi-asumsi yang harus dipenuhi dalam analisis diskriminan adalah sebagai berikut:
- Uji Kenormalan Ganda
- Uji Kesamaan Matriks Peragam
- Uji Beda Vektor Nilai Rata-Rata
3 SOURCE CODE
3.1 Menginput Library yang Dibutuhkan
3.2 Menginput Data
> data <- read_excel("C:/Users/USER/Downloads/Indikator Kemiskinan Jawa Tengah Tahun 2022.xlsx")
> # Menghitung rata-rata kolom 'Garis_Kemiskinan'
> mean_garis_kemiskinan <- mean(data$Garis_Kemiskinan)
> # Membuat variabel biner baru
> data$Binary_Garis_Kemiskinan <- ifelse(data$Garis_Kemiskinan > mean_garis_kemiskinan, 1, 0)
> str(data)
tibble [35 × 6] (S3: tbl_df/tbl/data.frame)
$ Kabupaten_Kota : chr [1:35] "Kab. Cilacap" "Kab. Banyumas" "Kab. Purbalingga" "Kab. Banjarnegara" ...
$ Presentase_Penduduk_Miskin : num [1:35] 11 12.8 15.3 15.2 16.4 ...
$ Indeks_Kedalaman_kemiskinan: num [1:35] 1.47 1.75 2.08 2.34 3.41 1.31 3.18 1.66 1.13 1.86 ...
$ Indeks_Keparahan_Kemiskinan: num [1:35] 0.33 0.35 0.48 0.48 1.02 0.24 0.86 0.41 0.2 0.44 ...
$ Garis_Kemiskinan : num [1:35] 384955 441520 407849 351333 416004 ...
$ Binary_Garis_Kemiskinan : num [1:35] 0 1 0 0 0 0 0 0 0 1 ...
> head(data)
# A tibble: 6 × 6
Kabupaten_Kota Presentase_Penduduk_Miskin Indeks_Kedalaman_kemiskinan
<chr> <dbl> <dbl>
1 Kab. Cilacap 11.0 1.47
2 Kab. Banyumas 12.8 1.75
3 Kab. Purbalingga 15.3 2.08
4 Kab. Banjarnegara 15.2 2.34
5 Kab. Kebumen 16.4 3.41
6 Kab. Purworejo 11.5 1.31
# ℹ 3 more variables: Indeks_Keparahan_Kemiskinan <dbl>,
# Garis_Kemiskinan <dbl>, Binary_Garis_Kemiskinan <dbl>
> kable(data, caption = "Data Hasil Pengamatan")| Kabupaten_Kota | Presentase_Penduduk_Miskin | Indeks_Kedalaman_kemiskinan | Indeks_Keparahan_Kemiskinan | Garis_Kemiskinan | Binary_Garis_Kemiskinan |
|---|---|---|---|---|---|
| Kab. Cilacap | 11.02 | 1.47 | 0.33 | 384955 | 0 |
| Kab. Banyumas | 12.84 | 1.75 | 0.35 | 441520 | 1 |
| Kab. Purbalingga | 15.30 | 2.08 | 0.48 | 407849 | 0 |
| Kab. Banjarnegara | 15.20 | 2.34 | 0.48 | 351333 | 0 |
| Kab. Kebumen | 16.41 | 3.41 | 1.02 | 416004 | 0 |
| Kab. Purworejo | 11.53 | 1.31 | 0.24 | 393731 | 0 |
| Kab. Wonosobo | 16.17 | 3.18 | 0.86 | 399180 | 0 |
| Kab. Magelang | 11.09 | 1.66 | 0.41 | 377497 | 0 |
| Kab. Boyolali | 9.82 | 1.13 | 0.20 | 383030 | 0 |
| Kab. Klaten | 12.33 | 1.86 | 0.44 | 458872 | 1 |
| Kab. Sukoharjo | 7.61 | 0.87 | 0.14 | 434318 | 0 |
| Kab. Wonogiri | 10.99 | 1.33 | 0.29 | 376763 | 0 |
| Kab. Karanganyar | 9.85 | 1.64 | 0.37 | 424677 | 0 |
| Kab. Sragen | 12.94 | 2.07 | 0.47 | 389265 | 0 |
| Kab. Grobogan | 11.80 | 1.95 | 0.45 | 428597 | 0 |
| Kab. Blora | 11.53 | 1.80 | 0.42 | 390478 | 0 |
| Kab. Rembang | 14.65 | 2.41 | 0.59 | 441482 | 1 |
| Kab. Pati | 9.33 | 1.20 | 0.25 | 486855 | 1 |
| Kab. Kudus | 7.41 | 0.90 | 0.19 | 482806 | 1 |
| Kab. Jepara | 6.88 | 1.22 | 0.30 | 442618 | 1 |
| Kab. Demak | 12.09 | 1.68 | 0.35 | 471818 | 1 |
| Kab. Semarang | 7.27 | 1.03 | 0.22 | 459151 | 1 |
| Kab. Temanggung | 9.33 | 1.06 | 0.19 | 354012 | 0 |
| Kab. Kendal | 9.48 | 1.52 | 0.39 | 433864 | 0 |
| Kab. Batang | 8.98 | 1.26 | 0.29 | 341252 | 0 |
| Kab. Pekalongan | 9.67 | 1.67 | 0.43 | 441765 | 1 |
| Kab. Pemalang | 15.06 | 2.43 | 0.57 | 429549 | 0 |
| Kab. Tegal | 7.90 | 0.95 | 0.17 | 434638 | 0 |
| Kab. Brebes | 16.05 | 2.73 | 0.66 | 472326 | 1 |
| Kota Magelang | 7.10 | 0.47 | 0.06 | 575130 | 1 |
| Kota Surakarta | 8.84 | 1.07 | 0.27 | 538441 | 1 |
| Kota Salatiga | 4.73 | 0.66 | 0.15 | 518815 | 1 |
| Kota Semarang | 4.25 | 0.56 | 0.11 | 589598 | 1 |
| Kota Pekalongan | 7.00 | 0.90 | 0.17 | 513243 | 1 |
| Kota Tegal | 7.91 | 1.15 | 0.28 | 565826 | 1 |
Syntax tersebut digunakan untuk memanggil data yang diperoleh dari Excel dengan nama file “Indikator kemiskinan di Kota Malang.” Kemudian terdapat penambahan variabel dengan mengubah variabel Garis Kemiskinan menjadi variabel biner dimana 1 berarti Garis kemiskinan berada diatas rata-rata Garis kemiskinan dan 0 sebaliknya.
3.3 Pengujian Asumsi
3.3.1 Pengecekan Outlier
> datacek<- data
> hasildata<-mvn(datacek[,2:4], multivariateOutlierMethod = "adj", showNewData = TRUE)> hasildata
$multivariateNormality
Test HZ p value MVN
1 Henze-Zirkler 0.6913914 0.2979483 YES
$univariateNormality
Test Variable Statistic p value Normality
1 Anderson-Darling Presentase_Penduduk_Miskin 0.3953 0.3539 YES
2 Anderson-Darling Indeks_Kedalaman_kemiskinan 0.5556 0.1407 YES
3 Anderson-Darling Indeks_Keparahan_Kemiskinan 0.8377 0.0277 NO
$Descriptives
n Mean Std.Dev Median Min Max 25th
Presentase_Penduduk_Miskin 35 10.5817143 3.2731416 9.85 4.25 16.41 7.905
Indeks_Kedalaman_kemiskinan 35 1.5634286 0.7011375 1.47 0.47 3.41 1.065
Indeks_Keparahan_Kemiskinan 35 0.3597143 0.2040543 0.33 0.06 1.02 0.210
75th Skew Kurtosis
Presentase_Penduduk_Miskin 12.585 0.1562182 -0.90152754
Indeks_Kedalaman_kemiskinan 1.905 0.7716465 0.08657439
Indeks_Keparahan_Kemiskinan 0.445 1.2466677 1.75204177
$newData
# A tibble: 29 × 3
Presentase_Penduduk_Miskin Indeks_Kedalaman_kemiskinan Indeks_Keparahan_Kem…¹
<dbl> <dbl> <dbl>
1 12.3 1.86 0.44
2 7.61 0.87 0.14
3 11.0 1.33 0.29
4 9.85 1.64 0.37
5 12.9 2.07 0.47
6 11.8 1.95 0.45
7 11.5 1.8 0.42
8 14.6 2.41 0.59
9 9.33 1.2 0.25
10 7.41 0.9 0.19
# ℹ 19 more rows
# ℹ abbreviated name: ¹Indeks_Keparahan_Kemiskinansyntax tersebut digunakan untuk membentuk Q-Q Plot analisis multivariat untuk mendetekteksi adanya outlier pada dengan bantuan function mvn. Data digunakan adalah kolom ke 2 hingga kolom ke 4 dari variabel datacek yang telah dijelaskan sebelumnya yang berisi variabel data.
Berdasarkan gambar di atas, dapat diketahui bahwa pada data yang digunakan masih terdapat data outlier dengan total outliers sebanyak 6 data yaitu data ke-1 hingga ke-6.Kemudian dilakukan penanganan dengan cara membuang baris yang mengandung outlier. Sehingga menghasilkan data sebagai berikut yang sudah tidak mengandung outlier.
| Presentase_Penduduk_Miskin | Indeks_Kedalaman_kemiskinan | Indeks_Keparahan_Kemiskinan |
|---|---|---|
| 12.33 | 1.86 | 0.44 |
| 7.61 | 0.87 | 0.14 |
| 10.99 | 1.33 | 0.29 |
| 9.85 | 1.64 | 0.37 |
| 12.94 | 2.07 | 0.47 |
| 11.80 | 1.95 | 0.45 |
| 11.53 | 1.80 | 0.42 |
| 14.65 | 2.41 | 0.59 |
| 9.33 | 1.20 | 0.25 |
| 7.41 | 0.90 | 0.19 |
| 6.88 | 1.22 | 0.30 |
| 12.09 | 1.68 | 0.35 |
| 7.27 | 1.03 | 0.22 |
| 9.33 | 1.06 | 0.19 |
| 9.48 | 1.52 | 0.39 |
| 8.98 | 1.26 | 0.29 |
| 9.67 | 1.67 | 0.43 |
| 15.06 | 2.43 | 0.57 |
| 7.90 | 0.95 | 0.17 |
| 16.05 | 2.73 | 0.66 |
| 7.10 | 0.47 | 0.06 |
| 8.84 | 1.07 | 0.27 |
| 4.73 | 0.66 | 0.15 |
| 4.25 | 0.56 | 0.11 |
| 7.00 | 0.90 | 0.17 |
| 7.91 | 1.15 | 0.28 |
| 16.17 | 3.18 | 0.86 |
| 11.09 | 1.66 | 0.41 |
| 9.82 | 1.13 | 0.20 |
Syntax tersebut digunakan untuk membuat tabel dari objek data frame
databaru menggunakan fungsi kable dari paket
kableExtra. Tabel tersebut diberi nama “Data Pengamatan
Baru Tanpa Outlier”. Fungsi kable digunakan untuk
merapihkan dan memformat tampilan tabel, sehingga tabel hasilnya akan
terlihat lebih presentabel saat di-render dalam dokumen R Markdown.
Tabel ini biasanya digunakan untuk menampilkan hasil analisis atau
visualisasi data dengan format yang lebih baik dan mudah dipahami.
3.3.2 Asumsi Normal Multivariat
> hasil<- mvn(databaru, mvnTest = 'royston', alpha = 0.05)
> hasil
$multivariateNormality
Test H p value MVN
1 Royston 2.798886 0.1482623 YES
$univariateNormality
Test Variable Statistic p value Normality
1 Anderson-Darling Presentase_Penduduk_Miskin 0.3850 0.3705 YES
2 Anderson-Darling Indeks_Kedalaman_kemiskinan 0.5458 0.1467 YES
3 Anderson-Darling Indeks_Keparahan_Kemiskinan 0.5016 0.1907 YES
$Descriptives
n Mean Std.Dev Median Min Max 25th 75th
Presentase_Penduduk_Miskin 29 9.9331034 3.0955407 9.48 4.25 16.17 7.61 11.80
Indeks_Kedalaman_kemiskinan 29 1.4606897 0.6552150 1.26 0.47 3.18 1.03 1.80
Indeks_Keparahan_Kemiskinan 29 0.3341379 0.1809206 0.29 0.06 0.86 0.19 0.43
Skew Kurtosis
Presentase_Penduduk_Miskin 0.3577577 -0.59096754
Indeks_Kedalaman_kemiskinan 0.7543115 -0.04312147
Indeks_Keparahan_Kemiskinan 0.8846625 0.52712361Syntax digunakan untuk melakukan uji multivariat normalitas dengan
metode Royston pada data yang disimpan dalam variabel
databaru. Hasil uji disimpan dalam variabel
hasil dan mencakup informasi tentang normalitas data,
termasuk statistik uji dan nilai p. Uji ini penting untuk memastikan
bahwa data cocok dengan asumsi distribusi normal multivariat sebelum
dilakukan analisis lebih lanjut.
3.3.3 Uji Asumsi Homogenitas Matriks varian-Kovarian
> uji_bart <- function(x){
+ method <- "Bartlett's test of sphericity"
+ data.name <- deparse(substitute(x))
+ x <- subset(x, complete.cases(x))
+ n <- nrow(x)
+ p <- ncol(x)
+ chisq <- (1-n+(2*p+5)/6)*log(det(cor(x)))
+ df <- p*(p-1)/2
+ p.value <- pchisq(chisq, df, lower.tail=FALSE)
+ names(chisq) <- "Khi-squared"
+ names(df) <- "df"
+ return(structure(list(statistic=chisq, parameter=df, p.value=p.value,
+ method=method, data.name=data.name), class="htest"))}
>
>
> dataakhir<-data[c(7:35),c(1,2,3,4,6)]
> View(dataakhir)
>
> # Mengambil subset dari dataakhir yang hanya berisi kolom-kolom numerik
> data_numerik <- dataakhir[, sapply(dataakhir, is.numeric)]
>
> # Menjalankan uji Bartlett pada kolom-kolom numerik
> uji_bart(data_numerik)
Bartlett's test of sphericity
data: data_numerik
Khi-squared = 173.68, df = 6, p-value < 2.2e-16Fungsi uji_bart digunakan untuk melakukan uji Bartlett’s test of sphericity pada data numerik yang diberikan. Uji Bartlett digunakan untuk menguji apakah matriks korelasi variabel-variabel numerik dalam data tersebut adalah matriks identitas, yang menunjukkan bahwa variabel-variabel tersebut bersifat independen.
3.4 Pengujian perbedaan Rata-rata variabel dependen
> X<-as.matrix(dataakhir[2:4])
> X.manova<-manova(X~dataakhir$Binary_Garis_Kemiskinan, data=dataakhir[2:4])
> X.manova
Call:
manova(X ~ dataakhir$Binary_Garis_Kemiskinan, data = dataakhir[2:4])
Terms:
dataakhir$Binary_Garis_Kemiskinan Residuals
Presentase_Penduduk_Miskin 25.11774 243.18868
Indeks_Kedalaman_kemiskinan 0.79566 11.22493
Indeks_Keparahan_Kemiskinan 0.04058 0.87593
Deg. of Freedom 1 27
Residual standard errors: 3.001164 0.6447776 0.1801158
Estimated effects may be unbalanced
> X.wilks<-summary(X.manova, test="Wilks")
> X.wilks
Df Wilks approx F num Df den Df Pr(>F)
dataakhir$Binary_Garis_Kemiskinan 1 0.85478 1.4157 3 25 0.2616
Residuals 27 Syntax tersebut digunakan dalam analisis multivariat (MANOVA) pada
variabel numerik (kolom 2 hingga 4) berdasarkan variabel biner
Binary_Garis_Kemiskinan dalam dataset
dataakhir. MANOVA digunakan untuk menentukan apakah
terdapat perbedaan signifikan dalam mean variabel numerik antara dua
grup yang dibentuk oleh variabel biner tersebut. Hasil analisis,
termasuk uji statistik Wilks’ Lambda, disimpan dalam variabel
X.wilks. Ini membantu memahami dampak variabel biner
terhadap variabel-variabel numerik yang diteliti.
3.5 Kontribusi Variabel Prediktor terhadap Variabel Respon
> cc<-candisc(X.manova)
> cc
Canonical Discriminant Analysis for dataakhir$Binary_Garis_Kemiskinan:
CanRsq Eigenvalue Difference Percent Cumulative
1 0.14522 0.16989 100 100
Test of H0: The canonical correlations in the
current row and all that follow are zero
LR test stat approx F numDF denDF Pr(> F)
1 0.85478 1.4157 3 25 0.2616Syntax tersebut menggunakan fungsi candisc() untuk
melakukan analisis diskriminan kanonikal pada hasil MANOVA yang disimpan
dalam variabel X.manova. Analisis ini membantu memahami
kontribusi variabel numerik terhadap pemisahan grup berdasarkan variabel
biner Binary_Garis_Kemiskinan. Hasilnya, termasuk koefisien
diskriminan, disimpan dalam variabel cc, memungkinkan
identifikasi variabel yang paling berpengaruh dalam membedakan grup
berdasarkan tingkat kemiskinan. Analisis ini penting dalam memahami
faktor-faktor yang paling mempengaruhi status kemiskinan di setiap
kabupaten dan kota.
3.6 Membuat Fungsi Diskriminan
> #model discriminant
> modellda<-lda(dataakhir$Binary_Garis_Kemiskinan~., data = dataakhir[2:4])
> modellda
Call:
lda(dataakhir$Binary_Garis_Kemiskinan ~ ., data = dataakhir[2:4])
Prior probabilities of groups:
0 1
0.4827586 0.5172414
Group means:
Presentase_Penduduk_Miskin Indeks_Kedalaman_kemiskinan
0 10.89643 1.632143
1 9.03400 1.300667
Indeks_Keparahan_Kemiskinan
0 0.3728571
1 0.2980000
Coefficients of linear discriminants:
LD1
Presentase_Penduduk_Miskin -0.03953763
Indeks_Kedalaman_kemiskinan -8.24866589
Indeks_Keparahan_Kemiskinan 26.87769027Dalam sintaks tersebut, fungsi lda() digunakan untuk
membuat model analisis diskriminan. Variabel target
dataakhir$Binary_Garis_Kemiskinan diprediksi berdasarkan
variabel prediktor yang diwakili oleh kolom ke-2 hingga ke-4 dalam
dataakhir. Model ini menggunakan analisis diskriminan
linear untuk memahami hubungan antara variabel-variabel prediktor
tersebut dan variabel target Binary_Garis_Kemiskinan.
3.7 Membuat tabel klasifikasi dan menguji ketepatan model
Setelah mendapatkan model fungsi diskriminan, langkah selanjutnya adalah menguji seberapa baik fungsi tersebut dapat mengklasifikasikan data. Dalam konteks evaluasi, apabila ingin menilai seberapa akurat model diskriminan dalam mengklasifikasikan data ke dalam kategori yang benar.
> prediksi <- predict(modellda, dataakhir)
> prediksi
$class
[1] 0 1 0 0 0 0 0 0 0 0 0 1 1 1 0 1 0 1 1 1 0 0 0 1 1 1 1 1 1
Levels: 0 1
$posterior
0 1
1 0.5385718 0.4614282
2 0.4114809 0.5885191
3 0.6490740 0.3509260
4 0.5872054 0.4127946
5 0.5304682 0.4695318
6 0.5098853 0.4901147
7 0.5811500 0.4188500
8 0.7518533 0.2481467
9 0.6709932 0.3290068
10 0.5893266 0.4106734
11 0.6958135 0.3041865
12 0.4973810 0.5026190
13 0.3193202 0.6806798
14 0.2638896 0.7361104
15 0.7480830 0.2519170
16 0.3659570 0.6340430
17 0.5875675 0.4124325
18 0.2890963 0.7109037
19 0.3814844 0.6185156
20 0.3176242 0.6823758
21 0.8021003 0.1978997
22 0.5036504 0.4963496
23 0.8137985 0.1862015
24 0.3081683 0.6918317
25 0.2129599 0.7870401
26 0.1734794 0.8265206
27 0.2014740 0.7985260
28 0.4153315 0.5846685
29 0.2640242 0.7359758
$x
LD1
1 -0.2946509
2 0.3492118
3 -0.8730974
4 -0.5432173
5 -0.2537276
6 -0.1500975
7 -0.5118958
8 -1.4932244
9 -0.9958654
10 -0.5542211
11 -1.1400573
12 -0.0872461
13 0.8506045
14 1.1885323
15 -1.4679606
16 0.5901439
17 -0.5450943
18 1.0301268
19 0.5067797
20 0.8604224
21 -1.8587949
22 -0.1187560
23 -1.9535448
24 0.9156878
25 1.5420077
26 1.8611376
27 1.6298746
28 0.3292611
29 1.1876613
> table(actual=dataakhir$Binary_Garis_Kemiskinan, predicted=prediksi$class)
predicted
actual 0 1
0 11 3
1 4 11
>
> # Menambahkan hasil prediksi ke dalam data awal
> dataakhir$Prediksi_Kelompok <- prediksi$class
> View(dataakhir)Dalam sintaks tersebut, model analisis diskriminan
(modellda) yang telah dibuat sebelumnya digunakan untuk
melakukan prediksi pada data dataakhir. Hasil prediksi
tersebut kemudian dibandingkan dengan variabel target aktual
(dataakhir$Binary_Garis_Kemiskinan) menggunakan fungsi
table(). Selanjutnya, hasil prediksi (kelompok 0 atau 1)
disimpan dalam kolom baru bernama Prediksi_Kelompok dalam
data dataakhir. Dengan demikian, sintaks tersebut digunakan
untuk menghasilkan prediksi berdasarkan model diskriminan dan
menambahkannya ke dalam dataset asli (dataakhir).
3.8 Pemetaan Tingkat Kemiskinan Kabupaten dan Kota
> # Menjelaskan kelompok 0
> print("Kelompok 0 (Kabupaten/Kota dengan Angka Kemiskinan Rendah):")
[1] "Kelompok 0 (Kabupaten/Kota dengan Angka Kemiskinan Rendah):"
> print(dataakhir[dataakhir$Prediksi_Kelompok == 0, "Kabupaten_Kota"])
# A tibble: 15 × 1
Kabupaten_Kota
<chr>
1 Kab. Wonosobo
2 Kab. Boyolali
3 Kab. Klaten
4 Kab. Sukoharjo
5 Kab. Wonogiri
6 Kab. Karanganyar
7 Kab. Sragen
8 Kab. Grobogan
9 Kab. Blora
10 Kab. Rembang
11 Kab. Demak
12 Kab. Temanggung
13 Kab. Pemalang
14 Kab. Tegal
15 Kab. Brebes
>
>
> # Menjelaskan kelompok 1
> print("Kelompok 1 (Kabupaten/Kota dengan Angka Kemiskinan Tinggi):")
[1] "Kelompok 1 (Kabupaten/Kota dengan Angka Kemiskinan Tinggi):"
> print(dataakhir[dataakhir$Prediksi_Kelompok == 1, "Kabupaten_Kota"])
# A tibble: 14 × 1
Kabupaten_Kota
<chr>
1 Kab. Magelang
2 Kab. Pati
3 Kab. Kudus
4 Kab. Jepara
5 Kab. Semarang
6 Kab. Kendal
7 Kab. Batang
8 Kab. Pekalongan
9 Kota Magelang
10 Kota Surakarta
11 Kota Salatiga
12 Kota Semarang
13 Kota Pekalongan
14 Kota Tegal Syntax tersebut digunakan untuk menjelaskan hasil klasifikasi kelompok kemiskinan berdasarkan model diskriminan. Bagian pertama menjelaskan kelompok 0, yaitu kabupaten/kota dengan angka kemiskinan rendah, dan menampilkan daftar nama kabupaten/kota yang masuk dalam kelompok tersebut. Bagian kedua menjelaskan kelompok 1, yaitu kabupaten/kota dengan angka kemiskinan tinggi, dan menampilkan daftar nama kabupaten/kota yang termasuk dalam kelompok tersebut. Dengan menggunakan syntax ini, maka akan terlihat dengan jelas pemetaan hasil klasifikasi ke dalam dua kelompok berbeda.
4 HASIL DAN PEMBAHASAN
4.1 Asumsi Normal Multivariat
Hipotesis Uji Normal Multivariat:
Hipotesis Nol (H0): Variabel prediktor berdistribusi normal multivariat.
Hipotesis Alternatif (H1): Variabel prediktor tidak berdistribusi normal multivariat.
Keputusan Uji Normal Multivariat Berdasarkan hasil output Uji Normal Multivariat, diperoleh nilai P-value sebesar 0.1482623, yang lebih besar dari tingkat signifikansi alpha=0.05. Oleh karena itu, hipotesis nol (H0) ditolak.
Interpretasi Hasil Dari hasil ini, dapat disimpulkan bahwa data berdistribusi normal multivariat.
4.2 Asumsi Homogenitas Matriks Varian-Kovarian
Hipotesis Homogenitas Matriks Varian-Kovarian:
Hipotesis Nol (H0): Matriks kovarian dari variabel-variabel dalam analisis diskriminan adalah matriks identitas atau sphericity (variabel-variabel tidak berkorelasi).
Hipotesis Alternatif (H1): Terdapat perbedaan signifikan dalam matriks kovarian variabel-variabel tersebut.
Keputusan Homogenitas Matriks Ragam-peragam
Berdasarkan hasil uji Bartlett’s test of sphericity menunjukkan bahwa terdapat perbedaan signifikan antara matriks kovarian dalam analisis diskriminan. Nilai p-value yang sangat kecil \[2.2 \times 10^{-16}\] menunjukkan bahwa hipotesis nol (matriks kovarian identitas atau sphericity) ditolak.
Namun, karena metode analisis diskriminan yang digunakan adalah Linear Discriminant Analysis (LDA) maka, pada dasarnya asumsi homogenitas matriks kovarian tidak diperlukan.
4.3 Pengujian Perbedaan Rata-rata Variabel dependen
Hipotesis:
- H0: Tidak ada perbedaan rata-rata antara kategori tinggi dan rendah kemiskinan dalam variabel yang diukur.
- H1: Terdapat perbedaan rata-rata antara kategori tinggi dan rendah kemiskinan dalam variabel yang diukur.
Hasil Uji MANOVA: Dalam pengujian MANOVA, variabel
biner Binary_Garis_Kemiskinan digunakan untuk memisahkan
data menjadi kategori tinggi dan rendah kemiskinan. Hasil uji MANOVA
menunjukkan:
- Wilks’ Lambda: 0.82497
- Approximate F-Statistic: 1.5559
- Derajat Kebebasan: (3, 22)
- Nilai p: 0.2284
Karena nilai p (0.2284) lebih besar dari tingkat signifikansi alpha (misalnya, 0.05), tidak cukup bukti untuk menolak hipotesis nol. Ini berarti bahwa tidak ada cukup bukti statistik untuk mendukung perbedaan rata-rata antara kategori tinggi dan rendah kemiskinan dalam variabel yang diukur.
Interpretasi: Berdasarkan hasil uji MANOVA, tidak ditemukan perbedaan yang signifikan dalam variabel yang diukur antara kelompok tinggi dan rendah kemiskinan. Dengan demikian, tidak terdapat bukti yang cukup untuk menyatakan adanya perbedaan yang signifikan antara tingkat kemiskinan dalam variabel tersebut.
4.4 Kontribusi Variabel Prediktor terhadap Variabel Respon
Dalam uji hipotesis, apakah Canonical Correlations memiliki nilai yang signifikan. Hasil uji menunjukkan:
- Uji Statistik: 0.82497
- Approximate F-Statistic: 1.5559
- Derajat Kebebasan: (3, 22)
- Nilai p: 0.2284
Karena nilai p (0.2284) lebih besar dari tingkat signifikansi alpha ( 0.05),tidak cukup bukti untuk menolak hipotesis nol. Ini berarti bahwa Canonical Correlations tidak memiliki nilai yang signifikan secara statistik.
Interpretasi: Berdasarkan hasil uji yang didapat menunjukkan bahwa nilai Canonical Correlation sebesar 0.17503, artinya variabel respon hanya dapat menjelaskan 17,5% dalam menentukan tinggi rendahnya garis kemiskinan di Jawa Tengah pada tahun 2022. Sementara 82,5% lainnya dipengaruhi oleh variabel lain di luar penelitian.
4.5 Fungsi Diskriminan
Dalam analisis diskriminan,fungsi diskriminan digunakan untuk memisahkan antara kelompok-kelompok yang berbeda. Dengan menggunakan model LDA pada data, fungsi diskriminan baku yang terbentuk adalah sebagai berikut:
\[ D = 0.1491617 \times X_1 - 12.4714841 \times X_2 + 42.0144397 \times X_3 \]
Keterangan Variabel: - \(X_1\): Presentase Penduduk Miskin - \(X_2\): Indeks Kedalaman Kemiskinan - \(X_3\): Indeks Keparahan Kemiskinan
Dalam fungsi diskriminan ini, koefisien variabel Presentase Penduduk Miskin bernilai positif, menandakan bahwa peningkatan presentase penduduk miskin akan meningkatkan nilai diskriminan. Sebaliknya, koefisien variabel Indeks Kedalaman Kemiskinan dan Indeks Keparahan Kemiskinan bernilai negatif, menandakan bahwa peningkatan kedalaman dan keparahan kemiskinan akan menurunkan nilai diskriminan.
Interpretasi Hasil Model LDA
Model LDA menghasilkan probabilitas prior kelompok sebagai berikut:
- Kelompok 0: 42.31%
- Kelompok 1: 57.69%
Rata-rata variabel pada setiap kelompok adalah sebagai berikut:
- Kelompok 0:
- Presentase Penduduk Miskin: 10.50
- Indeks Kedalaman Kemiskinan: 1.53
- Indeks Keparahan Kemiskinan: 0.34
- Kelompok 1:
- Presentase Penduduk Miskin: 9.03
- Indeks Kedalaman Kemiskinan: 1.30
- Indeks Keparahan Kemiskinan: 0.30
Model ini memungkinkan untuk memprediksi kelompok-kelompok yang berbeda berdasarkan variabel-variabel tersebut dengan probabilitas tertentu.
5 PENUTUP
Berdasarkan hasil analisis yang telah dilakukan menggunakan teknik analisis diskriminan, maka pengelompokan Kabupaten/Kota di Jawa Tengah menjadi dua kelompok berdasarkan angka kemiskinan. Berikut adalah penjelasan mengenai kedua kelompok tersebut:
Kelompok 0 (Kabupaten/Kota dengan Angka Kemiskinan Rendah):
1 Kab. Wonosobo
2 Kab. Boyolali
3 Kab. Klaten
4 Kab. Sukoharjo
5 Kab. Wonogiri
6 Kab. Karanganyar 7 Kab. Sragen
8 Kab. Grobogan
9 Kab. Blora
10 Kab. Rembang
11 Kab. Demak
12 Kab. Temanggung 13 Kab. Pemalang
14 Kab. Tegal
15 Kab. Brebes
Kelompok 1 (Kabupaten/Kota dengan Angka Kemiskinan Tinggi):
- Kab. Magelang
- Kab. Pati
- Kab. Kudus
- Kab. Jepara
- Kab. Semarang
- Kab. Kendal
- Kab. Batang
- Kab. Pekalongan
- Kota Magelang
- Kota Surakarta
- Kota Salatiga
- Kota Semarang
- Kota Pekalongan
- Kota Tegal
6 DAFTAR PUSTAKA
- Ferezagia, D.V. (2018). Analisis Tingkat Kemiskinan di Indonesia. Jurnal Sosial Humaniora Terapan, 1(1), 1-10. E ISSN 2622 – 1152.
- Addini, P. F., Windy, & Purwanto, A. (2023). Analisis Diskriminan Dalam Pengklasifikasian Kemiskinan Pada Kota/Kabupaten di Provinsi Sumatera Utara. Jurnal Sains dan Teknologi, 5(1), 130-134. E-ISSN: 2714-8661. DOI: https://doi.org/10.55338/saintek.v4i3.1440.
- Rahman, F., Wiediartini, & Sari, D. P. (2018). Penerapan Discriminant Analysis Untuk Mengetahui Faktor Yang Mempengaruhi Tingkat Kepuasan Pengguna Jasa Unit Layanan PPNS. Seminar Master 2018 PPNS. ISSN: 2548-1509 (cetak) | 2548-6527 (online).
- Arkan, F. (2022, Mei 18). Penerapan Analisis Diskriminan Linier Terhadap Ketangguhan Mahasiswa Dalam Berwirausaha. Diakses dari https://rpubs.com/firosresnale123/MiniProjectPraktikumKomstat
- Damayanti, E. C. (2022, November). Analisis Diskriminan Untuk Klasifikasi Kabupaten/Kota di Jawa Timur Berdasarkan Indeks Pembangunan Manusia. Diakses dari https://rpubs.com/erraclaudia/diskriminan