> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror

1 PENDAHULUAN

1.1 Latar Belakang

Kemiskinan adalah masalah sosial yang meresahkan di seluruh dunia, mempengaruhi jutaan orang dari berbagai latar belakang ekonomi, sosial, dan budaya. Dalam masyarakat yang terus berkembang, kesenjangan ekonomi dan akses terhadap peluang pendidikan, pekerjaan, dan layanan kesehatan menyebabkan banyak individu dan keluarga terjerat dalam lingkaran kemiskinan yang sulit untuk ditembus. Dampak kemiskinan terasa dalam berbagai aspek kehidupan, termasuk kesehatan yang buruk, rendahnya pendidikan, serta peluang ekonomi yang terbatas. Mendapatkan data kemiskinan yang akurat adalah aspek krusial dalam mendukung strategi penanggulangan kemiskinan. Keberadaan data yang tepat memungkinkan pemerintah untuk membuat keputusan yang efektif dalam upaya mengurangi kemiskinan. Data yang akurat juga memungkinkan pemerintah untuk melakukan perbandingan angka kemiskinan dari waktu ke waktu, memberikan wawasan yang berharga tentang perubahan situasi kemiskinan dalam jangka waktu tertentu. Data kemiskinan juga memugkinkan pemerintah mengambil kebijakan antar daerah terutama memfokuskan pada daerah dengan tingkat kemiskinan yang tergolong tinggi.

1.2 Tujuan Penelitian

Menjelaskan teknik analisis diskirimanan dalam pemetaan tingkat kemiskinan di Kabupaten dan Kota di Jawa Timur.
Menyajikan hasil peemetaan tingkat kemiskinan di seluruh kabupaten dan kota di Jawa Timur.
Membandingkan tingkat kemiskinan antara Kabupaten dan Kota di Jawa Timur.

2 TINJAUAN PUSTAKA

2.1 Pengertian Analisis Diskriminan

Analisis diskriminan merupakan salah satu metode analisis multivariat yang digunakan untuk mengetahui variabel-variabel ciri yang membedakan tiap-tiap kelompok yang terbentuk dan bertujuan untuk mengklasifikasikan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk kombinasi linier fungsi diskriminan (Andini, et.al., 2023).

Model dalam analisis diskriminan merupakan suatu kombinasi linear dari berbagai variabel independen yaitu:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_p X_p + \varepsilon \] di mana: \[ Y = \text{Nilai (skor) diskriminan dan merupakan variabel terikat} \]

\[ X_p = \text{Variabel (atribut) ke-k dan merupakan variabel bebas} \] \[ \beta_p = \text{koefisien diskriminan/bobot dari variabel (atribut) ke-p} \]

2.2 Asumsi Analisis Diskriminan

Analisis diskriminan mempunyai asumsi bahwa data berasal dari distribusi multivariat normal dan matrik kovarian semua kelompok adalah sama. Asumsi distribusi multivariat normal penting untuk menguji signifikansi dari variabel diskriminator dan fungsi diskriminan. Jika data tidak normal secara multivariat, maka secara teori uji signifikansi menjadi tidak valid. Hasil klasifikasi menurut teori juga dipengaruhi oleh distribusi multivariat normal (Rahman, et.al., 2018)

Menurut Nurhasanah, et.al (2021), asumsi-asumsi yang harus dipenuhi dalam analisis diskriminan adalah sebagai berikut:

Uji Kenormalan Ganda
Uji Kesamaan Matriks Peragam
Uji Beda Vektor Nilai Rata-Rata

3 SOURCE CODE

3.1 Menginput Library yang Dibutuhkan

> library(MVN)
> library(biotools) 
> library(candisc)
> library(MASS) 
> library(caret)
> library(readxl)

3.2 Menginput Data

> data <- read_excel("C:/Users/USER/Downloads/Indikator Kemiskinan Jawa Tengah Tahun 2022.xlsx")
> # Menghitung rata-rata kolom 'Garis_Kemiskinan'
> mean_garis_kemiskinan <- mean(data$Garis_Kemiskinan)
> # Membuat variabel biner baru
> data$Binary_Garis_Kemiskinan <- ifelse(data$Garis_Kemiskinan > mean_garis_kemiskinan, 1, 0)
> str(data)
tibble [35 × 6] (S3: tbl_df/tbl/data.frame)
 $ Kabupaten_Kota             : chr [1:35] "Kab. Cilacap" "Kab. Banyumas" "Kab. Purbalingga" "Kab. Banjarnegara" ...
 $ Presentase_Penduduk_Miskin : num [1:35] 11 12.8 15.3 15.2 16.4 ...
 $ Indeks_Kedalaman_kemiskinan: num [1:35] 1.47 1.75 2.08 2.34 3.41 1.31 3.18 1.66 1.13 1.86 ...
 $ Indeks_Keparahan_Kemiskinan: num [1:35] 0.33 0.35 0.48 0.48 1.02 0.24 0.86 0.41 0.2 0.44 ...
 $ Garis_Kemiskinan           : num [1:35] 384955 441520 407849 351333 416004 ...
 $ Binary_Garis_Kemiskinan    : num [1:35] 0 1 0 0 0 0 0 0 0 1 ...
> head(data)
# A tibble: 6 × 6
  Kabupaten_Kota    Presentase_Penduduk_Miskin Indeks_Kedalaman_kemiskinan
  <chr>                                  <dbl>                       <dbl>
1 Kab. Cilacap                            11.0                        1.47
2 Kab. Banyumas                           12.8                        1.75
3 Kab. Purbalingga                        15.3                        2.08
4 Kab. Banjarnegara                       15.2                        2.34
5 Kab. Kebumen                            16.4                        3.41
6 Kab. Purworejo                          11.5                        1.31
# ℹ 3 more variables: Indeks_Keparahan_Kemiskinan <dbl>,
#   Garis_Kemiskinan <dbl>, Binary_Garis_Kemiskinan <dbl>
> kable(data, caption = "Data Hasil Pengamatan")

Data Hasil Pengamatan
Kabupaten_Kota	Presentase_Penduduk_Miskin	Indeks_Kedalaman_kemiskinan	Indeks_Keparahan_Kemiskinan	Garis_Kemiskinan	Binary_Garis_Kemiskinan
Kab. Cilacap	11.02	1.47	0.33	384955	0
Kab. Banyumas	12.84	1.75	0.35	441520	1
Kab. Purbalingga	15.30	2.08	0.48	407849	0
Kab. Banjarnegara	15.20	2.34	0.48	351333	0
Kab. Kebumen	16.41	3.41	1.02	416004	0
Kab. Purworejo	11.53	1.31	0.24	393731	0
Kab. Wonosobo	16.17	3.18	0.86	399180	0
Kab. Magelang	11.09	1.66	0.41	377497	0
Kab. Boyolali	9.82	1.13	0.20	383030	0
Kab. Klaten	12.33	1.86	0.44	458872	1
Kab. Sukoharjo	7.61	0.87	0.14	434318	0
Kab. Wonogiri	10.99	1.33	0.29	376763	0
Kab. Karanganyar	9.85	1.64	0.37	424677	0
Kab. Sragen	12.94	2.07	0.47	389265	0
Kab. Grobogan	11.80	1.95	0.45	428597	0
Kab. Blora	11.53	1.80	0.42	390478	0
Kab. Rembang	14.65	2.41	0.59	441482	1
Kab. Pati	9.33	1.20	0.25	486855	1
Kab. Kudus	7.41	0.90	0.19	482806	1
Kab. Jepara	6.88	1.22	0.30	442618	1
Kab. Demak	12.09	1.68	0.35	471818	1
Kab. Semarang	7.27	1.03	0.22	459151	1
Kab. Temanggung	9.33	1.06	0.19	354012	0
Kab. Kendal	9.48	1.52	0.39	433864	0
Kab. Batang	8.98	1.26	0.29	341252	0
Kab. Pekalongan	9.67	1.67	0.43	441765	1
Kab. Pemalang	15.06	2.43	0.57	429549	0
Kab. Tegal	7.90	0.95	0.17	434638	0
Kab. Brebes	16.05	2.73	0.66	472326	1
Kota Magelang	7.10	0.47	0.06	575130	1
Kota Surakarta	8.84	1.07	0.27	538441	1
Kota Salatiga	4.73	0.66	0.15	518815	1
Kota Semarang	4.25	0.56	0.11	589598	1
Kota Pekalongan	7.00	0.90	0.17	513243	1
Kota Tegal	7.91	1.15	0.28	565826	1

Syntax tersebut digunakan untuk memanggil data yang diperoleh dari Excel dengan nama file “Indikator kemiskinan di Kota Malang.” Kemudian terdapat penambahan variabel dengan mengubah variabel Garis Kemiskinan menjadi variabel biner dimana 1 berarti Garis kemiskinan berada diatas rata-rata Garis kemiskinan dan 0 sebaliknya.

3.3 Pengujian Asumsi

3.3.1 Pengecekan Outlier

> datacek<- data
> hasildata<-mvn(datacek[,2:4], multivariateOutlierMethod = "adj", showNewData = TRUE)

> hasildata
$multivariateNormality
           Test        HZ   p value MVN
1 Henze-Zirkler 0.6913914 0.2979483 YES

$univariateNormality
              Test                    Variable Statistic   p value Normality
1 Anderson-Darling Presentase_Penduduk_Miskin     0.3953    0.3539    YES   
2 Anderson-Darling Indeks_Kedalaman_kemiskinan    0.5556    0.1407    YES   
3 Anderson-Darling Indeks_Keparahan_Kemiskinan    0.8377    0.0277    NO    

$Descriptives
                             n       Mean   Std.Dev Median  Min   Max  25th
Presentase_Penduduk_Miskin  35 10.5817143 3.2731416   9.85 4.25 16.41 7.905
Indeks_Kedalaman_kemiskinan 35  1.5634286 0.7011375   1.47 0.47  3.41 1.065
Indeks_Keparahan_Kemiskinan 35  0.3597143 0.2040543   0.33 0.06  1.02 0.210
                              75th      Skew    Kurtosis
Presentase_Penduduk_Miskin  12.585 0.1562182 -0.90152754
Indeks_Kedalaman_kemiskinan  1.905 0.7716465  0.08657439
Indeks_Keparahan_Kemiskinan  0.445 1.2466677  1.75204177

$newData
# A tibble: 29 × 3
   Presentase_Penduduk_Miskin Indeks_Kedalaman_kemiskinan Indeks_Keparahan_Kem…¹
                        <dbl>                       <dbl>                  <dbl>
 1                      12.3                         1.86                   0.44
 2                       7.61                        0.87                   0.14
 3                      11.0                         1.33                   0.29
 4                       9.85                        1.64                   0.37
 5                      12.9                         2.07                   0.47
 6                      11.8                         1.95                   0.45
 7                      11.5                         1.8                    0.42
 8                      14.6                         2.41                   0.59
 9                       9.33                        1.2                    0.25
10                       7.41                        0.9                    0.19
# ℹ 19 more rows
# ℹ abbreviated name: ¹Indeks_Keparahan_Kemiskinan

syntax tersebut digunakan untuk membentuk Q-Q Plot analisis multivariat untuk mendetekteksi adanya outlier pada dengan bantuan function mvn. Data digunakan adalah kolom ke 2 hingga kolom ke 4 dari variabel datacek yang telah dijelaskan sebelumnya yang berisi variabel data.

Berdasarkan gambar di atas, dapat diketahui bahwa pada data yang digunakan masih terdapat data outlier dengan total outliers sebanyak 6 data yaitu data ke-1 hingga ke-6.Kemudian dilakukan penanganan dengan cara membuang baris yang mengandung outlier. Sehingga menghasilkan data sebagai berikut yang sudah tidak mengandung outlier.

> databaru <- hasildata$newData
> kable(databaru, caption="Data Pengamatan Baru Tanpa Outlier")

Data Pengamatan Baru Tanpa Outlier
Presentase_Penduduk_Miskin	Indeks_Kedalaman_kemiskinan	Indeks_Keparahan_Kemiskinan
12.33	1.86	0.44
7.61	0.87	0.14
10.99	1.33	0.29
9.85	1.64	0.37
12.94	2.07	0.47
11.80	1.95	0.45
11.53	1.80	0.42
14.65	2.41	0.59
9.33	1.20	0.25
7.41	0.90	0.19
6.88	1.22	0.30
12.09	1.68	0.35
7.27	1.03	0.22
9.33	1.06	0.19
9.48	1.52	0.39
8.98	1.26	0.29
9.67	1.67	0.43
15.06	2.43	0.57
7.90	0.95	0.17
16.05	2.73	0.66
7.10	0.47	0.06
8.84	1.07	0.27
4.73	0.66	0.15
4.25	0.56	0.11
7.00	0.90	0.17
7.91	1.15	0.28
16.17	3.18	0.86
11.09	1.66	0.41
9.82	1.13	0.20

Syntax tersebut digunakan untuk membuat tabel dari objek data frame databaru menggunakan fungsi kable dari paket kableExtra. Tabel tersebut diberi nama “Data Pengamatan Baru Tanpa Outlier”. Fungsi kable digunakan untuk merapihkan dan memformat tampilan tabel, sehingga tabel hasilnya akan terlihat lebih presentabel saat di-render dalam dokumen R Markdown. Tabel ini biasanya digunakan untuk menampilkan hasil analisis atau visualisasi data dengan format yang lebih baik dan mudah dipahami.

3.3.2 Asumsi Normal Multivariat

> hasil<- mvn(databaru, mvnTest = 'royston',  alpha = 0.05)
> hasil
$multivariateNormality
     Test        H   p value MVN
1 Royston 2.798886 0.1482623 YES

$univariateNormality
              Test                    Variable Statistic   p value Normality
1 Anderson-Darling Presentase_Penduduk_Miskin     0.3850    0.3705    YES   
2 Anderson-Darling Indeks_Kedalaman_kemiskinan    0.5458    0.1467    YES   
3 Anderson-Darling Indeks_Keparahan_Kemiskinan    0.5016    0.1907    YES   

$Descriptives
                             n      Mean   Std.Dev Median  Min   Max 25th  75th
Presentase_Penduduk_Miskin  29 9.9331034 3.0955407   9.48 4.25 16.17 7.61 11.80
Indeks_Kedalaman_kemiskinan 29 1.4606897 0.6552150   1.26 0.47  3.18 1.03  1.80
Indeks_Keparahan_Kemiskinan 29 0.3341379 0.1809206   0.29 0.06  0.86 0.19  0.43
                                 Skew    Kurtosis
Presentase_Penduduk_Miskin  0.3577577 -0.59096754
Indeks_Kedalaman_kemiskinan 0.7543115 -0.04312147
Indeks_Keparahan_Kemiskinan 0.8846625  0.52712361

Syntax digunakan untuk melakukan uji multivariat normalitas dengan metode Royston pada data yang disimpan dalam variabel databaru. Hasil uji disimpan dalam variabel hasil dan mencakup informasi tentang normalitas data, termasuk statistik uji dan nilai p. Uji ini penting untuk memastikan bahwa data cocok dengan asumsi distribusi normal multivariat sebelum dilakukan analisis lebih lanjut.

3.3.3 Uji Asumsi Homogenitas Matriks varian-Kovarian

> uji_bart <- function(x){
+   method <- "Bartlett's test of sphericity"
+   data.name <- deparse(substitute(x))
+   x <- subset(x, complete.cases(x))
+   n <- nrow(x)
+   p <- ncol(x)
+   chisq <- (1-n+(2*p+5)/6)*log(det(cor(x)))
+   df <- p*(p-1)/2
+   p.value <- pchisq(chisq, df, lower.tail=FALSE)
+   names(chisq) <- "Khi-squared"
+   names(df) <- "df"
+   return(structure(list(statistic=chisq, parameter=df, p.value=p.value,
+                         method=method, data.name=data.name), class="htest"))}
> 
> 
> dataakhir<-data[c(7:35),c(1,2,3,4,6)]
> View(dataakhir)
> 
> # Mengambil subset dari dataakhir yang hanya berisi kolom-kolom numerik
> data_numerik <- dataakhir[, sapply(dataakhir, is.numeric)]
> 
> # Menjalankan uji Bartlett pada kolom-kolom numerik
> uji_bart(data_numerik)

    Bartlett's test of sphericity

data:  data_numerik
Khi-squared = 173.68, df = 6, p-value < 2.2e-16

Fungsi uji_bart digunakan untuk melakukan uji Bartlett’s test of sphericity pada data numerik yang diberikan. Uji Bartlett digunakan untuk menguji apakah matriks korelasi variabel-variabel numerik dalam data tersebut adalah matriks identitas, yang menunjukkan bahwa variabel-variabel tersebut bersifat independen.

3.4 Pengujian perbedaan Rata-rata variabel dependen

> X<-as.matrix(dataakhir[2:4])
> X.manova<-manova(X~dataakhir$Binary_Garis_Kemiskinan, data=dataakhir[2:4])
> X.manova
Call:
   manova(X ~ dataakhir$Binary_Garis_Kemiskinan, data = dataakhir[2:4])

Terms:
                            dataakhir$Binary_Garis_Kemiskinan Residuals
Presentase_Penduduk_Miskin                           25.11774 243.18868
Indeks_Kedalaman_kemiskinan                           0.79566  11.22493
Indeks_Keparahan_Kemiskinan                           0.04058   0.87593
Deg. of Freedom                                             1        27

Residual standard errors: 3.001164 0.6447776 0.1801158
Estimated effects may be unbalanced
> X.wilks<-summary(X.manova, test="Wilks")
> X.wilks
                                  Df   Wilks approx F num Df den Df Pr(>F)
dataakhir$Binary_Garis_Kemiskinan  1 0.85478   1.4157      3     25 0.2616
Residuals                         27

Syntax tersebut digunakan dalam analisis multivariat (MANOVA) pada variabel numerik (kolom 2 hingga 4) berdasarkan variabel biner Binary_Garis_Kemiskinan dalam dataset dataakhir. MANOVA digunakan untuk menentukan apakah terdapat perbedaan signifikan dalam mean variabel numerik antara dua grup yang dibentuk oleh variabel biner tersebut. Hasil analisis, termasuk uji statistik Wilks’ Lambda, disimpan dalam variabel X.wilks. Ini membantu memahami dampak variabel biner terhadap variabel-variabel numerik yang diteliti.

3.5 Kontribusi Variabel Prediktor terhadap Variabel Respon

> cc<-candisc(X.manova)
> cc

Canonical Discriminant Analysis for dataakhir$Binary_Garis_Kemiskinan:

   CanRsq Eigenvalue Difference Percent Cumulative
1 0.14522    0.16989                100        100

Test of H0: The canonical correlations in the 
current row and all that follow are zero

  LR test stat approx F numDF denDF Pr(> F)
1      0.85478   1.4157     3    25  0.2616

Syntax tersebut menggunakan fungsi candisc() untuk melakukan analisis diskriminan kanonikal pada hasil MANOVA yang disimpan dalam variabel X.manova. Analisis ini membantu memahami kontribusi variabel numerik terhadap pemisahan grup berdasarkan variabel biner Binary_Garis_Kemiskinan. Hasilnya, termasuk koefisien diskriminan, disimpan dalam variabel cc, memungkinkan identifikasi variabel yang paling berpengaruh dalam membedakan grup berdasarkan tingkat kemiskinan. Analisis ini penting dalam memahami faktor-faktor yang paling mempengaruhi status kemiskinan di setiap kabupaten dan kota.

3.6 Membuat Fungsi Diskriminan

> #model discriminant
> modellda<-lda(dataakhir$Binary_Garis_Kemiskinan~., data = dataakhir[2:4])
> modellda
Call:
lda(dataakhir$Binary_Garis_Kemiskinan ~ ., data = dataakhir[2:4])

Prior probabilities of groups:
        0         1 
0.4827586 0.5172414 

Group means:
  Presentase_Penduduk_Miskin Indeks_Kedalaman_kemiskinan
0                   10.89643                    1.632143
1                    9.03400                    1.300667
  Indeks_Keparahan_Kemiskinan
0                   0.3728571
1                   0.2980000

Coefficients of linear discriminants:
                                    LD1
Presentase_Penduduk_Miskin  -0.03953763
Indeks_Kedalaman_kemiskinan -8.24866589
Indeks_Keparahan_Kemiskinan 26.87769027

Dalam sintaks tersebut, fungsi lda() digunakan untuk membuat model analisis diskriminan. Variabel target dataakhir$Binary_Garis_Kemiskinan diprediksi berdasarkan variabel prediktor yang diwakili oleh kolom ke-2 hingga ke-4 dalam dataakhir. Model ini menggunakan analisis diskriminan linear untuk memahami hubungan antara variabel-variabel prediktor tersebut dan variabel target Binary_Garis_Kemiskinan.

3.7 Membuat tabel klasifikasi dan menguji ketepatan model

Setelah mendapatkan model fungsi diskriminan, langkah selanjutnya adalah menguji seberapa baik fungsi tersebut dapat mengklasifikasikan data. Dalam konteks evaluasi, apabila ingin menilai seberapa akurat model diskriminan dalam mengklasifikasikan data ke dalam kategori yang benar.

> prediksi <- predict(modellda, dataakhir)
> prediksi
$class
 [1] 0 1 0 0 0 0 0 0 0 0 0 1 1 1 0 1 0 1 1 1 0 0 0 1 1 1 1 1 1
Levels: 0 1

$posterior
           0         1
1  0.5385718 0.4614282
2  0.4114809 0.5885191
3  0.6490740 0.3509260
4  0.5872054 0.4127946
5  0.5304682 0.4695318
6  0.5098853 0.4901147
7  0.5811500 0.4188500
8  0.7518533 0.2481467
9  0.6709932 0.3290068
10 0.5893266 0.4106734
11 0.6958135 0.3041865
12 0.4973810 0.5026190
13 0.3193202 0.6806798
14 0.2638896 0.7361104
15 0.7480830 0.2519170
16 0.3659570 0.6340430
17 0.5875675 0.4124325
18 0.2890963 0.7109037
19 0.3814844 0.6185156
20 0.3176242 0.6823758
21 0.8021003 0.1978997
22 0.5036504 0.4963496
23 0.8137985 0.1862015
24 0.3081683 0.6918317
25 0.2129599 0.7870401
26 0.1734794 0.8265206
27 0.2014740 0.7985260
28 0.4153315 0.5846685
29 0.2640242 0.7359758

$x
          LD1
1  -0.2946509
2   0.3492118
3  -0.8730974
4  -0.5432173
5  -0.2537276
6  -0.1500975
7  -0.5118958
8  -1.4932244
9  -0.9958654
10 -0.5542211
11 -1.1400573
12 -0.0872461
13  0.8506045
14  1.1885323
15 -1.4679606
16  0.5901439
17 -0.5450943
18  1.0301268
19  0.5067797
20  0.8604224
21 -1.8587949
22 -0.1187560
23 -1.9535448
24  0.9156878
25  1.5420077
26  1.8611376
27  1.6298746
28  0.3292611
29  1.1876613
> table(actual=dataakhir$Binary_Garis_Kemiskinan, predicted=prediksi$class)
      predicted
actual  0  1
     0 11  3
     1  4 11
> 
> # Menambahkan hasil prediksi ke dalam data awal
> dataakhir$Prediksi_Kelompok <- prediksi$class
> View(dataakhir)

Dalam sintaks tersebut, model analisis diskriminan (modellda) yang telah dibuat sebelumnya digunakan untuk melakukan prediksi pada data dataakhir. Hasil prediksi tersebut kemudian dibandingkan dengan variabel target aktual (dataakhir$Binary_Garis_Kemiskinan) menggunakan fungsi table(). Selanjutnya, hasil prediksi (kelompok 0 atau 1) disimpan dalam kolom baru bernama Prediksi_Kelompok dalam data dataakhir. Dengan demikian, sintaks tersebut digunakan untuk menghasilkan prediksi berdasarkan model diskriminan dan menambahkannya ke dalam dataset asli (dataakhir).

3.8 Pemetaan Tingkat Kemiskinan Kabupaten dan Kota

> # Menjelaskan kelompok 0
> print("Kelompok 0 (Kabupaten/Kota dengan Angka Kemiskinan Rendah):")
[1] "Kelompok 0 (Kabupaten/Kota dengan Angka Kemiskinan Rendah):"
> print(dataakhir[dataakhir$Prediksi_Kelompok == 0, "Kabupaten_Kota"])
# A tibble: 15 × 1
   Kabupaten_Kota  
   <chr>           
 1 Kab. Wonosobo   
 2 Kab. Boyolali   
 3 Kab. Klaten     
 4 Kab. Sukoharjo  
 5 Kab. Wonogiri   
 6 Kab. Karanganyar
 7 Kab. Sragen     
 8 Kab. Grobogan   
 9 Kab. Blora      
10 Kab. Rembang    
11 Kab. Demak      
12 Kab. Temanggung 
13 Kab. Pemalang   
14 Kab. Tegal      
15 Kab. Brebes     
> 
> 
> # Menjelaskan kelompok 1
> print("Kelompok 1 (Kabupaten/Kota dengan Angka Kemiskinan Tinggi):")
[1] "Kelompok 1 (Kabupaten/Kota dengan Angka Kemiskinan Tinggi):"
> print(dataakhir[dataakhir$Prediksi_Kelompok == 1, "Kabupaten_Kota"])
# A tibble: 14 × 1
   Kabupaten_Kota 
   <chr>          
 1 Kab. Magelang  
 2 Kab. Pati      
 3 Kab. Kudus     
 4 Kab. Jepara    
 5 Kab. Semarang  
 6 Kab. Kendal    
 7 Kab. Batang    
 8 Kab. Pekalongan
 9 Kota Magelang  
10 Kota Surakarta 
11 Kota Salatiga  
12 Kota Semarang  
13 Kota Pekalongan
14 Kota Tegal

Syntax tersebut digunakan untuk menjelaskan hasil klasifikasi kelompok kemiskinan berdasarkan model diskriminan. Bagian pertama menjelaskan kelompok 0, yaitu kabupaten/kota dengan angka kemiskinan rendah, dan menampilkan daftar nama kabupaten/kota yang masuk dalam kelompok tersebut. Bagian kedua menjelaskan kelompok 1, yaitu kabupaten/kota dengan angka kemiskinan tinggi, dan menampilkan daftar nama kabupaten/kota yang termasuk dalam kelompok tersebut. Dengan menggunakan syntax ini, maka akan terlihat dengan jelas pemetaan hasil klasifikasi ke dalam dua kelompok berbeda.

4 HASIL DAN PEMBAHASAN

4.1 Asumsi Normal Multivariat

Hipotesis Uji Normal Multivariat:

Hipotesis Nol (H0): Variabel prediktor berdistribusi normal multivariat.
Hipotesis Alternatif (H1): Variabel prediktor tidak berdistribusi normal multivariat.

Keputusan Uji Normal Multivariat Berdasarkan hasil output Uji Normal Multivariat, diperoleh nilai P-value sebesar 0.1482623, yang lebih besar dari tingkat signifikansi alpha=0.05. Oleh karena itu, hipotesis nol (H0) ditolak.

Interpretasi Hasil Dari hasil ini, dapat disimpulkan bahwa data berdistribusi normal multivariat.

4.2 Asumsi Homogenitas Matriks Varian-Kovarian

Hipotesis Homogenitas Matriks Varian-Kovarian:

Hipotesis Nol (H0): Matriks kovarian dari variabel-variabel dalam analisis diskriminan adalah matriks identitas atau sphericity (variabel-variabel tidak berkorelasi).
Hipotesis Alternatif (H1): Terdapat perbedaan signifikan dalam matriks kovarian variabel-variabel tersebut.

Keputusan Homogenitas Matriks Ragam-peragam

Berdasarkan hasil uji Bartlett’s test of sphericity menunjukkan bahwa terdapat perbedaan signifikan antara matriks kovarian dalam analisis diskriminan. Nilai p-value yang sangat kecil \[2.2 \times 10^{-16}\] menunjukkan bahwa hipotesis nol (matriks kovarian identitas atau sphericity) ditolak.

Namun, karena metode analisis diskriminan yang digunakan adalah Linear Discriminant Analysis (LDA) maka, pada dasarnya asumsi homogenitas matriks kovarian tidak diperlukan.

4.3 Pengujian Perbedaan Rata-rata Variabel dependen

Hipotesis:

H0: Tidak ada perbedaan rata-rata antara kategori tinggi dan rendah kemiskinan dalam variabel yang diukur.
H1: Terdapat perbedaan rata-rata antara kategori tinggi dan rendah kemiskinan dalam variabel yang diukur.

Hasil Uji MANOVA: Dalam pengujian MANOVA, variabel biner Binary_Garis_Kemiskinan digunakan untuk memisahkan data menjadi kategori tinggi dan rendah kemiskinan. Hasil uji MANOVA menunjukkan:

Wilks’ Lambda: 0.82497
Approximate F-Statistic: 1.5559
Derajat Kebebasan: (3, 22)
Nilai p: 0.2284

Karena nilai p (0.2284) lebih besar dari tingkat signifikansi alpha (misalnya, 0.05), tidak cukup bukti untuk menolak hipotesis nol. Ini berarti bahwa tidak ada cukup bukti statistik untuk mendukung perbedaan rata-rata antara kategori tinggi dan rendah kemiskinan dalam variabel yang diukur.

Interpretasi: Berdasarkan hasil uji MANOVA, tidak ditemukan perbedaan yang signifikan dalam variabel yang diukur antara kelompok tinggi dan rendah kemiskinan. Dengan demikian, tidak terdapat bukti yang cukup untuk menyatakan adanya perbedaan yang signifikan antara tingkat kemiskinan dalam variabel tersebut.

4.4 Kontribusi Variabel Prediktor terhadap Variabel Respon

Dalam uji hipotesis, apakah Canonical Correlations memiliki nilai yang signifikan. Hasil uji menunjukkan:

Uji Statistik: 0.82497
Approximate F-Statistic: 1.5559
Derajat Kebebasan: (3, 22)
Nilai p: 0.2284

Karena nilai p (0.2284) lebih besar dari tingkat signifikansi alpha ( 0.05),tidak cukup bukti untuk menolak hipotesis nol. Ini berarti bahwa Canonical Correlations tidak memiliki nilai yang signifikan secara statistik.

Interpretasi: Berdasarkan hasil uji yang didapat menunjukkan bahwa nilai Canonical Correlation sebesar 0.17503, artinya variabel respon hanya dapat menjelaskan 17,5% dalam menentukan tinggi rendahnya garis kemiskinan di Jawa Tengah pada tahun 2022. Sementara 82,5% lainnya dipengaruhi oleh variabel lain di luar penelitian.

4.5 Fungsi Diskriminan

Dalam analisis diskriminan,fungsi diskriminan digunakan untuk memisahkan antara kelompok-kelompok yang berbeda. Dengan menggunakan model LDA pada data, fungsi diskriminan baku yang terbentuk adalah sebagai berikut:

\[ D = 0.1491617 \times X_1 - 12.4714841 \times X_2 + 42.0144397 \times X_3 \]

Keterangan Variabel: - $X_1$: Presentase Penduduk Miskin - $X_2$: Indeks Kedalaman Kemiskinan - $X_3$: Indeks Keparahan Kemiskinan

Dalam fungsi diskriminan ini, koefisien variabel Presentase Penduduk Miskin bernilai positif, menandakan bahwa peningkatan presentase penduduk miskin akan meningkatkan nilai diskriminan. Sebaliknya, koefisien variabel Indeks Kedalaman Kemiskinan dan Indeks Keparahan Kemiskinan bernilai negatif, menandakan bahwa peningkatan kedalaman dan keparahan kemiskinan akan menurunkan nilai diskriminan.

Interpretasi Hasil Model LDA

Model LDA menghasilkan probabilitas prior kelompok sebagai berikut:

Kelompok 0: 42.31%
Kelompok 1: 57.69%

Rata-rata variabel pada setiap kelompok adalah sebagai berikut:

Kelompok 0:
- Presentase Penduduk Miskin: 10.50
- Indeks Kedalaman Kemiskinan: 1.53
- Indeks Keparahan Kemiskinan: 0.34
Kelompok 1:
- Presentase Penduduk Miskin: 9.03
- Indeks Kedalaman Kemiskinan: 1.30
- Indeks Keparahan Kemiskinan: 0.30

Model ini memungkinkan untuk memprediksi kelompok-kelompok yang berbeda berdasarkan variabel-variabel tersebut dengan probabilitas tertentu.

5 PENUTUP

Berdasarkan hasil analisis yang telah dilakukan menggunakan teknik analisis diskriminan, maka pengelompokan Kabupaten/Kota di Jawa Tengah menjadi dua kelompok berdasarkan angka kemiskinan. Berikut adalah penjelasan mengenai kedua kelompok tersebut:

Kelompok 0 (Kabupaten/Kota dengan Angka Kemiskinan Rendah):

1 Kab. Wonosobo
2 Kab. Boyolali
3 Kab. Klaten
4 Kab. Sukoharjo
5 Kab. Wonogiri
6 Kab. Karanganyar 7 Kab. Sragen
8 Kab. Grobogan
9 Kab. Blora
10 Kab. Rembang
11 Kab. Demak
12 Kab. Temanggung 13 Kab. Pemalang
14 Kab. Tegal
15 Kab. Brebes

Kelompok 1 (Kabupaten/Kota dengan Angka Kemiskinan Tinggi):

Kab. Magelang
Kab. Pati
Kab. Kudus
Kab. Jepara
Kab. Semarang
Kab. Kendal
Kab. Batang
Kab. Pekalongan
Kota Magelang
Kota Surakarta
Kota Salatiga
Kota Semarang
Kota Pekalongan
Kota Tegal

6 DAFTAR PUSTAKA

Ferezagia, D.V. (2018). Analisis Tingkat Kemiskinan di Indonesia. Jurnal Sosial Humaniora Terapan, 1(1), 1-10. E ISSN 2622 – 1152.
Addini, P. F., Windy, & Purwanto, A. (2023). Analisis Diskriminan Dalam Pengklasifikasian Kemiskinan Pada Kota/Kabupaten di Provinsi Sumatera Utara. Jurnal Sains dan Teknologi, 5(1), 130-134. E-ISSN: 2714-8661. DOI: https://doi.org/10.55338/saintek.v4i3.1440.
Rahman, F., Wiediartini, & Sari, D. P. (2018). Penerapan Discriminant Analysis Untuk Mengetahui Faktor Yang Mempengaruhi Tingkat Kepuasan Pengguna Jasa Unit Layanan PPNS. Seminar Master 2018 PPNS. ISSN: 2548-1509 (cetak) | 2548-6527 (online).
Arkan, F. (2022, Mei 18). Penerapan Analisis Diskriminan Linier Terhadap Ketangguhan Mahasiswa Dalam Berwirausaha. Diakses dari https://rpubs.com/firosresnale123/MiniProjectPraktikumKomstat
Damayanti, E. C. (2022, November). Analisis Diskriminan Untuk Klasifikasi Kabupaten/Kota di Jawa Timur Berdasarkan Indeks Pembangunan Manusia. Diakses dari https://rpubs.com/erraclaudia/diskriminan

Tingkat Kemiskinan Kabupaten-kota di Jawa Tengah: Pemetaan dan Analisis Diskriminan Data Tahun 2022

Husnul Khatimah

2023-11-03