Library:
# install.packages("rmarkdown)
# install.packages("knitr")
# install.packages("prettydoc")
# install.packages("equatiomatic")
# install.packages("tidyverse")
# install.packages("AOV1R")
# install.packages("car")
1 PENDAHULUAN
1.1 Latar Belakang
Indonesia, sebagai negara dengan populasi besar dan beragam memiliki banyak kota besar di setiap provinsinya. Salah satu kota besar di Provinsi Jawa Timur adalah Kota Malang yang pastinya memiliki struktur demografis yang kompleks dan beragam. Salah satu aspek penting dari demografi kota adalah distribusi jumlah Kepala Keluarga (KK) di setiap kecamatan. Kepala Keluarga merupakan unit dasar dalam masyarakat yang berfungsi sebagai pengatur kegiatan keluarga sehari-hari. Memahami distribusi ini sangat penting untuk perencanaan pembangunan, alokasi sumber daya, dan pengambilan keputusan kebijakan publik yang lebih baik. Maka dari itu, akan diamati apakah terdapat perbedaan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023. Untuk mencapai tujuan tersebut, metode statistika yang digunakan adalah Analisis Ragam Satu Arah (One Way ANOVA).
2 TINJAUAN PUSTAKA
2.1 Statistika
Statistika adalah ilmu yang mempelajari tentang metode mengumpulkan, mengorganisir, dan menganalisis segala bentuk informasi atau data hingga menjadi suatu kesimpulan untuk mengambil keputusan prediksi atau ramalan. Secara garis besar Statistika dapat dibedakan menjadi dua jenis yakni statistika deskriptif dan statistika inferensial.
2.2 Statistika Deskriptif
Statistika deskriptif merupakan metode pengumpulan, pengolahan, dan penyajian data untuk menghasilkan informasi atau gambaran menyeluruh yang bermanfaat. Statistika deskriptif hanya berfokus pada pengolahan dan penyajian data tanpa mengambil keputusan mengenai populasi. Bidang ini hanya memberikan gambaran umum dari data yang diperoleh (Walpole, 1997). Statistika deskriptif biasanya digambarkan melalui ukuran penyebaran data, ukuran pemusatan data, grafik, diagram, histogram, dan lain-lain.
2.3 Analisis Ragam (ANOVA) One- Way
Metode ANOVA, yang merupakan singkatan dari Analysis of Variance, ditemukan dan diperkenalkan oleh seorang ahli statistik bernama Ronald Fisher pada tahun 1925. ANOVA dirancang untuk memisahkan variansi menjadi dua komponen yaitu, variansi antar kelompok dan variansi dalam kelompok. Tujuannya adalah untuk membandingkan variansi ini guna menganalisis adanya perbedaan rata-rata antar kelompok
2.3.1 Hipotesis
Hipotesis nol (\(H_0\)) dan hipotesis alternatif (\(H_a\)) dinyatakan sebagai berikut.
\(H_0\): \(\mu_1\) = \(\mu_2\) = \(\mu_3\) = \(\cdots\) = \(\mu_k\) = 0
\(H_1\): Paling sedikit terdapat satu pasang kelompok i dan i’ yang tidak sama ( \(\mu_i\) \(\neq\) \(\mu_i'\))
Di mana: \(\mu_k\) adalah rata-rata populasi dari kelompok ke-k.
2.3.2 Kriteria Penolakan
Keputusan Kriteria penolakan dalam ANOVA didasarkan pada perbandingan nilai statistik \(F\) dengan titik kritis \(F\) dari tabel distribusi \(F\) pada tingkat signifikansi (\(\alpha\)) tertentu.
- Jika \(F_{hitung} \geq F_{tabel}\), maka tolak \(H_0\).
- Jika \(F_{hitung} < F_{tabel}\), maka gagal untuk menolak \(H_0\).
Dalam bentuk lain, keputusan ini juga dapat diambil berdasarkan nilai \(p\) :
- Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).
- Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).
Keterangan :
- \(F_{hitung}\) adalah nilai \(F\) yang diperoleh dari perhitungan ANOVA.
- \(F_{tabel}\) adalah nilai kritis \(F\) dari tabel distribusi \(F\) berdasarkan derajat kebebasan \(DB_{kelompok}\) dan \(DB_{galat}\).
- \(P\)-value adalah probabilitas mendapatkan nilai \(F\) yang sama atau lebih ekstrem jika \(H_0\) benar.
- \(\alpha\) adalah tingkat signifikansi yang ditetapkan (umumnya 0.05).
2.3.3 Rumus
Dengan rumus sebagai berikut :
\[F_{hitung} = \frac{KT_{kelompok}}{KT_{galat}}\]
Di mana:
\(JK_{kelompok} = \sum_{i=1}^{k} n_i (\bar{X}_i - \bar{X})^2\)
\(JK_{total} = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (X_{ij} - \bar{X}_i)^2\)
\(JK_{galat} = JK_{total} - JK_{kelompok}\)
\(DB_{kelompok} = k - 1\)
\(DB_{total} = N - 1\)
\(DB_{galat} = (N - 1)-(k-1)\)
\(KT_{kelompok} = \frac{JK_{kelompok}}{DB_{kelompok}}\)
\(KT_{galat} = \frac{JK_{galat}}{DB_{galat}}\)
Keterangan :
- \(k\) adalah jumlah kelompok
- \(n_i\) adalah ukuran sampel dari kelompok ke-i
- \(\bar{X}_i\) adalah rata-rata kelompok ke-i
- \(\bar{X}\) adalah rata-rata total
- \(N\) adalah total jumlah sampel.
- \(JK_{kelompok}\) adalah Jumlah Kuadrat Antar Kelompok
- \(JK_{total}\) adalah Jumlah Kuadrat seluruh data amatan
- \(JK_{galat}\) adalah Jumlah Kuadrat sisa / galat
- \(DB_{kelompok}\) adalah Derajat Bebas Antar Kelompok
- \(DB_{total}\) adalah Derajat Bebas seluruh data amatan
- \(DB_{galat}\) adalah Derajat Bebas sisa / galat
- \(KT_{kelompok}\) adalah Kuadrat Tengah atau Rata-rata kuadrat Antar Kelompok
- \(KT_{galat}\) adalah Kuadrat Tengah atau Rata-rata kuadrat sisa / galat
2.4 Asumsi Analisis ragam (ANOVA)
2.4.1 Asumsi Normalitas Galat
Uji Normalitas merupakan pengujian yang digunakan untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak dengan cara uji normalitas pada galat. Untuk melakukan uji normalitas ini dapat menggunakan uji Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.
Hipotesis:
\(H_0~ : \text{Pengamatan berdistribusi normal}\)
\(H_1~ : \text{Pengamatan tidak berdistribusi normal}\)
Kriteria :
- Apabila P-Value \(>\) α, maka keputusan H0 diterima. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal
- Apabila P-Value \(\leq\) α, maka keputusan H0 ditolak. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal
2.4.2 Asumsi Homogenitas Ragam
Uji homogenitas adalah pengujian yang dilakukan untuk mengetahui sama tidaknya variansi dua buah distribusi atau lebih. Dalam buku yang ditulis Sudjana (2005), uji homogenitas dapat dilakukan dengan uji levene, fisher atau uji bartlett.
Hipotesis:
\(H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2\)
\(H_1: \text{Setidaknya ada dua varians yang berbeda}\)
Kriteria :
- Apabila P-Value \(>\) α, maka keputusan H0 diterima. Disimpulkan bahwa data mempunyai ragam galat yang homogen
- Apabila P-Value \(\leq\) α, maka keputusan H0 ditolak. Disimpulkan bahwa data mempunyai ragam galat yang tidak homogen
2.4.3 Asumsi Independensi
Hipotesis:
\(H_0~ : \text{Data antar perlakuan bersifat independen}\) \(H_1~ : \text{Data antar perlakuan tidak bersifat independen}\)
Kriteria :
- Apabila P-Value \(>\) α, maka keputusan H0 diterima. Disimpulkan bahwa data antar perlakuan bersifat independen
- Apabila P-Value \(\leq\) α, maka keputusan H0 ditolak. Disimpulkan bahwa data antar perlakuan tidak bersifat independen
3 SOURCE CODE
3.1 Library
3.2 Data
data = read_excel("~/SEMESTER 4/KOMSTAT/PRAKTIKUM/Jumlah Kepala Keluarga (KK) Menurut Kecamatan di Kota Malang Tahun 2023.xlsx")
head(data)## # A tibble: 6 × 5
## `Kedung Kandang` Sukun Klojen Belimbing Lawokwaru
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 3828 3421 4306 4011 5503
## 2 2354 6743 2965 6237 3739
## 3 2611 4507 2080 3932 2701
## 4 6593 6440 3021 8832 1682
## 5 5292 10366 5016 9360 6338
## 6 6110 3415 2773 10871 6469
3.3 Statistika Deskriptif
3.3.1 Ringkasan 5 Angka
## Kedung Kandang Sukun Klojen Belimbing Lawokwaru
## Min. :2354 Min. : 3415 Min. :1976 Min. : 2911 Min. :1682
## 1st Qu.:3878 1st Qu.: 4702 1st Qu.:2426 1st Qu.: 3666 1st Qu.:2868
## Median :6110 Median : 5760 Median :3021 Median : 4055 Median :5503
## Mean :5789 Mean : 6120 Mean :3141 Mean : 5740 Mean :4603
## 3rd Qu.:7104 3rd Qu.: 6650 3rd Qu.:3576 3rd Qu.: 7678 3rd Qu.:5992
## Max. :9801 Max. :10366 Max. :5016 Max. :10871 Max. :7378
3.3.2 Histogram Kecamatan Kedung Kandang
hist(data$`Kedung Kandang`, main = 'Histogram Kecamatan Kedung Kandang', ylab = 'Frekuensi', xlab ='Jumlah KK')3.3.3 Histogram Kecamatan Sukun
3.3.4 Histogram Kecamatan Klojen
3.3.5 Histogram Kecamatan Belimbing
3.4 Menghitung ANOVA dengan Function
3.4.1 Membuat data frame dengan nama kolom “Kecamatan” dan “Jumlah KK”
data_aov = data %>%
pivot_longer(c(`Kedung Kandang`, Sukun, Klojen, Belimbing, Lawokwaru), names_to="Kecamatan", values_to="Jumlah_KK")
names(data_aov) = c("Kecamatan", "Jumlah_KK")
data_aov$Kecamatan = as.factor(data_aov$Kecamatan)
data_aov$Jumlah_KK = as.numeric(data_aov$Jumlah_KK)
data_aov## # A tibble: 55 × 2
## Kecamatan Jumlah_KK
## <fct> <dbl>
## 1 Kedung Kandang 3828
## 2 Sukun 3421
## 3 Klojen 4306
## 4 Belimbing 4011
## 5 Lawokwaru 5503
## 6 Kedung Kandang 2354
## 7 Sukun 6743
## 8 Klojen 2965
## 9 Belimbing 6237
## 10 Lawokwaru 3739
## # ℹ 45 more rows
3.4.2 Menampilkan Hasil ANOVA
## Call:
## aov(formula = Jumlah_KK ~ Kecamatan, data = data_aov)
##
## Terms:
## Kecamatan Residuals
## Sum of Squares 66087795 235584853
## Deg. of Freedom 4 50
##
## Residual standard error: 2170.644
## Estimated effects may be unbalanced
## Df Sum Sq Mean Sq F value Pr(>F)
## Kecamatan 4 66087795 16521949 3.507 0.0134 *
## Residuals 50 235584853 4711697
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
3.5 Perhitungan Manual
3.5.1 Jumlah Kuadrat Total
## [1] 301672648
3.5.2 Jumlah Kuadrat Kelompok
#Rata-rata setiap kelompok
rata2kelompok = tapply(data_aov$Jumlah_KK, data_aov$Kecamatan, mean)
rata2kelompok## Belimbing Kedung Kandang Klojen Lawokwaru Sukun
## 5740.182 5789.455 3140.909 4603.000 6119.818
JKK = sum(sapply(levels(data_aov$Kecamatan), function(k) {
n_k <- sum(data_aov$Kecamatan == k)
(n_k * (rata2kelompok[k] - mean(data_aov$Jumlah_KK))^2)}))
JKK## [1] 66087795
3.5.4 Kuadrat Tengah Kelompok
## [1] 16521949
3.5.5 Kuadrat Tengah Galat
## [1] 4711697
3.6 Tabel ANOVA
| Sumber keragaman | DB | JK | KT | F hitung | P-value |
|---|---|---|---|---|---|
| Kelompok (Kecamatan) | 4 | 66087795 | 16521949 | 3.506581 | 0.01338582 |
| Galat | 50 | 235584853 | 4711697 | ||
| Total | 54 | 301672648 |
3.7 Mendapatkan Residu dari ANOVA
## 1 2 3 4 5 6
## -1961.45455 -2698.81818 1165.09091 -1729.18182 900.00000 -3435.45455
## 7 8 9 10 11 12
## 623.18182 -175.90909 496.81818 -864.00000 -3178.45455 -1612.81818
## 13 14 15 16 17 18
## -1060.90909 -1808.18182 -1902.00000 803.54545 320.18182 -119.90909
## 19 20 21 22 23 24
## 3091.81818 -2921.00000 -497.45455 4246.18182 1875.09091 3619.81818
## 25 26 27 28 29 30
## 1735.00000 320.54545 -2704.81818 -367.90909 5130.81818 1866.00000
## 31 32 33 34 35 36
## 4011.54545 -551.81818 429.09091 -2829.18182 935.00000 -1862.45455
## 37 38 39 40 41 42
## -359.81818 -1164.90909 783.81818 2775.00000 3169.54545 3525.18182
## 43 44 45 46 47 48
## -1117.90909 -1685.18182 1044.00000 1557.54545 -1222.81818 440.09091
## 49 50 51 52 53 54
## -2340.18182 -2001.00000 1072.54545 436.18182 98.09091 -2731.18182
## 55
## -1567.00000
3.8 Uji Asumsi ANOVA
3.8.1 Asumsi Normalitas Galat
##
## Jarque Bera Test
##
## data: data_aov$Jumlah_KK
## X-squared = 4.8839, df = 2, p-value = 0.08699
3.8.2 Asumsi Homogenitas Ragam
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 1.517 0.2115
## 50
4 HASIL DAN PEMBAHASAN
4.1 Statistika Deskriptif
## Kedung Kandang Sukun Klojen Belimbing Lawokwaru
## Min. :2354 Min. : 3415 Min. :1976 Min. : 2911 Min. :1682
## 1st Qu.:3878 1st Qu.: 4702 1st Qu.:2426 1st Qu.: 3666 1st Qu.:2868
## Median :6110 Median : 5760 Median :3021 Median : 4055 Median :5503
## Mean :5789 Mean : 6120 Mean :3141 Mean : 5740 Mean :4603
## 3rd Qu.:7104 3rd Qu.: 6650 3rd Qu.:3576 3rd Qu.: 7678 3rd Qu.:5992
## Max. :9801 Max. :10366 Max. :5016 Max. :10871 Max. :7378
Dilihat dari histogram dan ringkasan 5 angka yang ada,
- Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Kedung Kandang sebesar 9801, dengan rata-rata 5789 kartu keluarga.
- Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Sukun sebesar 10366, dengan rata-rata 6120 kartu keluarga.
- Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Klojen sebesar 5016, dengan rata-rata 3141 kartu keluarga.
- Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Belimbing sebesar 10871, dengan rata-rata 5740 kartu keluarga.
- Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Lawokwaru sebesar 7378, dengan rata-rata 4603 kartu keluarga.
4.2 Hasil ANOVA One-Way
## Df Sum Sq Mean Sq F value Pr(>F)
## Kecamatan 4 66087795 16521949 3.507 0.0134 *
## Residuals 50 235584853 4711697
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Pada studi kasus ini, ingin dilakukan pengujian apakah ada perbedaan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023. Dari Hasil ANOVA didapatkan \(F_{hitung}\) sebesar 3.507 dan \(P-value\) sebesar 0.0134.
- Karena \(P-value\) (0.0134) \(< alpha\) (0.05) dengan menggunakan taraf nyata 5%, maka didapatkan keputusan tolak \(H_0\).
Yang artinya, terdapat perbedaan signifikan antara perbedaan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023.
4.3 Asumsi Normalitas Galat
##
## Jarque Bera Test
##
## data: data_aov$Jumlah_KK
## X-squared = 4.8839, df = 2, p-value = 0.08699
Berdasarkan hasil uji Jarque Bera, diperoleh \(P-value\) sebesar 0.08699.
- Karena \(P-value\) (0.08699) \(> alpha\) (0.05), maka didapatkan keputusan terima \(H_0\)
yang artinya pengamatan menyebar normal.
4.4 Asumsi Homogenitas Ragam
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 1.517 0.2115
## 50
Ragam Berdasarkan hasil uji Levene, diperoleh \(P-value\) sebesar 0.2115.
- Karena \(P-value\) (0.2115) \(> alpha\) (0.05), maka didapatkan keputusan terima \(H_0\)
yang artinya data mempunyai ragam galat yang homogen. Sehingga dapat disimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.
4.5 Asumsi Independensi
## lag Autocorrelation D-W Statistic p-value
## 1 0.2073173 1.558612 0.164
## Alternative hypothesis: rho != 0
Berdasarkan hasil uji Durbin Watson, diperoleh \(P-value\) sebesar 0.17
- Karena \(P-value\) (0.17) \(> alpha\) (0.05) maka didapatkan keputusan terima \(H_0\)
yang artinya data antar perlakuan bersifat independen.
5 KESIMPULAN
Berdasarkan hasil uji ANOVA, hasil menunjukkan bahwa terdapat perbedaan signifikan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023. Selain itu, semua asumsi yang diperlukan dalam penggunaan metode ANOVA sudah terpenuhi.
6 DAFTAR PUSTAKA
- Model Statistik Inferens(2018). MODUL STATISTIK INFERENS (MIK 411) Materi 4 ANOVA (Analysis of Variance). Diakses pada 28 Mei 2024, dari https://lms-paralel.esaunggul.ac.id/pluginfile.php?file=/67032/mod_resource/content/1/Modul4+MIK+411+-+ANOVA.pdf
- Martias, L. D. (2021). STATISTIKA DESKRIPTIF SEBAGAI KUMPULAN INFORMASI, FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, Volume (16), 40-59.
- Nasution, L. M. (2017). STATISTIK DESKRIPTIF, Jurnal Hikmah, Volume (14), 49-55.
- Harlan, J (2018). Analisis Variansi. Depok:Gunadarma.
- Badan Pusat Statistik Kota Malang. (2023). Data Jumlah Kepala Keluarga Menurut Kecamatan di Kota Malang Tahun 2023.