Library:

# install.packages("rmarkdown)
# install.packages("knitr")
# install.packages("prettydoc")
# install.packages("equatiomatic")
# install.packages("tidyverse")
# install.packages("AOV1R")
# install.packages("car")

1 PENDAHULUAN

1.1 Latar Belakang

Indonesia, sebagai negara dengan populasi besar dan beragam memiliki banyak kota besar di setiap provinsinya. Salah satu kota besar di Provinsi Jawa Timur adalah Kota Malang yang pastinya memiliki struktur demografis yang kompleks dan beragam. Salah satu aspek penting dari demografi kota adalah distribusi jumlah Kepala Keluarga (KK) di setiap kecamatan. Kepala Keluarga merupakan unit dasar dalam masyarakat yang berfungsi sebagai pengatur kegiatan keluarga sehari-hari. Memahami distribusi ini sangat penting untuk perencanaan pembangunan, alokasi sumber daya, dan pengambilan keputusan kebijakan publik yang lebih baik. Maka dari itu, akan diamati apakah terdapat perbedaan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023. Untuk mencapai tujuan tersebut, metode statistika yang digunakan adalah Analisis Ragam Satu Arah (One Way ANOVA).

2 TINJAUAN PUSTAKA

2.1 Statistika

Statistika adalah ilmu yang mempelajari tentang metode mengumpulkan, mengorganisir, dan menganalisis segala bentuk informasi atau data hingga menjadi suatu kesimpulan untuk mengambil keputusan prediksi atau ramalan. Secara garis besar Statistika dapat dibedakan menjadi dua jenis yakni statistika deskriptif dan statistika inferensial.

2.2 Statistika Deskriptif

Statistika deskriptif merupakan metode pengumpulan, pengolahan, dan penyajian data untuk menghasilkan informasi atau gambaran menyeluruh yang bermanfaat. Statistika deskriptif hanya berfokus pada pengolahan dan penyajian data tanpa mengambil keputusan mengenai populasi. Bidang ini hanya memberikan gambaran umum dari data yang diperoleh (Walpole, 1997). Statistika deskriptif biasanya digambarkan melalui ukuran penyebaran data, ukuran pemusatan data, grafik, diagram, histogram, dan lain-lain.

2.3 Analisis Ragam (ANOVA) One- Way

Metode ANOVA, yang merupakan singkatan dari Analysis of Variance, ditemukan dan diperkenalkan oleh seorang ahli statistik bernama Ronald Fisher pada tahun 1925. ANOVA dirancang untuk memisahkan variansi menjadi dua komponen yaitu, variansi antar kelompok dan variansi dalam kelompok. Tujuannya adalah untuk membandingkan variansi ini guna menganalisis adanya perbedaan rata-rata antar kelompok

2.3.1 Hipotesis

Hipotesis nol (\(H_0\)) dan hipotesis alternatif (\(H_a\)) dinyatakan sebagai berikut.

\(H_0\): \(\mu_1\) = \(\mu_2\) = \(\mu_3\) = \(\cdots\) = \(\mu_k\) = 0

\(H_1\): Paling sedikit terdapat satu pasang kelompok i dan i’ yang tidak sama ( \(\mu_i\) \(\neq\) \(\mu_i'\))

Di mana: \(\mu_k\) adalah rata-rata populasi dari kelompok ke-k.

2.3.2 Kriteria Penolakan

Keputusan Kriteria penolakan dalam ANOVA didasarkan pada perbandingan nilai statistik \(F\) dengan titik kritis \(F\) dari tabel distribusi \(F\) pada tingkat signifikansi (\(\alpha\)) tertentu.

  • Jika \(F_{hitung} \geq F_{tabel}\), maka tolak \(H_0\).
  • Jika \(F_{hitung} < F_{tabel}\), maka gagal untuk menolak \(H_0\).

Dalam bentuk lain, keputusan ini juga dapat diambil berdasarkan nilai \(p\) :

  • Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).
  • Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).

Keterangan :

  • \(F_{hitung}\) adalah nilai \(F\) yang diperoleh dari perhitungan ANOVA.
  • \(F_{tabel}\) adalah nilai kritis \(F\) dari tabel distribusi \(F\) berdasarkan derajat kebebasan \(DB_{kelompok}\) dan \(DB_{galat}\).
  • \(P\)-value adalah probabilitas mendapatkan nilai \(F\) yang sama atau lebih ekstrem jika \(H_0\) benar.
  • \(\alpha\) adalah tingkat signifikansi yang ditetapkan (umumnya 0.05).

2.3.3 Rumus

Dengan rumus sebagai berikut :

\[F_{hitung} = \frac{KT_{kelompok}}{KT_{galat}}\]

Di mana:

\(JK_{kelompok} = \sum_{i=1}^{k} n_i (\bar{X}_i - \bar{X})^2\)

\(JK_{total} = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (X_{ij} - \bar{X}_i)^2\)

\(JK_{galat} = JK_{total} - JK_{kelompok}\)

\(DB_{kelompok} = k - 1\)

\(DB_{total} = N - 1\)

\(DB_{galat} = (N - 1)-(k-1)\)

\(KT_{kelompok} = \frac{JK_{kelompok}}{DB_{kelompok}}\)

\(KT_{galat} = \frac{JK_{galat}}{DB_{galat}}\)

Keterangan :

  • \(k\) adalah jumlah kelompok
  • \(n_i\) adalah ukuran sampel dari kelompok ke-i
  • \(\bar{X}_i\) adalah rata-rata kelompok ke-i
  • \(\bar{X}\) adalah rata-rata total
  • \(N\) adalah total jumlah sampel.
  • \(JK_{kelompok}\) adalah Jumlah Kuadrat Antar Kelompok
  • \(JK_{total}\) adalah Jumlah Kuadrat seluruh data amatan
  • \(JK_{galat}\) adalah Jumlah Kuadrat sisa / galat
  • \(DB_{kelompok}\) adalah Derajat Bebas Antar Kelompok
  • \(DB_{total}\) adalah Derajat Bebas seluruh data amatan
  • \(DB_{galat}\) adalah Derajat Bebas sisa / galat
  • \(KT_{kelompok}\) adalah Kuadrat Tengah atau Rata-rata kuadrat Antar Kelompok
  • \(KT_{galat}\) adalah Kuadrat Tengah atau Rata-rata kuadrat sisa / galat

2.4 Asumsi Analisis ragam (ANOVA)

2.4.1 Asumsi Normalitas Galat

Uji Normalitas merupakan pengujian yang digunakan untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak dengan cara uji normalitas pada galat. Untuk melakukan uji normalitas ini dapat menggunakan uji Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.

Hipotesis:

\(H_0~ : \text{Pengamatan berdistribusi normal}\)

\(H_1~ : \text{Pengamatan tidak berdistribusi normal}\)

Kriteria :

  • Apabila P-Value \(>\) α, maka keputusan H0 diterima. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal
  • Apabila P-Value \(\leq\) α, maka keputusan H0 ditolak. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal

2.4.2 Asumsi Homogenitas Ragam

Uji homogenitas adalah pengujian yang dilakukan untuk mengetahui sama tidaknya variansi dua buah distribusi atau lebih. Dalam buku yang ditulis Sudjana (2005), uji homogenitas dapat dilakukan dengan uji levene, fisher atau uji bartlett.

Hipotesis:

\(H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2\)

\(H_1: \text{Setidaknya ada dua varians yang berbeda}\)

Kriteria :

  • Apabila P-Value \(>\) α, maka keputusan H0 diterima. Disimpulkan bahwa data mempunyai ragam galat yang homogen
  • Apabila P-Value \(\leq\) α, maka keputusan H0 ditolak. Disimpulkan bahwa data mempunyai ragam galat yang tidak homogen

2.4.3 Asumsi Independensi

Hipotesis:

\(H_0~ : \text{Data antar perlakuan bersifat independen}\) \(H_1~ : \text{Data antar perlakuan tidak bersifat independen}\)

Kriteria :

  • Apabila P-Value \(>\) α, maka keputusan H0 diterima. Disimpulkan bahwa data antar perlakuan bersifat independen
  • Apabila P-Value \(\leq\) α, maka keputusan H0 ditolak. Disimpulkan bahwa data antar perlakuan tidak bersifat independen

3 SOURCE CODE

3.1 Library

library(dplyr)
library(tidyr)
library(AOV1R)
library(tseries)
library(car)
library(readxl)

3.2 Data

data = read_excel("~/SEMESTER 4/KOMSTAT/PRAKTIKUM/Jumlah Kepala Keluarga (KK) Menurut Kecamatan di Kota Malang Tahun 2023.xlsx")
head(data)
## # A tibble: 6 × 5
##   `Kedung Kandang` Sukun Klojen Belimbing Lawokwaru
##              <dbl> <dbl>  <dbl>     <dbl>     <dbl>
## 1             3828  3421   4306      4011      5503
## 2             2354  6743   2965      6237      3739
## 3             2611  4507   2080      3932      2701
## 4             6593  6440   3021      8832      1682
## 5             5292 10366   5016      9360      6338
## 6             6110  3415   2773     10871      6469

3.3 Statistika Deskriptif

3.3.1 Ringkasan 5 Angka

summary(data)
##  Kedung Kandang     Sukun           Klojen       Belimbing       Lawokwaru   
##  Min.   :2354   Min.   : 3415   Min.   :1976   Min.   : 2911   Min.   :1682  
##  1st Qu.:3878   1st Qu.: 4702   1st Qu.:2426   1st Qu.: 3666   1st Qu.:2868  
##  Median :6110   Median : 5760   Median :3021   Median : 4055   Median :5503  
##  Mean   :5789   Mean   : 6120   Mean   :3141   Mean   : 5740   Mean   :4603  
##  3rd Qu.:7104   3rd Qu.: 6650   3rd Qu.:3576   3rd Qu.: 7678   3rd Qu.:5992  
##  Max.   :9801   Max.   :10366   Max.   :5016   Max.   :10871   Max.   :7378

3.3.2 Histogram Kecamatan Kedung Kandang

hist(data$`Kedung Kandang`, main = 'Histogram Kecamatan Kedung Kandang', ylab = 'Frekuensi', xlab ='Jumlah KK')

3.3.3 Histogram Kecamatan Sukun

hist(data$Sukun, main = 'Histogram Kecamatan Sukun', ylab = 'Frekuensi', xlab ='Jumlah KK')

3.3.4 Histogram Kecamatan Klojen

hist(data$Klojen, main = 'Histogram Kecamatan Klojen', ylab = 'Frekuensi', xlab ='Jumlah KK')

3.3.5 Histogram Kecamatan Belimbing

hist(data$Belimbing, main = 'Histogram Kecamatan Belimbing', ylab = 'Frekuensi', xlab ='Jumlah KK')

3.3.6 Histogram Kecamatan Lawokwaru

hist(data$Lawokwaru, main = 'Histogram Kecamatan Lawokwaru', ylab = 'Frekuensi', xlab ='Jumlah KK')

3.4 Menghitung ANOVA dengan Function

3.4.1 Membuat data frame dengan nama kolom “Kecamatan” dan “Jumlah KK”

data_aov = data %>%
  pivot_longer(c(`Kedung Kandang`, Sukun, Klojen, Belimbing, Lawokwaru), names_to="Kecamatan", values_to="Jumlah_KK")
names(data_aov) = c("Kecamatan", "Jumlah_KK")
data_aov$Kecamatan = as.factor(data_aov$Kecamatan)
data_aov$Jumlah_KK = as.numeric(data_aov$Jumlah_KK)
data_aov
## # A tibble: 55 × 2
##    Kecamatan      Jumlah_KK
##    <fct>              <dbl>
##  1 Kedung Kandang      3828
##  2 Sukun               3421
##  3 Klojen              4306
##  4 Belimbing           4011
##  5 Lawokwaru           5503
##  6 Kedung Kandang      2354
##  7 Sukun               6743
##  8 Klojen              2965
##  9 Belimbing           6237
## 10 Lawokwaru           3739
## # ℹ 45 more rows

3.4.2 Menampilkan Hasil ANOVA

Hasil_ANOVA = aov(Jumlah_KK ~ Kecamatan, data=data_aov)
Hasil_ANOVA
## Call:
##    aov(formula = Jumlah_KK ~ Kecamatan, data = data_aov)
## 
## Terms:
##                 Kecamatan Residuals
## Sum of Squares   66087795 235584853
## Deg. of Freedom         4        50
## 
## Residual standard error: 2170.644
## Estimated effects may be unbalanced
summary(Hasil_ANOVA)
##             Df    Sum Sq  Mean Sq F value Pr(>F)  
## Kecamatan    4  66087795 16521949   3.507 0.0134 *
## Residuals   50 235584853  4711697                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

3.5 Perhitungan Manual

3.5.1 Jumlah Kuadrat Total

JKT = (sum((data_aov$Jumlah_KK - mean(data_aov$Jumlah_KK))^2))
JKT
## [1] 301672648

3.5.2 Jumlah Kuadrat Kelompok

#Rata-rata setiap kelompok
rata2kelompok = tapply(data_aov$Jumlah_KK, data_aov$Kecamatan, mean)
rata2kelompok
##      Belimbing Kedung Kandang         Klojen      Lawokwaru          Sukun 
##       5740.182       5789.455       3140.909       4603.000       6119.818
JKK = sum(sapply(levels(data_aov$Kecamatan), function(k) {
  n_k <- sum(data_aov$Kecamatan == k)  
  (n_k * (rata2kelompok[k] - mean(data_aov$Jumlah_KK))^2)}))
JKK
## [1] 66087795

3.5.3 Jumlah Kuadrat Galat

JKG = JKT - JKK
JKG
## [1] 235584853

3.5.4 Kuadrat Tengah Kelompok

DB_kelompok = length(data)-1
KTK = JKK/DB_kelompok
KTK
## [1] 16521949

3.5.5 Kuadrat Tengah Galat

DB_total = length(data_aov$Jumlah_KK)-1
DB_galat = DB_total - DB_kelompok
KTG = JKG/DB_galat
KTG
## [1] 4711697

3.5.6 F hitung

F_hitung = KTK/KTG
F_hitung
## [1] 3.506581

3.5.7 P-value

Pvalue = 1 - pf(F_hitung, 4, 50)
Pvalue
## [1] 0.01338582

3.6 Tabel ANOVA

Sumber keragaman DB JK KT F hitung P-value
Kelompok (Kecamatan) 4 66087795 16521949 3.506581 0.01338582
Galat 50 235584853 4711697
Total 54 301672648

3.7 Mendapatkan Residu dari ANOVA

residu<- residuals(Hasil_ANOVA)
residu
##           1           2           3           4           5           6 
## -1961.45455 -2698.81818  1165.09091 -1729.18182   900.00000 -3435.45455 
##           7           8           9          10          11          12 
##   623.18182  -175.90909   496.81818  -864.00000 -3178.45455 -1612.81818 
##          13          14          15          16          17          18 
## -1060.90909 -1808.18182 -1902.00000   803.54545   320.18182  -119.90909 
##          19          20          21          22          23          24 
##  3091.81818 -2921.00000  -497.45455  4246.18182  1875.09091  3619.81818 
##          25          26          27          28          29          30 
##  1735.00000   320.54545 -2704.81818  -367.90909  5130.81818  1866.00000 
##          31          32          33          34          35          36 
##  4011.54545  -551.81818   429.09091 -2829.18182   935.00000 -1862.45455 
##          37          38          39          40          41          42 
##  -359.81818 -1164.90909   783.81818  2775.00000  3169.54545  3525.18182 
##          43          44          45          46          47          48 
## -1117.90909 -1685.18182  1044.00000  1557.54545 -1222.81818   440.09091 
##          49          50          51          52          53          54 
## -2340.18182 -2001.00000  1072.54545   436.18182    98.09091 -2731.18182 
##          55 
## -1567.00000

3.8 Uji Asumsi ANOVA

3.8.1 Asumsi Normalitas Galat

jarque.bera.test(data_aov$Jumlah_KK)
## 
##  Jarque Bera Test
## 
## data:  data_aov$Jumlah_KK
## X-squared = 4.8839, df = 2, p-value = 0.08699

3.8.2 Asumsi Homogenitas Ragam

homogenitas <- leveneTest(Hasil_ANOVA)
homogenitas
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4   1.517 0.2115
##       50

3.8.3 Asumsi Independensi

independensi <- durbinWatsonTest(Hasil_ANOVA)
independensi
##  lag Autocorrelation D-W Statistic p-value
##    1       0.2073173      1.558612   0.144
##  Alternative hypothesis: rho != 0

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

##  Kedung Kandang     Sukun           Klojen       Belimbing       Lawokwaru   
##  Min.   :2354   Min.   : 3415   Min.   :1976   Min.   : 2911   Min.   :1682  
##  1st Qu.:3878   1st Qu.: 4702   1st Qu.:2426   1st Qu.: 3666   1st Qu.:2868  
##  Median :6110   Median : 5760   Median :3021   Median : 4055   Median :5503  
##  Mean   :5789   Mean   : 6120   Mean   :3141   Mean   : 5740   Mean   :4603  
##  3rd Qu.:7104   3rd Qu.: 6650   3rd Qu.:3576   3rd Qu.: 7678   3rd Qu.:5992  
##  Max.   :9801   Max.   :10366   Max.   :5016   Max.   :10871   Max.   :7378

Dilihat dari histogram dan ringkasan 5 angka yang ada,

  • Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Kedung Kandang sebesar 9801, dengan rata-rata 5789 kartu keluarga.
  • Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Sukun sebesar 10366, dengan rata-rata 6120 kartu keluarga.
  • Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Klojen sebesar 5016, dengan rata-rata 3141 kartu keluarga.
  • Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Belimbing sebesar 10871, dengan rata-rata 5740 kartu keluarga.
  • Dapat dinyatakan bahwa Jumlah Kartu Keluarga paling banyak di Kecamatan Lawokwaru sebesar 7378, dengan rata-rata 4603 kartu keluarga.

4.2 Hasil ANOVA One-Way

##             Df    Sum Sq  Mean Sq F value Pr(>F)  
## Kecamatan    4  66087795 16521949   3.507 0.0134 *
## Residuals   50 235584853  4711697                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Pada studi kasus ini, ingin dilakukan pengujian apakah ada perbedaan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023. Dari Hasil ANOVA didapatkan \(F_{hitung}\) sebesar 3.507 dan \(P-value\) sebesar 0.0134.

  • Karena \(P-value\) (0.0134) \(< alpha\) (0.05) dengan menggunakan taraf nyata 5%, maka didapatkan keputusan tolak \(H_0\).

Yang artinya, terdapat perbedaan signifikan antara perbedaan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023.

4.3 Asumsi Normalitas Galat

## 
##  Jarque Bera Test
## 
## data:  data_aov$Jumlah_KK
## X-squared = 4.8839, df = 2, p-value = 0.08699

Berdasarkan hasil uji Jarque Bera, diperoleh \(P-value\) sebesar 0.08699.

  • Karena \(P-value\) (0.08699) \(> alpha\) (0.05), maka didapatkan keputusan terima \(H_0\)

yang artinya pengamatan menyebar normal.

4.4 Asumsi Homogenitas Ragam

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4   1.517 0.2115
##       50

Ragam Berdasarkan hasil uji Levene, diperoleh \(P-value\) sebesar 0.2115.

  • Karena \(P-value\) (0.2115) \(> alpha\) (0.05), maka didapatkan keputusan terima \(H_0\)

yang artinya data mempunyai ragam galat yang homogen. Sehingga dapat disimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.

4.5 Asumsi Independensi

##  lag Autocorrelation D-W Statistic p-value
##    1       0.2073173      1.558612   0.164
##  Alternative hypothesis: rho != 0

Berdasarkan hasil uji Durbin Watson, diperoleh \(P-value\) sebesar 0.17

  • Karena \(P-value\) (0.17) \(> alpha\) (0.05) maka didapatkan keputusan terima \(H_0\)

yang artinya data antar perlakuan bersifat independen.

5 KESIMPULAN

Berdasarkan hasil uji ANOVA, hasil menunjukkan bahwa terdapat perbedaan signifikan rata-rata jumlah Kepala Keluarga (KK) menurut kecamatan di Kota Malang tahun 2023. Selain itu, semua asumsi yang diperlukan dalam penggunaan metode ANOVA sudah terpenuhi.

6 DAFTAR PUSTAKA