LATIHAN WEEK 11 BINTEL

Impor Data

Data ini merupakan kepadatan penduduk dari kelurahan di wiliayah DKI Jakarta pada tahun 2023

#impor data
library(readr)
data <- read_delim("C:/Users/Dewi Wuri/Downloads/dkikepadatankelurahan2013.csv", 
                   delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 267 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (4): NAMA PROVINSI, NAMA KABUPATEN/KOTA, NAMA KECAMATAN, NAMA KELURAHAN
## dbl (3): TAHUN, LUAS WILAYAH (KM2), KEPADATAN (JIWA/KM2)
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Mengubah nama variabel

Pengubahan nama bertujuan untuk mempermudah dalam proses pengolahan data selanjutnya

#ubah nama
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
data <- data %>%
  rename(
    Tahun      = TAHUN,
    Prov       = `NAMA PROVINSI`,
    Kab        = `NAMA KABUPATEN/KOTA`,
    Kec        = `NAMA KECAMATAN`,
    Kel        = `NAMA KELURAHAN`,
    Luas       = `LUAS WILAYAH (KM2)`,
    Kepadatan  = `KEPADATAN (JIWA/KM2)`
  )
data
## # A tibble: 267 × 7
##    Tahun Prov                 Kab                Kec       Kel    Luas Kepadatan
##    <dbl> <chr>                <chr>              <chr>     <chr> <dbl>     <dbl>
##  1  2013 PROVINSI DKI JAKARTA KAB.ADM.KEP.SERIBU KEP. SER… P. P…  0.91      6779
##  2  2013 PROVINSI DKI JAKARTA KAB.ADM.KEP.SERIBU KEP. SER… P. K…  3.76      1705
##  3  2013 PROVINSI DKI JAKARTA KAB.ADM.KEP.SERIBU KEP. SER… P. H…  3.59       628
##  4  2013 PROVINSI DKI JAKARTA KAB.ADM.KEP.SERIBU KEP. SER… P. U…  0.59      3625
##  5  2013 PROVINSI DKI JAKARTA KAB.ADM.KEP.SERIBU KEP. SER… P. T…  1.57      3084
##  6  2013 PROVINSI DKI JAKARTA KAB.ADM.KEP.SERIBU KEP. SER… P. P…  1.39      1968
##  7  2013 PROVINSI DKI JAKARTA JAKARTA PUSAT      GAMBIR    GAMB…  2.58      1350
##  8  2013 PROVINSI DKI JAKARTA JAKARTA PUSAT      GAMBIR    CIDE…  1.26     14584
##  9  2013 PROVINSI DKI JAKARTA JAKARTA PUSAT      GAMBIR    PETO…  1.12     18987
## 10  2013 PROVINSI DKI JAKARTA JAKARTA PUSAT      GAMBIR    PETO…  1.14     14465
## # ℹ 257 more rows

Membuat plot luas wilayah vs kepadatan penduduk

Visualisasi in bertujuan untuk melihat hubungan antara luas wilayah dan kepadatan penduduk

#plot luas vs kepadatan dengan geom_poin
library(ggplot2)
ggplot(data=data)+
  geom_point(mapping = aes(x=Kepadatan, y=Luas, colour=Kab))+
  labs(title = "Hubungan antara Kepadatan dan Luas berdasarkan Kabupaten",
       x="Kepadatan Penduduk",
       y="Luas Wilayah")

Interpretasi: Scatter plot menunjukkan adanya hubungan negatif antara kepadatan penduduk dan luas wilayah. Semakin tinggi kepadatan penduduk, semakin kecil luas wilayah yang dimiliki. Wilayah dengan kepadatan sangat tinggi cenderung memiliki luas wilayah rendah, sedangkan wilayah yang lebih luas umumnya memiliki kepadatan penduduk yang lebih rendah.

Melakukan visualisasi provinsi, kabupaten, dan kecamatan menggunakan bar plot

#plot prov, kab, kec dengan geom_bar
ggplot(data=data)+
  geom_bar(mapping = aes(x=Prov, fill=Kab))

Interpretasi: Grafik batang bertumpuk menunjukkan bahwa data di DKI Jakarta tersebar pada enam wilayah administrasi. Jumlah data terbesar berasal dari Jakarta Timur dan Jakarta Selatan, diikuti Jakarta Barat, sedangkan jumlah paling sedikit terdapat pada Kepulauan Seribu. Ini menunjukkan distribusi data antarwilayah tidak merata, dengan konsentrasi lebih tinggi di wilayah kota utama dibanding wilayah kepulauan.

ggplot(data=data)+
  geom_bar(mapping = aes(x=Kab, fill=Kab))

Interpretasi: Grafik menunjukkan bahwa jumlah data tertinggi terdapat di Jakarta Selatan dan Jakarta Timur, sedangkan jumlah data terendah berada di Kepulauan Seribu. Sementara itu, Jakarta Barat, Jakarta Pusat, dan Jakarta Utara memiliki jumlah data yang relatif lebih rendah, sehingga terlihat bahwa sebaran data antarwilayah di DKI Jakarta belum merata.

ggplot(data=data)+
  geom_bar(mapping = aes(x=Kec, fill=Kec))

Interpretasi: Grafik menunjukkan bahwa jumlah data pada tingkat kecamatan di DKI Jakarta cenderung bervariasi, namun sebagian besar kecamatan memiliki jumlah data yang relatif serupa. Beberapa kecamatan memiliki jumlah data lebih tinggi, sementara sebagian lainnya lebih rendah, sehingga menunjukkan distribusi data antar kecamatan cukup tersebar dan tidak sepenuhnya merata.

Visualisasi kepadatan penduduk vs kabupaten dengan menggunakan boxplot

#plot kepadatan vs kab dengan geom_boxplot
ggplot(data=data)+
  geom_boxplot(mapping = aes(x=Kab, y=Kepadatan, fill=Kab))

Interpretasi: Berdasarkan grafik tersebut, Jakarta Pusat dan Jakarta Barat menonjol sebagai wilayah paling sesak dengan nilai tengah kepadatan tertinggi, disusul Jakarta Timur dan Jakarta Utara yang menunjukkan sebaran data cukup luas. Meskipun Jakarta Selatan memiliki kepadatan yang cenderung lebih rendah dan stabil, terdapat ketimpangan ekstrem di wilayah Barat, Pusat, dan Timur yang ditandai dengan munculnya pencilan (outlier) sangat tinggi di kelurahan tertentu. Sebaliknya, Kabupaten Kepulauan Seribu menjadi wilayah dengan kepadatan paling rendah dan paling merata dibandingkan seluruh kota administrasi lainnya.