EVD - Data Kategorik
Input Data
Data yang digunakan untuk visualisasi kategorik ini adalah data riil yang bersumber dari Portal Data Pendidikan tentang Jumlah Perpustakaan Menurut Kondisi Tiap Provinsi tingkat SD/MI.
Data ini dipilih karena mudah dipahami dan variabelnya mencakup data numerik dan kategori, sehingga visualisasi data dapat mudah diinterprestasikan. Melalui visualisasi kategorik, distribusi jumlah perpustakaan berdasarkan kondisi di setiap provinsi dapat ditampilkan secara lebih jelas dan informatif.
## Warning: package 'ggplot2' was built under R version 4.4.3
## Warning: package 'readxl' was built under R version 4.4.3
Bar Chart
Bar Chart adalah visualisasi kategorik yang berfungsi untuk membandingkan nilai numerik antar kategori yang berbeda. Pada bagian ini, bar chart digunakan untuk melihat perbandingan jumlah perpustakaan SD/MI berdasarkan status sekolah (Negeri vs Swasta) pada tahun 2024.
library yang digunakan adalah dplyr untuk manipulasi dan
transformasi data dan RColorBrewer untuk memberi palet
warna pada grafik batang yang dibuat. Kemudian data difilter berdasarkan
periode tahun 2024, selanjutnya data dikelompokan berdasarkan Status
Sekolah dan jumlah perpustakaan pada masing-masing kategori
dikumulatifkan.
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(RColorBrewer)
# Filter Data dan Jumlah Seluruh Perpustakaan menurut Status Sekolah
status2024 <- dataset_perpustakaan %>%
filter(Periode == 2024) %>%
group_by(`Status Sekolah`) %>%
summarise(total_perpustakaan = sum(Jumlah, na.rm = TRUE))
status2024## # A tibble: 2 × 2
## `Status Sekolah` total_perpustakaan
## <chr> <dbl>
## 1 Negeri 141997
## 2 Swasta 57044
# Grafik Batang
ggplot(status2024, aes(x = `Status Sekolah`, y = total_perpustakaan, fill = `Status Sekolah`)) +
geom_col() +
labs(title = "Perbandingan Jumlah Perpustakaan SD/MI Berdasarkan Status Sekolah",
subtitle = "Tahun 2024",
x = "Status Sekolah",
y = "Jumlah Perpustakaan") +
scale_fill_brewer(palette = "Paired")## <theme> List of 1
## $ axis.text.x: <ggplot2::element_text>
## ..@ family : NULL
## ..@ face : NULL
## ..@ italic : chr NA
## ..@ fontweight : num NA
## ..@ fontwidth : num NA
## ..@ colour : NULL
## ..@ size : NULL
## ..@ hjust : num 1
## ..@ vjust : num 0.5
## ..@ angle : num 90
## ..@ lineheight : NULL
## ..@ margin : NULL
## ..@ debug : NULL
## ..@ inherit.blank: logi FALSE
## @ complete: logi FALSE
## @ validate: logi TRUE
Grafik batang tersebut menunjukan perbandingan jumlah perpustakaan SD/MI berdasarkan status sekolah (Negeri vs Swasta) pada tahun 2024. Berdasarkan grafik, sekolah negeri memiliki jumlah perpustakaan yang jauh lebih banyak dibandingkan sekolah swasta.
Perbedaan ini mengindikasikan bahwa sekolah negeri relatif lebih mendominasi jumlah perpustakaan. Hal ini kemungkinan dipengaruhi oleh dukungan sarana dan prasarana pemerintah untuk standar sarana prasarana pendidikan sekolah negeri dan sebagai program sekolah dalam pengembangan literasi sekola negeri.
Needle Chart
Needle Chart digunakan untuk menunjukkan posisi nilai metrik saat ini terhadap skala tertentu. Dalam hal ini, kita ingin melihat berapa jumlah perpustakaan berdasarkan kategori yang diamati, yaitu perpustakaan dengan kondisi Baik, Rusak Ringan, Rusak Sedang, dan Rusak Berat.
# Filter Data Periode 2024
data2024 <- dataset_perpustakaan %>%
filter(Periode == 2024)
# Jumlah Berdasarkan Kondisi Perpustakaan
Freq <- colSums(data2024[,c("Baik", "Rusak Ringan",
"Rusak Sedang", "Rusak Berat")])
Freq## Baik Rusak Ringan Rusak Sedang Rusak Berat
## 88445 52032 36808 21756
# Gabungan Tabel Frekuensi dan Kondisi
freqtab <- data.frame(Freq = as.numeric(Freq),
Kondisi = names(Freq))
freqtab## Freq Kondisi
## 1 88445 Baik
## 2 52032 Rusak Ringan
## 3 36808 Rusak Sedang
## 4 21756 Rusak Berat
# Needle Chart
ggplot(data = freqtab,
mapping = aes(x = reorder(Kondisi, Freq), y = Freq)) +
geom_segment(aes(x = reorder(Kondisi, Freq),
xend= reorder(Kondisi, Freq),
y = 0, yend = Freq), color = "purple") +
geom_point(color = "navyblue", size=4, alpha = 0.6) +
geom_text(aes(label = Freq), vjust = -1.00) +
coord_flip() +
labs(title = "Jumlah Perpustakaan SD/MI Berdasarkan Kondisi",
x = "Kondisi Perpustakaan",
y = "Jumlah Perpustakaan")Grafik yang ditampilkan menunjukkan perpustakaan SD/MI berdasarkan kondisi perpustakaan yang terbagi menjadi empat kategori, yaitu Baik, Rusak Ringan, Rusak Sedang, dan Rusak Berat.
Grafik dengan kondisi Baik memiliki jumlah perpustakaan terbanyak, yaitu sekitar 88.445 perpustakaan. Hal ini menunjukkan sebagian besar perpustakaan SD/MI berada dalam kondisi yang baik dan layak untuk menunjang kegiatan literasi dan pembelajaran.
Namun masih terdapat fasilitas perpustakaan dengan kondisi rusak, baik kerusakan ringan hingga berat. Hal ini menunjukkan bahwa meskipun fasilitas perpustakaan sudah cukup baik, tetap diperlukan adanya upaya pemeliharaan dan perbaikan infrastruktur untuk meningkatkan kualitas sarana pendidikan.
Peta Spasial
Peta Spasial merupakan representasi grafis yang memberikan informasi dengan tampilan geografis. Biasanya peta ini memvisualisaikan data geospasial.
Pada bagian ini, kita ingin melihat 10 provinsi mana saja yang
memiliki jumlah perpustakaan terbanyak. Library yang digunakan pada
analisis ini yaitu sf dan dplyr. Library
sf berfungsi untuk membaca format file spasial (.shp).
## Warning: package 'sf' was built under R version 4.4.3
## Linking to GEOS 3.13.0, GDAL 3.10.1, PROJ 9.5.1; sf_use_s2() is TRUE
library(dplyr)
# Import Data Excel
data.spasial <- read_xlsx("C:/Users/HP/OneDrive - untirta.ac.id/Documents/EVD - Data Kategorik/dataset_perpustakaan.xlsx")
# Import Peta .shp
shp.id <- read_sf(file.choose()) # pilih file indonesia.shp
# Periksa data .shp
head(shp.id)## Simple feature collection with 6 features and 3 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: 108.6773 ymin: -10.92262 xmax: 140.9776 ymax: 4.396787
## Geodetic CRS: WGS 84
## # A tibble: 6 × 4
## id name source geometry
## <chr> <chr> <chr> <MULTIPOLYGON [°]>
## 1 IDKU North Kalimantan https://simplemaps.com (((117.7036 4.163415, 117.70…
## 2 IDNT Nusa Tenggara Timur https://simplemaps.com (((124.03 -9.341974, 124.062…
## 3 IDKB Kalimantan Barat https://simplemaps.com (((114.2074 1.439443, 114.20…
## 4 IDPA Papua https://simplemaps.com (((134.8735 -4.254611, 134.8…
## 5 IDJI Jawa Timur https://simplemaps.com (((113.3952 -8.447035, 113.4…
## 6 IDMA Maluku https://simplemaps.com (((128.2312 -8.251235, 128.2…
top10 <- data.spasial %>%
filter(Periode == 2024) %>% # Filter berdasarkkan periode 2024
group_by(Wilayah) %>% # Kelompokkan berdasarkan Wilayah
summarise(total_perpustakaan = sum(Jumlah, na.rm = TRUE)) %>% # Jumlah seluruh perpustakaan
slice_max(total_perpustakaan, n = 10) # Ambil 10 perpustakaan dengan jumlah terbanyak
# Generalisasi variabel Wilayah dengan id
top10 <- top10 %>%
mutate(id = case_when(
Wilayah == "PROV. ACEH" ~ "IDAC",
Wilayah == "PROV. BALI" ~ "IDBA",
Wilayah == "PROV. KEPULAUAN BANGKA BELITUNG" ~ "IDBB",
Wilayah == "PROV. BENGKULU" ~ "IDBE",
Wilayah == "PROV. BANTEN" ~ "IDBT",
Wilayah == "PROV. GORONTALO" ~ "IDGO",
Wilayah == "PROV. JAMBI" ~ "IDJA",
Wilayah == "PROV. JAWA BARAT" ~ "IDJA",
Wilayah == "PROV. JAWA TIMUR" ~ "IDJI",
Wilayah == "PROV. D.K.I. JAKARTA" ~ "IDJK",
Wilayah == "PROV. JAWA TENGAH" ~ "IDJT",
Wilayah == "PROV. KALIMANTAN BARAT" ~ "IDKB",
Wilayah == "PROV. KALIMANTAN TIMUR" ~ "IDKT",
Wilayah == "PROV. KEPULAUAN RIAU" ~ "IDKR",
Wilayah == "PROV. KALIMANTAN SELATAN" ~ "IDKS",
Wilayah == "PROV. KALIMANTAN TENGAH" ~ "IDKT",
Wilayah == "PROV. KALIMANTAN UTARA" ~ "IDKU",
Wilayah == "PROV. LAMPUNG" ~ "IDLA",
Wilayah == "PROV. MALUKU" ~ "IDMA",
Wilayah == "PROV. MALUKU UTARA" ~ "IDMU",
Wilayah == "PROV. NUSA TENGGARA BARAT" ~ "IDNB",
Wilayah == "PROV. NUSA TENGGARA TIMUR" ~ "IDNT",
Wilayah == "PROV. PAPUA" ~ "IDPA",
Wilayah == "PROV. PAPUA BARAT" ~ "IDPB",
Wilayah == "PROV. RIAU" ~ "IDRI",
Wilayah == "PROV. SULAWESI UTARA" ~ "IDSA",
Wilayah == "PROV. SUMATERA BARAT" ~ "IDSB",
Wilayah == "PROV. SULAWESI TENGGARA" ~ "IDSG",
Wilayah == "PROV. SULAWESI SELATAN" ~ "IDSN",
Wilayah == "PROV. SULAWESI BARAT" ~ "IDSR",
Wilayah == "PROV. SUMATERA SELATAN" ~ "IDSS",
Wilayah == "PROV. SULAWESI TENGAH" ~ "IDST",
Wilayah == "PROV. SUMATERA UTARA" ~ "IDSU",
Wilayah == "PROV. D.I. YOGYAKARTA" ~ "IDYO",
TRUE ~ NA_character_
))
top10## # A tibble: 10 × 3
## Wilayah total_perpustakaan id
## <chr> <dbl> <chr>
## 1 PROV. JAWA TIMUR 24797 IDJI
## 2 PROV. JAWA BARAT 24398 IDJA
## 3 PROV. JAWA TENGAH 23461 IDJT
## 4 PROV. SUMATERA UTARA 12341 IDSU
## 5 PROV. SULAWESI SELATAN 9088 IDSN
## 6 PROV. NUSA TENGGARA TIMUR 7631 IDNT
## 7 PROV. LAMPUNG 6603 IDLA
## 8 PROV. SUMATERA SELATAN 6597 IDSS
## 9 PROV. BANTEN 6566 IDBT
## 10 PROV. KALIMANTAN BARAT 5699 IDKB
# Gabungkan Data ke File .shp
join.id <- left_join(shp.id, top10, by = "id")
View(join.id)
DT::datatable(join.id)#Pemetaan
plot.id <- ggplot(data = join.id) +
geom_sf(aes(fill = total_perpustakaan)) +
scale_fill_distiller(palette = "BuPu", na.value = "white") +
labs(fill = "Jumlah Perpustakaan",
title = "10 Provinsi dengan Jumlah Perpustakaan SD/MI Terbanyak",
subtitle = "Tahun 2024") +
theme_minimal()
plot.idPada visualisasi tersebut, warna yang lebih terang menunjukkan jumlah perpustakaan yang lebih tinggi, sedangkan warna yang lebih gelap menunjukkan jumlah yang lebih rendah diantara 10 Provinsi terpilih.
Provinsi dengan jumlah perpustakaan paling terbanyak yaitu Provinsi Jawa Timur dengan jumlah perpustakaan 24.797. Posisi kedua yaitu berada di Provinsi Jawa Barat dengan jumlah 24.398 perpustakaan. Kemudian, provinsi ketiga yaitu Provinsi Jawa Tengah dengan jumlah 23.461.
Berdasarkan hal tersebut, terlihat bahwa Provinsi Jawa mendominasi jumlah perpustakaan yang lebih banyak dibandingkan Provinsi lain. Kondisi ini dapat dipengaruhi karena tingginya jumlah sekolah dasar, kepadatan penduduk, serta infrastruktur pendidikan di wilayah tersebut.
Sementara, Provinsi Sumatera dan Sulawesi yang termasuk dalam sepuluh provinsi dengan jumlah perpustakaan terbanyak, jumlahnya relatif lebih rendah dibandingkan Provinsi Jawa. Hal ini menunjukkan bahwa fasilitas di wilayah tersebut juga cukup berkembang, namun tingkat ketersediaannya belum setinggi di wilayah Pulau Jawa yang memiliki konsentrasi jumlah sekolah dan kepadatan penduduk yang lebih tinggi.