Pendahuluan

Dokumen ini berisi analisis data minat baca di Kota Semarang menggunakan berbagai visualisasi dan statistik deskriptif serta inferensial.

Sumber: https://pustakadata.semarangkota.go.id/public/upload/pdf/462-kajian-pengukuran-tingkat-kegemaran-membaca-kota-semarang-tahun-2023.pdf

library(ggplot2) 
library(readxl) 
## Warning: package 'readxl' was built under R version 4.4.3
library(ggthemes) 
library(gridExtra)
setwd("D:/DATA ARIL/RStudio") 
data <- read_excel("Minat_baca_kota_sumerang.xlsx") 
head(data)
## # A tibble: 6 × 8
##   Kecamatan      Frekuensi_membaca Durasi_Membaca Jenis_kelamin  Rate Minat_baca
##   <chr>                      <dbl>          <dbl> <chr>         <dbl>      <dbl>
## 1 Semarang sela…                70             66 Pria            174         70
## 2 Semarang Barat                71             67 Wanita          338         71
## 3 Semarang Timur                71             65 <NA>             NA         71
## 4 Semarang Teng…                64             59 <NA>             NA         64
## 5 Semarang Utara                73             73 <NA>             NA         73
## 6 Ngaliyan                      62             59 <NA>             NA         62
## # ℹ 2 more variables: Kategori <chr>, Interval_nilai_TGM <chr>

Pie Chart

data_clean <- na.omit(data)
pie_chart <- ggplot(data_clean, aes(x = "", y = Rate, fill = Jenis_kelamin)) +
  geom_bar(stat = "identity", width = 1) +
  coord_polar("y", start = 0) +   
  theme_minimal() +     
  labs(title = "Distribusi Berdasarkan Jenis Kelamin", fill = "Jenis Kelamin") +
  theme(axis.text.x = element_blank(), 
        axis.title.x = element_blank(), 
        axis.title.y = element_blank())     
print(pie_chart)

Dalam Pie Chart di atas banyaknya data yang diambil untuk kasus ini adalah wanita dibandingkan laki-laki

Bar Chart

ggplot(data, aes(x = Kecamatan, y = Minat_baca, fill = Kecamatan)) +
  geom_bar(stat = "summary", fun = "mean") +  # Menghitung rata-rata Minat_baca per Kecamatan
  theme(axis.text.x = element_text(angle = 90, hjust = 1, vjust = 0.5)) +  # Rotasi label sumbu x
  labs(title = "Rata-rata Minat Baca per Kecamatan", x = "Kecamatan", y = "Rata-rata Minat Baca")

Pada Bar Chart diatas menunjukkan setiap kecatamatan mempunyai tingkatan/nilai masing-masing, dan yang paling tinggi adalah Mijen dengan nilai 78.

Histogram

Nilai Minat Baca

ggplot(data, aes(x = Durasi_Membaca)) +
  geom_histogram(binwidth = 5, color = "black", fill = "skyblue", alpha = 0.7) +
  labs(title = "Histogram Durasi Membaca", x = "Nilai Durasu Membaca", y = "Frekuensi")

Dalam data diatas, rata-rata durasi membaca (Lamanya membaca) adalah 60 keatas yang dikategorikan tinggi atau sekitar 2-3 Jam

Density Plot

Sebaran Nilai Minat Baca

ggplot(data, aes(x = Frekuensi_membaca)) +
  geom_density(alpha = 0.5, fill = "olivedrab1") +
  labs(title = "Density Plot Frekuensi Membaca", x = "Nilai Frekuensi Membaca", y = "Kepadatan")

Dalam data diatas, banyaknya orang membaca dalam kota serang bersikaran antara 70-75

Boxplot

Perbandingan Minat Baca berdasarkan Kategori

ggplot(data, aes(x = Kategori, y = Minat_baca, fill = Kategori)) +
  geom_boxplot() +
  labs(title = "Boxplot Minat Baca berdasarkan Jenis Kelamin", x = "Jenis Kelamin", y = "Nilai Minat Baca")

Rata-Rata

mean_value <- mean(data$Minat_baca, na.rm = TRUE)
median_value <- median(data$Minat_baca, na.rm = TRUE)
modus_value <- as.numeric(names(sort(table(data$Minat_baca), decreasing = TRUE)[1]))
range_value <- max(data$Minat_baca, na.rm = TRUE) - min(data$Minat_baca, na.rm = TRUE)
sd_value <- sd(data$Minat_baca, na.rm = TRUE)

stats_summary <- data.frame(
  Mean = mean_value,
  Median = median_value,
  Modus = modus_value,
  Range = range_value,
  SD = sd_value
)

stats_summary
##      Mean Median Modus Range      SD
## 1 71.9375     72    70    16 4.46421

Interpretasi Statistik

  1. Pie Chart menunjukkan distribusi rate minat baca dengan warna berbeda berdasarkan jenis kelamin.
  2. Bar Chart menunjukkan bahwa kecamatan tertentu memiliki rata-rata minat baca yang lebih tinggi dibandingkan lainnya.
  3. Histogram menggambarkan distribusi nilai Durasi Membaca, apakah normal atau miring pada durasi membaca (kelamaan membaca).
  4. Density Plot memperlihatkan kepadatan data, memungkinkan analisis distribusi lebih lanjut.
  5. Boxplot menampilkan variasi minat baca antar kategori dan outlier yang mungkin ada.
  6. Statistik Deskriptif memberikan informasi numerik tentang rata-rata, median, modus, range, dacun standar deviasi minat baca.

Kesimpulan

Analisis menunjukkan bahwa kategori minat baca lebih didominasi oleh kelompok tertentu. Rata-rata nilai minat baca di Semarang tinggi (nilai lebih dari 60).