Dokumen ini berisi analisis data minat baca di Kota Semarang menggunakan berbagai visualisasi dan statistik deskriptif serta inferensial.
library(ggplot2)
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
library(ggthemes)
library(gridExtra)
setwd("D:/DATA ARIL/RStudio")
data <- read_excel("Minat_baca_kota_sumerang.xlsx")
head(data)
## # A tibble: 6 × 8
## Kecamatan Frekuensi_membaca Durasi_Membaca Jenis_kelamin Rate Minat_baca
## <chr> <dbl> <dbl> <chr> <dbl> <dbl>
## 1 Semarang sela… 70 66 Pria 174 70
## 2 Semarang Barat 71 67 Wanita 338 71
## 3 Semarang Timur 71 65 <NA> NA 71
## 4 Semarang Teng… 64 59 <NA> NA 64
## 5 Semarang Utara 73 73 <NA> NA 73
## 6 Ngaliyan 62 59 <NA> NA 62
## # ℹ 2 more variables: Kategori <chr>, Interval_nilai_TGM <chr>
data_clean <- na.omit(data)
pie_chart <- ggplot(data_clean, aes(x = "", y = Rate, fill = Jenis_kelamin)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y", start = 0) +
theme_minimal() +
labs(title = "Distribusi Berdasarkan Jenis Kelamin", fill = "Jenis Kelamin") +
theme(axis.text.x = element_blank(),
axis.title.x = element_blank(),
axis.title.y = element_blank())
print(pie_chart)
Dalam Pie Chart di atas banyaknya data yang diambil untuk kasus ini adalah wanita dibandingkan laki-laki
ggplot(data, aes(x = Kecamatan, y = Minat_baca, fill = Kecamatan)) +
geom_bar(stat = "summary", fun = "mean") + # Menghitung rata-rata Minat_baca per Kecamatan
theme(axis.text.x = element_text(angle = 90, hjust = 1, vjust = 0.5)) + # Rotasi label sumbu x
labs(title = "Rata-rata Minat Baca per Kecamatan", x = "Kecamatan", y = "Rata-rata Minat Baca")
Pada Bar Chart diatas menunjukkan setiap kecatamatan mempunyai tingkatan/nilai masing-masing, dan yang paling tinggi adalah Mijen dengan nilai 78.
Nilai Minat Baca
ggplot(data, aes(x = Durasi_Membaca)) +
geom_histogram(binwidth = 5, color = "black", fill = "skyblue", alpha = 0.7) +
labs(title = "Histogram Durasi Membaca", x = "Nilai Durasu Membaca", y = "Frekuensi")
Dalam data diatas, rata-rata durasi membaca (Lamanya membaca) adalah 60 keatas yang dikategorikan tinggi atau sekitar 2-3 Jam
Sebaran Nilai Minat Baca
ggplot(data, aes(x = Frekuensi_membaca)) +
geom_density(alpha = 0.5, fill = "olivedrab1") +
labs(title = "Density Plot Frekuensi Membaca", x = "Nilai Frekuensi Membaca", y = "Kepadatan")
Dalam data diatas, banyaknya orang membaca dalam kota serang bersikaran antara 70-75
Perbandingan Minat Baca berdasarkan Kategori
ggplot(data, aes(x = Kategori, y = Minat_baca, fill = Kategori)) +
geom_boxplot() +
labs(title = "Boxplot Minat Baca berdasarkan Jenis Kelamin", x = "Jenis Kelamin", y = "Nilai Minat Baca")
mean_value <- mean(data$Minat_baca, na.rm = TRUE)
median_value <- median(data$Minat_baca, na.rm = TRUE)
modus_value <- as.numeric(names(sort(table(data$Minat_baca), decreasing = TRUE)[1]))
range_value <- max(data$Minat_baca, na.rm = TRUE) - min(data$Minat_baca, na.rm = TRUE)
sd_value <- sd(data$Minat_baca, na.rm = TRUE)
stats_summary <- data.frame(
Mean = mean_value,
Median = median_value,
Modus = modus_value,
Range = range_value,
SD = sd_value
)
stats_summary
## Mean Median Modus Range SD
## 1 71.9375 72 70 16 4.46421
Analisis menunjukkan bahwa kategori minat baca lebih didominasi oleh kelompok tertentu. Rata-rata nilai minat baca di Semarang tinggi (nilai lebih dari 60).