Ini adalah beberapa library yang digunakan untuk membuat Visualisasi data.
library(ggplot2) #ggplot2: Untuk visualisasi data
## Warning: package 'ggplot2' was built under R version 4.4.2
library(readxl) #readxl: Untuk membaca file Excel
## Warning: package 'readxl' was built under R version 4.4.2
Dataset ini didapat dari website Statistik Sektoral Kabupaten Hulu Sungai Selatan. Data ini berisi informasi jumlah murid dan guru di berbagai satuan pendidikan tingkat SMP di Kabupaten Hulu Sungai Selatan, Provinsi Kalimantan Selatan. Data ini akan dianalisis untuk memahami distribusi jumlah murid dan guru, serta hubungan antara keduanya dalam konteks rasio murid per guru.
Beberapa statistik deskriptif awal menunjukkan variasi yang cukup signifikan dalam jumlah murid dan guru antar sekolah. Oleh karena itu, diperlukan visualisasi lebih lanjut untuk memahami pola distribusinya.
setwd("C:/Users/ain/OneDrive/Desktop/STATISTIKA/file buat r")
data <- read_excel("2023_rasio-murid_guru-smp.xlsx")
## New names:
## • `` -> `...6`
head(data)
## # A tibble: 6 × 6
## `Nama Satuan Pendidikan` Kecamatan Murid Guru Rasio ...6
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 SMP NEGERI 1 ANGKINANG Angkinang 58 15 3.87 1
## 2 SMP NEGERI 2 ANGKINANG Angkinang 206 20 10.3 1
## 3 SMP BAJAYAU LESTARI Daha Barat 49 10 4.9 1
## 4 SMP NEGERI 1 DAHA BARAT Daha Barat 165 12 13.8 1
## 5 SMP NEGERI 1 DAHA SELATAN Daha Selatan 233 18 12.9 1
## 6 SMP NEGERI 3 DAHA SELATAN Daha Selatan 55 11 5 1
Data diambil dari file Excel menggunakan
read_excel("2023_rasio-murid_guru-smp.xlsx")
Visualisasi ini menunjukkan jumlah sekolah yang tersebar di setiap kecamatan. Kecamatan dengan jumlah sekolah terbanyak dapat diidentifikasi dengan mudah melalui tinggi batang pada Bar Chart.
ggplot(data, aes(x = Kecamatan)) +
geom_bar(fill = "darkorange", color = "black") +
theme_minimal() +
labs(title = "Jumlah Sekolah per Kecamatan",
x = "Kecamatan",
y = "Jumlah Sekolah") +
theme(axis.text.x = element_text(size = 8, angle = 45, hjust = 1))
Dari grafik Bar Chart ini, terlihat bahwa jumlah sekolah di tiap kecamatan bervariasi. Kecamatan dengan jumlah sekolah terbanyak adalah Kecamatan Kandangan, sedangkan kecamatan dengan jumlah sekolah paling sedikit adalah Kecamatan Kalumpang.
Kecamatan dengan jumlah sekolah lebih banyak cenderung memiliki populasi lebih besar atau wilayah lebih luas dibandingkan kecamatan lainnya.
Boxplot digunakan untuk melihat distribusi jumlah murid di tiap kecamatan. Visualisasi ini membantu mengidentifikasi kecamatan dengan jumlah murid yang lebih banyak atau lebih sedikit dibandingkan rata-rata.
ggplot(data, aes(x = Kecamatan, y = Murid)) +
geom_boxplot(fill = "darkorange", color = "black") +
theme_minimal() +
labs(title = "Distribusi Jumlah Murid per Kecamatan",
x = "Kecamatan",
y = "Jumlah Murid") +
theme(axis.text.x = element_text(size = 8, angle = 45, hjust = 1))
Boxplot menunjukkan bagaimana distribusi jumlah murid di tiap kecamatan. Beberapa kecamatan memiliki outlier, yang menunjukkan adanya sekolah dengan jumlah murid yang jauh lebih banyak atau sedikit dibanding sekolah lain di kecamatan yang sama.
Variasi jumlah murid antar kecamatan cukup besar, yang mungkin dipengaruhi oleh jumlah sekolah atau kapasitas sekolah di kecamatan tersebut.
Histogram ini menggambarkan distribusi jumlah guru di seluruh sekolah. Mayoritas sekolah memiliki jumlah guru dalam kisaran tertentu, tetapi ada beberapa sekolah dengan jumlah guru sangat sedikit atau sangat banyak.
ggplot(data, aes(x = Guru)) +
geom_histogram(binwidth = 5, fill = "darkorange", color = "black", alpha = 0.7) +
theme_minimal() +
labs(title = "Distribusi Jumlah Guru di Semua Sekolah",
x = "Jumlah Guru",
y = "Frekuensi")
Histogram menunjukkan distribusi jumlah guru di semua sekolah. Mayoritas sekolah memiliki jumlah guru dalam rentang 10-15 Guru, sedangkan hanya sedikit sekolah yang memiliki lebih dari 15 guru.
Scatter plot digunakan untuk melihat hubungan antara jumlah murid dan jumlah guru di setiap sekolah. Secara umum, semakin banyak murid, semakin banyak guru yang diperlukan.
ggplot(data, aes(x = Murid, y = Guru, color = Kecamatan)) +
geom_point(size = 2, alpha = 0.7) +
theme_minimal() +
labs(title = "Hubungan Jumlah Murid dan Guru per Sekolah",
x = "Jumlah Murid",
y = "Jumlah Guru") +
theme(legend.position = "bottom")
Sebagian besar sekolah memiliki jumlah guru yang cukup proporsional dengan jumlah murid, tetapi ada beberapa sekolah yang mengalami kekurangan guru dibandingkan dengan jumlah muridnya.
Density plot ini menggambarkan distribusi rasio murid per guru. Sebagian besar sekolah memiliki rasio dalam rentang yang ideal, tetapi ada beberapa sekolah dengan rasio sangat tinggi, yang berarti lebih banyak murid dibandingkan jumlah guru yang tersedia.
ggplot(data, aes(x = Rasio)) +
geom_density(fill = "darkorange", alpha = 0.5) +
theme_minimal() +
labs(title = "Sebaran Rasio Murid per Guru",
x = "Rasio Murid per Guru",
y = "Kepadatan")
Jika ada satu puncak besar, berarti sebagian besar sekolah memiliki rasio murid-guru yang serupa.
Jika distribusi memiliki beberapa puncak, berarti ada beberapa kelompok sekolah dengan rasio yang berbeda-beda.
Mayoritas sekolah memiliki rasio murid-guru yang mirip, tetapi ada beberapa kelompok sekolah yang memiliki perbedaan signifikan dalam distribusi rasio ini.
Chunk berikut menghitung berbagai ukuran statistik deskriptif dari rasio murid-guru di setiap sekolah, termasuk mean (rata-rata), median, modus, kuartil, varians, dan standar deviasi.
mean_rasio <- mean(data$Rasio, na.rm = TRUE)
median_rasio <- median(data$Rasio, na.rm = TRUE)
modus_rasio <- names(sort(table(data$Rasio), decreasing = TRUE))[1]
q1_rasio <- quantile(data$Rasio, 0.25, na.rm = TRUE)
q3_rasio <- quantile(data$Rasio, 0.75, na.rm = TRUE)
range_rasio <- range(data$Rasio, na.rm = TRUE)
var_rasio <- var(data$Rasio, na.rm = TRUE)
sd_rasio <- sd(data$Rasio, na.rm = TRUE)
summary_statistik <- data.frame(
Statistik = c("Mean", "Median", "Modus", "Q1", "Q3", "Range", "Varians", "Standard Deviation"),
Nilai = c(mean_rasio, median_rasio, modus_rasio, q1_rasio, q3_rasio, diff(range_rasio), var_rasio, sd_rasio)
)
print(summary_statistik)
## Statistik Nilai
## 1 Mean 10.1114003099011
## 2 Median 5.91666666666667
## 3 Modus 4
## 4 Q1 4
## 5 Q3 11.6315789473684
## 6 Range 35.3076923076923
## 7 Varians 93.094488596418
## 8 Standard Deviation 9.64854852277886
Perhitungan ini menunjukkan adanya variasi yang cukup signifikan dalam jumlah murid dan guru antar sekolah. Beberapa sekolah memiliki jumlah murid dan guru yang jauh di atas atau di bawah rata-rata, yang terlihat dari standar deviasi yang cukup besar. Ini menunjukkan bahwa distribusi sumber daya tenaga pengajar mungkin tidak merata, sehingga dapat mempengaruhi rasio murid per guru di berbagai sekolah.
Berdasarkan analisis data rasio murid-guru di berbagai sekolah dalam dataset, dapat disimpulkan bahwa distribusi guru di setiap kecamatan masih belum merata. Beberapa temuan utama dari hasil statistik dan visualisasi yang telah dibuat adalah sebagai berikut:
Variasi Rasio Murid-Guru
Ketimpangan Jumlah Sekolah Antar Kecamatan
Hubungan Jumlah Murid dan Guru
Distribusi Rasio Murid-Guru di Tiap Kecamatan
Sebaran Rasio Murid-Guru