Visualisasi data Rasio Siswa Guru SMP

Ini adalah beberapa library yang digunakan untuk membuat Visualisasi data.

library(ggplot2)  #ggplot2: Untuk visualisasi data
## Warning: package 'ggplot2' was built under R version 4.4.2
library(readxl)   #readxl: Untuk membaca file Excel
## Warning: package 'readxl' was built under R version 4.4.2

Gambaran Umum Data

Dataset ini didapat dari website Statistik Sektoral Kabupaten Hulu Sungai Selatan. Data ini berisi informasi jumlah murid dan guru di berbagai satuan pendidikan tingkat SMP di Kabupaten Hulu Sungai Selatan, Provinsi Kalimantan Selatan. Data ini akan dianalisis untuk memahami distribusi jumlah murid dan guru, serta hubungan antara keduanya dalam konteks rasio murid per guru.

Beberapa statistik deskriptif awal menunjukkan variasi yang cukup signifikan dalam jumlah murid dan guru antar sekolah. Oleh karena itu, diperlukan visualisasi lebih lanjut untuk memahami pola distribusinya.

setwd("C:/Users/ain/OneDrive/Desktop/STATISTIKA/file buat r")
data <- read_excel("2023_rasio-murid_guru-smp.xlsx")
## New names:
## • `` -> `...6`
head(data)
## # A tibble: 6 × 6
##   `Nama Satuan Pendidikan`  Kecamatan    Murid  Guru Rasio  ...6
##   <chr>                     <chr>        <dbl> <dbl> <dbl> <dbl>
## 1 SMP NEGERI 1 ANGKINANG    Angkinang       58    15  3.87     1
## 2 SMP NEGERI 2 ANGKINANG    Angkinang      206    20 10.3      1
## 3 SMP BAJAYAU LESTARI       Daha Barat      49    10  4.9      1
## 4 SMP NEGERI 1 DAHA BARAT   Daha Barat     165    12 13.8      1
## 5 SMP NEGERI 1 DAHA SELATAN Daha Selatan   233    18 12.9      1
## 6 SMP NEGERI 3 DAHA SELATAN Daha Selatan    55    11  5        1

Data diambil dari file Excel menggunakan read_excel("2023_rasio-murid_guru-smp.xlsx")

Visualisasi Data

1. Bar Chart - Jumlah Sekolah per Kecamatan

Visualisasi ini menunjukkan jumlah sekolah yang tersebar di setiap kecamatan. Kecamatan dengan jumlah sekolah terbanyak dapat diidentifikasi dengan mudah melalui tinggi batang pada Bar Chart.

ggplot(data, aes(x = Kecamatan)) +
  geom_bar(fill = "darkorange", color = "black") +
  theme_minimal() +
  labs(title = "Jumlah Sekolah per Kecamatan",
       x = "Kecamatan",
       y = "Jumlah Sekolah") +
  theme(axis.text.x = element_text(size = 8, angle = 45, hjust = 1))

Dari grafik Bar Chart ini, terlihat bahwa jumlah sekolah di tiap kecamatan bervariasi. Kecamatan dengan jumlah sekolah terbanyak adalah Kecamatan Kandangan, sedangkan kecamatan dengan jumlah sekolah paling sedikit adalah Kecamatan Kalumpang.

Kecamatan dengan jumlah sekolah lebih banyak cenderung memiliki populasi lebih besar atau wilayah lebih luas dibandingkan kecamatan lainnya.

2. Boxplot - Distribusi Jumlah Murid per Kecamatan

Boxplot digunakan untuk melihat distribusi jumlah murid di tiap kecamatan. Visualisasi ini membantu mengidentifikasi kecamatan dengan jumlah murid yang lebih banyak atau lebih sedikit dibandingkan rata-rata.

ggplot(data, aes(x = Kecamatan, y = Murid)) +
  geom_boxplot(fill = "darkorange", color = "black") +
  theme_minimal() +
  labs(title = "Distribusi Jumlah Murid per Kecamatan",
       x = "Kecamatan",
       y = "Jumlah Murid") +
  theme(axis.text.x = element_text(size = 8, angle = 45, hjust = 1))

Boxplot menunjukkan bagaimana distribusi jumlah murid di tiap kecamatan. Beberapa kecamatan memiliki outlier, yang menunjukkan adanya sekolah dengan jumlah murid yang jauh lebih banyak atau sedikit dibanding sekolah lain di kecamatan yang sama.

Variasi jumlah murid antar kecamatan cukup besar, yang mungkin dipengaruhi oleh jumlah sekolah atau kapasitas sekolah di kecamatan tersebut.

3. Histogram - Distribusi Jumlah Guru di Semua Sekolah

Histogram ini menggambarkan distribusi jumlah guru di seluruh sekolah. Mayoritas sekolah memiliki jumlah guru dalam kisaran tertentu, tetapi ada beberapa sekolah dengan jumlah guru sangat sedikit atau sangat banyak.

ggplot(data, aes(x = Guru)) +
  geom_histogram(binwidth = 5, fill = "darkorange", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Distribusi Jumlah Guru di Semua Sekolah",
       x = "Jumlah Guru",
       y = "Frekuensi")

Histogram menunjukkan distribusi jumlah guru di semua sekolah. Mayoritas sekolah memiliki jumlah guru dalam rentang 10-15 Guru, sedangkan hanya sedikit sekolah yang memiliki lebih dari 15 guru.

4. Scatter Plot - Hubungan Jumlah Murid dan Guru per Sekolah

Scatter plot digunakan untuk melihat hubungan antara jumlah murid dan jumlah guru di setiap sekolah. Secara umum, semakin banyak murid, semakin banyak guru yang diperlukan.

ggplot(data, aes(x = Murid, y = Guru, color = Kecamatan)) +
  geom_point(size = 2, alpha = 0.7) +
  theme_minimal() +
  labs(title = "Hubungan Jumlah Murid dan Guru per Sekolah",
       x = "Jumlah Murid",
       y = "Jumlah Guru") +
  theme(legend.position = "bottom")

Sebagian besar sekolah memiliki jumlah guru yang cukup proporsional dengan jumlah murid, tetapi ada beberapa sekolah yang mengalami kekurangan guru dibandingkan dengan jumlah muridnya.

5. Density Plot - Sebaran Rasio Murid per Guru

Density plot ini menggambarkan distribusi rasio murid per guru. Sebagian besar sekolah memiliki rasio dalam rentang yang ideal, tetapi ada beberapa sekolah dengan rasio sangat tinggi, yang berarti lebih banyak murid dibandingkan jumlah guru yang tersedia.

ggplot(data, aes(x = Rasio)) +
  geom_density(fill = "darkorange", alpha = 0.5) +
  theme_minimal() +
  labs(title = "Sebaran Rasio Murid per Guru",
       x = "Rasio Murid per Guru",
       y = "Kepadatan")

  • Jika ada satu puncak besar, berarti sebagian besar sekolah memiliki rasio murid-guru yang serupa.

  • Jika distribusi memiliki beberapa puncak, berarti ada beberapa kelompok sekolah dengan rasio yang berbeda-beda.

Mayoritas sekolah memiliki rasio murid-guru yang mirip, tetapi ada beberapa kelompok sekolah yang memiliki perbedaan signifikan dalam distribusi rasio ini.

Statistik Deskriptif: Data Rasio

Chunk berikut menghitung berbagai ukuran statistik deskriptif dari rasio murid-guru di setiap sekolah, termasuk mean (rata-rata), median, modus, kuartil, varians, dan standar deviasi.

mean_rasio <- mean(data$Rasio, na.rm = TRUE)
median_rasio <- median(data$Rasio, na.rm = TRUE)
modus_rasio <- names(sort(table(data$Rasio), decreasing = TRUE))[1]
q1_rasio <- quantile(data$Rasio, 0.25, na.rm = TRUE)
q3_rasio <- quantile(data$Rasio, 0.75, na.rm = TRUE)
range_rasio <- range(data$Rasio, na.rm = TRUE)
var_rasio <- var(data$Rasio, na.rm = TRUE)
sd_rasio <- sd(data$Rasio, na.rm = TRUE)

summary_statistik <- data.frame(
  Statistik = c("Mean", "Median", "Modus", "Q1", "Q3", "Range", "Varians", "Standard Deviation"),
  Nilai = c(mean_rasio, median_rasio, modus_rasio, q1_rasio, q3_rasio, diff(range_rasio), var_rasio, sd_rasio)
)
print(summary_statistik)
##            Statistik            Nilai
## 1               Mean 10.1114003099011
## 2             Median 5.91666666666667
## 3              Modus                4
## 4                 Q1                4
## 5                 Q3 11.6315789473684
## 6              Range 35.3076923076923
## 7            Varians  93.094488596418
## 8 Standard Deviation 9.64854852277886
  • Mean (Rata-rata) menunjukkan rasio rata-rata murid per guru di sekolah-sekolah dalam dataset.
  • Median menggambarkan titik tengah distribusi rasio murid-guru. Jika median lebih kecil dari mean, berarti ada beberapa sekolah dengan rasio murid-guru yang sangat besar dibandingkan yang lain.
  • Modus menunjukkan rasio murid-guru yang paling sering muncul dalam dataset.
  • Kuartil (Q1 dan Q3) membantu melihat persebaran data rasio. Jika selisih antara Q1 dan Q3 besar, berarti ada ketimpangan dalam distribusi guru di sekolah-sekolah.
  • Varians dan standar deviasi menunjukkan apakah distribusi rasio murid-guru cukup seragam atau sangat bervariasi antar sekolah.

Perhitungan ini menunjukkan adanya variasi yang cukup signifikan dalam jumlah murid dan guru antar sekolah. Beberapa sekolah memiliki jumlah murid dan guru yang jauh di atas atau di bawah rata-rata, yang terlihat dari standar deviasi yang cukup besar. Ini menunjukkan bahwa distribusi sumber daya tenaga pengajar mungkin tidak merata, sehingga dapat mempengaruhi rasio murid per guru di berbagai sekolah.

Kesimpulan

Berdasarkan analisis data rasio murid-guru di berbagai sekolah dalam dataset, dapat disimpulkan bahwa distribusi guru di setiap kecamatan masih belum merata. Beberapa temuan utama dari hasil statistik dan visualisasi yang telah dibuat adalah sebagai berikut:

  1. Variasi Rasio Murid-Guru

    • Rata-rata rasio murid-guru menunjukkan bahwa sebagian besar sekolah memiliki jumlah guru yang cukup proporsional dengan jumlah murid.
    • Namun, terdapat sekolah-sekolah dengan rasio yang sangat tinggi, di mana jumlah murid jauh lebih banyak dibandingkan dengan jumlah guru yang tersedia.
  2. Ketimpangan Jumlah Sekolah Antar Kecamatan

    • Dari bar chart jumlah sekolah per kecamatan, terlihat bahwa beberapa kecamatan memiliki jumlah sekolah yang lebih banyak dibandingkan kecamatan lain.
    • Ketimpangan ini bisa menjadi indikasi bahwa akses pendidikan belum merata di seluruh wilayah.
  3. Hubungan Jumlah Murid dan Guru

    • Scatter plot menunjukkan adanya pola korelasi antara jumlah murid dan jumlah guru, tetapi terdapat beberapa outlier yang menunjukkan sekolah dengan jumlah murid tinggi namun jumlah guru yang terbatas.
    • Sekolah dengan jumlah guru yang sedikit dibandingkan jumlah muridnya berpotensi mengalami penurunan kualitas pembelajaran.
  4. Distribusi Rasio Murid-Guru di Tiap Kecamatan

    • Boxplot menunjukkan bahwa ada kecamatan dengan perbedaan rasio murid-guru yang cukup signifikan antar sekolah.
    • Hal ini menunjukkan bahwa meskipun jumlah guru di suatu kecamatan mungkin mencukupi secara total, distribusinya antar sekolah masih belum optimal.
  5. Sebaran Rasio Murid-Guru

    • Density plot menunjukkan bahwa sebagian besar sekolah memiliki rasio murid-guru dalam kisaran tertentu, tetapi ada kelompok sekolah dengan rasio yang jauh lebih tinggi atau lebih rendah dari rata-rata.
    • Ini menandakan bahwa meskipun mayoritas sekolah memiliki kondisi yang relatif stabil, ada beberapa sekolah yang mengalami ketidakseimbangan dalam jumlah tenaga pendidik.