Problem Research

Background

Berdasarkan Undang-undang No 20 Tahun 2003 tentang SISDIKNAS, pendidikan merupakan usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spiritual keagamaan, pengendalian diri, kepribadian, kecerdasan, akhlak mulia, serta keterampilan yang diperlukan untuk dirinya sendiri, masyarakat, bangsa dan negara.

Pendidikan memiliki peran penting yang dapat menjadi pengalaman belajar seseorang tentang berbagai aspek kehidupan, memahami perspektif yang berbeda dan mencoba menerapkannya dalam kehidupan sehari-hari. Pendidikan memberi orang pengetahuan tentang dunia di sekitar dan mengubahnya menjadi lebih baik. Pendidikan juga dapat mengembangkan pandangan orang tentang kehidupan serta membantu membentuk opini dan melihat hal-hal dalam hidup.

Sekolah merupakan salah satu sarana untuk mendapatkan pendidikan secara formal di Indonesia. Pemilihan sekolah untuk anak pada saat Sekolah Dasar merupakan salah satu keputusan penting yang akan berdampak pada masa depan anak. Beberapa manfaat sekolah bagi anak bukan hanya sekedar belajar teori saja, namun juga dapat memberikan pengalaman baru, memfasilitasi rasa penasaran dari anak yang belum pernah didapatkan di rumah serta membantu pengembagan karakter dan intelegensi anak.

Berdasarkan Data Pokok Pendidikan Kementerian Pendidikan, Kebudayaan, Riset dan Teknologi pada Sekolah Dasar di DKI Jakarta terdapat 2.234 sekolah yang terdiri dari 1,305 sekolah Negeri dan 929 sekolah Swasta. Pada kota modern seperti Jakarta sekolah swasta sudah menjamur pada setiap kecamatan dan daerah terbukti komposisi sekolah swasta di Jakarta sebesar 41,5% dari jumlah sekolah di Jakarta, hal ini menunjukan bahwa sekolah swasta sudah menjadi pilihan orang tua dalam menempatkan anaknya untuk mendapatkan pendidikan karena pada sekolah swasta menawarkan fasilitas dan kualitas yang tidak terdapat pada sekolah negeri.

Banyaknya jumlah sekolah swasta tersebut berdampak baik bagi kualitas pendidikan di Jakarta karena setiap sekolah akan berlomba-lomba untuk memberikan kualitas dan program pendidikan terbaik bagi peserta didiknya, namun hal tersebut juga menjadi problem/keresahan bagi beberapa orang tua dalam memilihkan sekolah yang tepat bagi anaknya, dimana terdapat beberapa faktor penentu dalam memilih sekolah diantaranya adalah :

  • Kurikulum dan Metode Pembelajaran

  • Lingkungan sekolah

  • Kualitas dan prestasi sekolah

  • Biaya sekolah

  • Lokasi sekolah

  • Fasilitas sekolah

Berdasarkan keresahan tersebut, saya ingin melakukan inisiasi pembuatan sebuah project yang dapat memberikan rekomendasi sekolah untuk para orang tua sesuai dengan nilai-nilai sekolah yang diinginkan oleh orang tua tersebut.

Business Impact

Project ini akan menghasilkan beberapa manfaat baik bagi para orang tua maupun pemilik bisnis sekolah. Manfaat yang bisa didapatkan antara lain :

  • Rekomendasi sekolah untuk para orang tua berdasarkan nilai-nilai sekolah yang dipilih melalui dashboard interaktif

  • Sebagai sarana komunikasi atau interaksi antar orang tua dalam rangka diskusi sekolah, sehingga para orang tua bisa mendapatkan informasi lebih detail berdasarkan pengalaman pribadi yang pernah dialami oleh orang tua lain di sekolah tersebut.

  • Hasil penggunaan dashboard ini dapat memberikan insight kepada pemilik sekolah baik swasta maupun pemerintah tentang sekolah yang dibutuhkan oleh para orang tua (customer) saat ini, sehingga dapat dijadikan dasar untuk pengembangan selanjutnya.

Target dan Benefit

  • Target user dari project ini adalah para orang tua yang sedang mencarikan sekolah dasar bagi anaknya.

  • Benefit yang bisa didapatkan adalah sebuah rekomendasi sekolah beserta informasi lainnya bagi orang tua sesuai dengan nilai-nilai yang diinginkan. Hal ini dapat memudahkan orang tua untuk melakukan screening sekolah sebelum dilakukan ke tahap selanjutnya, yaitu dengan melakukan visit dan trial pada sekolah tersebut.

Implementasi ke Bisnis Serupa

Implementasi project ini dapat juga digunakan pada beberapa kasus sebagai berikut :

  • Pemilihan Universitas

  • Pemilihan tempat kursus atau bimbingan belajar

  • Pemilihan lokasi investasi aset (rumah atau apartemen)

Tujuan/output dari project

  • Dashboard yang mempermudah orang tua dalam melakukan screening awal pemilihan sekolah sesuai dengan nilai-nilai sekolah yang diinginkan.

  • Hasil analisa kebutuhan sekolah dari para orang tua yang dapat dijadikan bahan evaluasi dalam pengembangan sarana pendidikan di Indonesia.

Data Collection (Pengumpulan Data)

Informasi Data yang Akan Digunakan

Saat ini project hanya terbatas pada data sampel sekolah dasar swasta (100-150 sekolah) pada wilayah DKI Jakarta dan dapat terus dikembangkan untuk seluruh sekolah dasar, tingkat sekolah yang lebih tinggi atau daerah lain diluar Jakarta. Informasi yang terdapat pada data tersebut diantaranya :

  • npsn : nomor sekolah

  • Nama Sekolah

  • Kurikulum

  • Jumlah peserta didik (siswa)

  • Jumlah guru

  • Jumlah kelas

  • Jumlah peserta didik per kelas

  • Fasilitas sekolah seperti sarana olahraga, tempat ibadah, tempat bermain, perpustakaan, laboratorium, toilet dan kantin

  • Track prestasi : 1. Internasional, 2. Nasional atau 3. Lokal

  • Lokasi sekolah : Kota, kecamatan, latitude dan longitude

  • Lingkungan sekolah

  • Rating google

  • Informasi detail sekolah :visi, misi, metode belajar dan website

Sumber Data dan Teknik Pengumpulan

Data yang digunakan didapatkan dari beberapa sumber diantaranya

  • Data Pokok Pendidikan Kementerian Pendidikan, Kebudayaan, Riset dan Teknologi. Pengumpulan data dilakukan dengan mendownload data yang ada di webiste https://dapo.kemdikbud.go.id/sp

  • Website masing-masing sekolah dasar, pengumpulan dilakukan secara manual dari website di rekap kedalam file database sekolah.

Data yang direkap dapat dipertanggungjawabkan, user dapat melihat langsung ke website Kemendikbud maupun masing-masing sekolah apabila terdapat keraguan terhadap data yang disampaikan.

Kesesuaian Data dengan Kebutuhan Bisnis

Data yang disiapkan dirasa sudah memenuhi kebutuhan bisnis dikarenakan sudah sesuai dengan hasil survey dan informasi dari beberapa website terkait dengan beberapa faktor penentu dalam memilih sekolah diantaranya yaitu :

  • Kurikulum dan Metode Pembelajaran

  • Lingkungan sekolah

  • Kualitas dan prestasi sekolah

  • Biaya sekolah

  • Lokasi sekolah

  • Fasilitas sekolah

Data Preparation (Persiapan Data)

Target dan/atau prediktor:

  • Target : tidak terdapat target (unsupervised learning), namun akan dilakukan clustering data

  • Prediktor : Prediktor pada data diantaranya kurikulum, seluruh kolom fasilitas sekolah, Jumlah peserta didik (siswa), Jumlah guru, Jumlah kelas, Jumlah peserta didik per kelas, Track prestasi : 1. Internasional, 2. Nasional atau 3. Lokal, Lokasi sekolah : Kota, kecamatan, latitude dan longitude dan rating google

Proses Data Preparation

library(openxlsx) # library untuk membaca file excell
library(dplyr)
library(ggplot2)
SD <- read.xlsx("data sekolah new.xlsx")
SD

Data yang digunakan pada proposal kali ini masih terbatas pada sample sekolah SD swasta di daerah Jakarta Timur saja dengan jumlah sebanyak 36 sample. Kedepannya data sample akan dilengkapi dari daerah Jakarta lainnya dengan kisaran sample sebanyak 100-150 sekolah.

str(SD)
#> 'data.frame':    36 obs. of  26 variables:
#>  $ npsn             : num  69758231 20121008 20109088 20109017 20109264 ...
#>  $ nama.sekolah     : chr  "SDS KINDERFIELD" "SD EMBUN PG" "SD ISLAM TERPADU AR RIDHO" "SDS Kristen 4 BPK Penabur" ...
#>  $ Jenis            : chr  "General" "Islamic" "Islamic" "Kristen/Katolik" ...
#>  $ kurikulum        : chr  "Kurikulum Merdeka & Cambridge International Examinations (CIE)" "Kurikulum Merdeka" "Kurikulum Merdeka" "Kurikulum Merdeka" ...
#>  $ akreditasi       : chr  "A" "A" "A" "A" ...
#>  $ jumlah.siswa     : num  502 639 385 873 655 412 527 594 310 722 ...
#>  $ jumlah.guru      : num  52 64 48 53 19 12 42 31 24 42 ...
#>  $ ruang.kelas      : num  24 28 19 25 18 12 22 24 12 26 ...
#>  $ siswa/kelas      : num  21 23 20 35 36 34 24 25 26 28 ...
#>  $ Sarana.Olahraga  : num  2 1 0 1 2 1 1 1 1 1 ...
#>  $ kolam.renang     : num  1 1 0 0 0 0 0 0 0 0 ...
#>  $ taman.bermain    : num  2 1 0 0 0 0 0 0 0 0 ...
#>  $ tempat.ibadah    : num  1 1 1 1 0 0 1 1 1 1 ...
#>  $ perpustakaan     : num  1 1 1 1 1 1 2 1 1 1 ...
#>  $ laboratorium     : num  3 2 1 3 1 0 3 2 3 1 ...
#>  $ toilet           : num  4 7 4 6 4 12 4 14 4 4 ...
#>  $ kantin           : num  1 1 1 1 1 1 1 1 1 1 ...
#>  $ track.prestasi   : num  3 2 3 1 3 0 0 0 3 0 ...
#>  $ uang.pangkal     : num  45000000 29000000 16000000 21900000 18000000 ...
#>  $ spp.bulanan      : num  3100000 800000 1250000 2850000 1000000 1000000 985000 1200000 875000 900000 ...
#>  $ Lokasi           : chr  "Jakarta Timur" "Jakarta Timur" "Jakarta Timur" "Jakarta Timur" ...
#>  $ Kec              : chr  "Duren Sawit" "Duren Sawit" "Duren Sawit" "Duren Sawit" ...
#>  $ latitude         : num  -6.25 -6.25 -6.24 -6.23 -6.23 ...
#>  $ longitude        : num  106.9 106.9 106.9 10.7 106.9 ...
#>  $ Lingkungan.Lokasi: chr  "Jalan Utama" "Jalan Utama" "Perumahan" "Jalan Kota" ...
#>  $ Rating.Google    : num  4.1 3.8 4.8 4.6 4.7 4.4 4.8 4.7 4.5 4.6 ...
  • npsn : nomor sekolah

  • Nama Sekolah

  • Kurikulum

  • Jumlah peserta didik (siswa)

  • Jumlah guru

  • Jumlah kelas

  • Jumlah peserta didik per kelas

  • Fasilitas sekolah seperti sarana olahraga, tempat ibadah, tempat bermain, perpustakaan, laboratorium, toilet dan kantin

  • Track prestasi : 1. Internasional, 2. Nasional atau 3. Lokal

  • Lokasi sekolah : Kota, kecamatan

  • Lingkungan sekolah : Perumahan, Jalan Kota dan Jalan Utama

  • Rating google: hasil penilaian sekolah di google

Terdapat beberapa kolom yang type datanya masih belum sesuai dan perlu dilakukan perbahan

SD <- SD %>% 
  mutate_if(is.character, as.factor) %>%
  mutate(nama.sekolah = as.character(nama.sekolah)) 

SD

Explanatory Data Analysis

Summary Data

summary(SD)
#>       npsn          nama.sekolah                   Jenis   
#>  Min.   :20103915   Length:36          General        : 7  
#>  1st Qu.:20109017   Class :character   Islamic        :22  
#>  Median :20109111   Mode  :character   Kristen/Katolik: 7  
#>  Mean   :29793628                                          
#>  3rd Qu.:20112767                                          
#>  Max.   :70014284                                          
#>                                                            
#>                                                           kurikulum 
#>  Cambridge International Examinations (CIE)                    : 1  
#>  Kurikulum Merdeka                                             :17  
#>  Kurikulum Merdeka & Al-Qur'an                                 : 8  
#>  Kurikulum Merdeka & Cambridge International Examinations (CIE): 7  
#>  Kurikulum Merdeka & English environtment                      : 2  
#>  Kurikulum Merdeka, Australia, Singapura, dan Malaysia         : 1  
#>                                                                     
#>                akreditasi  jumlah.siswa     jumlah.guru     ruang.kelas   
#>  A                  :35   Min.   : 203.0   Min.   :12.00   Min.   :11.00  
#>  belum terakreditasi: 1   1st Qu.: 386.5   1st Qu.:24.00   1st Qu.:17.75  
#>                           Median : 473.5   Median :38.00   Median :21.50  
#>                           Mean   : 579.6   Mean   :42.44   Mean   :25.08  
#>                           3rd Qu.: 776.5   3rd Qu.:61.00   3rd Qu.:30.00  
#>                           Max.   :1101.0   Max.   :91.00   Max.   :66.00  
#>                                                                           
#>   siswa/kelas    Sarana.Olahraga  kolam.renang    taman.bermain   
#>  Min.   :11.00   Min.   :0.0     Min.   :0.0000   Min.   :0.0000  
#>  1st Qu.:20.75   1st Qu.:1.0     1st Qu.:0.0000   1st Qu.:0.0000  
#>  Median :24.00   Median :1.0     Median :0.0000   Median :0.0000  
#>  Mean   :23.86   Mean   :1.5     Mean   :0.1944   Mean   :0.3333  
#>  3rd Qu.:27.25   3rd Qu.:2.0     3rd Qu.:0.0000   3rd Qu.:0.2500  
#>  Max.   :36.00   Max.   :5.0     Max.   :1.0000   Max.   :2.0000  
#>                                                                   
#>  tempat.ibadah     perpustakaan    laboratorium       toilet     
#>  Min.   :0.0000   Min.   :1.000   Min.   :0.000   Min.   : 3.00  
#>  1st Qu.:1.0000   1st Qu.:1.000   1st Qu.:2.000   1st Qu.: 4.00  
#>  Median :1.0000   Median :1.000   Median :2.000   Median : 5.50  
#>  Mean   :0.9722   Mean   :1.111   Mean   :2.444   Mean   : 8.75  
#>  3rd Qu.:1.0000   3rd Qu.:1.000   3rd Qu.:3.000   3rd Qu.:10.25  
#>  Max.   :2.0000   Max.   :2.000   Max.   :7.000   Max.   :56.00  
#>                                                                  
#>      kantin      track.prestasi   uang.pangkal       spp.bulanan     
#>  Min.   :1.000   Min.   :0.000   Min.   : 2212500   Min.   : 300000  
#>  1st Qu.:1.000   1st Qu.:0.000   1st Qu.:15600000   1st Qu.: 992500  
#>  Median :1.000   Median :2.000   Median :19445000   Median :1165000  
#>  Mean   :1.028   Mean   :1.472   Mean   :23260486   Mean   :1710083  
#>  3rd Qu.:1.000   3rd Qu.:3.000   3rd Qu.:30125000   3rd Qu.:2066000  
#>  Max.   :2.000   Max.   :3.000   Max.   :67100000   Max.   :9800000  
#>                                                                      
#>            Lokasi            Kec        latitude         longitude     
#>  Jakarta Timur:36   Duren Sawit:10   Min.   :-61.883   Min.   : 10.69  
#>                     Pulo Gadung: 7   1st Qu.: -6.284   1st Qu.:106.86  
#>                     Kramat Jati: 6   Median : -6.237   Median :106.89  
#>                     Cakung     : 3   Mean   : -7.477   Mean   : 98.88  
#>                     Jatinegara : 3   3rd Qu.: -6.198   3rd Qu.:106.90  
#>                     Ciracas    : 2   Max.   : -0.621   Max.   :106.95  
#>                     (Other)    : 5                                     
#>    Lingkungan.Lokasi Rating.Google  
#>  Jalan Kota :10      Min.   :3.400  
#>  Jalan Utama:10      1st Qu.:4.275  
#>  Perumahan  :16      Median :4.500  
#>                      Mean   :4.453  
#>                      3rd Qu.:4.700  
#>                      Max.   :4.900  
#> 

Berdasarkan hasil summary dapat diinformasikan beberapa hal sebagai berikut :

  1. Jumlah siswa pada data sample paling rendah adalah 203 siswa sedangkan paling banyak terdapat 1101 siswa pada satu sekolah
  2. Rating google terendah yaitu sebesar 3.4 dan tertinggi sebesar 4.9 dengan rata-rata rating sekolah 4.45
  3. Jumlah siswa per kelas berdasarkan data sample berada di range 11 - 36 siswa per kelas

Visualisasi Data Analysis

Pertama-tama kita akan melihat jumlah siswa/kelas berdasarkan jenis sekolah

SD %>% group_by(Jenis) %>% 
  summarise(`siswa/kelas`= round(mean(`siswa/kelas`))) %>% 
  ungroup() %>% 
  ggplot(mapping= aes(x=Jenis, y=`siswa/kelas`)) + 
  geom_col(aes(fill=`siswa/kelas`))

Pada sekolah General memiliki rata-rata jumlah siswa yang paling sedikit yaitu sekitar 21 siswa/kelas sedangkan siswa/kelas terbanyak yaitu 30 terdapat pada sekolah Kristen/Katolik

Selanjutnya akan ditampilkan mengenai distribusi dari jumlah siswa pada setiap jenis sekolah

ggplot(SD, aes(x=Jenis, y=jumlah.siswa)) +
  geom_boxplot(fill ="goldenrod2",color="black") +
  labs(title = "Distribusi Siswa",
       x = "Jenis Sekolah",
       y = "Jumlah Siswa") +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(hjust = 0.5)) 

Distribusi jumlah siswa berdasarkan jenis sekolah terbanyak yaitu pada sekolah Islamic dengan rata-rata sekitar 600 siswa sedangkan pada sekolah general rata-rata memiliki sekitar 400 siswa

Terdapat informasi terkait dengan Lingkungan dan Rating Google. Mari kita lihat sebarannya

ggplot(SD, aes(x=Lingkungan.Lokasi, y=Rating.Google)) +
  geom_boxplot(fill ="green3",color="black") +
  labs(title = "Distribusi Rating berdasarkan Lingkungan Sekolah",
       x = "Lingkungan",
       y = "Rating") +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(hjust = 0.5))

Berdasarkan grafik boxplot diatas dapat disampaikan bahwa sekolah yang terdapat pada lingkungan Jalan Utama memiliki nilai rating yang paling rendah dibandingkan dengan lingkungan lainnya, hal ini terjadi karena banyaknya sentimen negatif dari reviewer terkait padatnya lalu lintas pada di jalan utama ketika jam masuk dan pulang sekolah.

Product Design

Rencana Machine Learning yang akan digunakan pada project ini adalah K-means clustering untuk mengelompokan sekolah sesuai dengan nilai-nilai yang dimiliki selanjutnya akan dideploy melalui shiny

Fitur yang Terdapat di Dashboard

Fitur-fitur yang terdapat pada shiny antara lain :

  • Select informasi sekolah
  • Hasil rekomendasi sekolah
  • Detail informasi sekolah
  • Peta lokasi dari sekolah
  • Informasi terkait analisa data sekolah