Abstrak

Persaingan dalam tes Calon Pegawai Negeri Sipil (CPNS) Negara Indonesia, utamanya pada Kementerian Pendidikan, sangatlah ketat. Hal ini disebabkan jumlah pelamar yang sangat banyak. Oleh karena itu, peserta CPNS perlu persiapan yang matang untuk menghadapi tes CPNS. Walau begitu, hal tersebut masih meninggalkan pertanyaan di dalam benak: seberapa banyak persiapan yang harus disiapkan untuk lulus tes CPNS? Investigasi kali ini menganalisa hasil tes CPNS di Kementerian Pendidikan yang diselenggarakan pada 2024 untuk mencari tahu seberapa banyak persiapan yang dibutuhkan oleh peserta CPNS untuk lulus di tes CPNS di periode mendatang. Dengan menggunakan pendekatan statistik deskriptif, studi ini menguak bahwa setiap jabatan formasi memiliki tren skor CPNS yang unik satu sama lain, dan bahwa peluang untuk lulus CPNS ditentukan dari banyaknya pelamar pada suatu jabatan formasi per sub bagian per bagian per institusi. Hal ini menekankan implikasi bahwa peserta CPNS di periode mendatang disarankan untuk memilah dan memilih jabatan formasi berdasarkan jumlah frekuensi pelamar di lokasi yang diminati.

Kata Kunci: CPNS, Kementerian Pendidikan, Statistik Deskriptif

Pendahuluan

Bagian ini memaparkan latar belakang, pertanyaan riset, tujuan riset, kontribusi riset, dan sumber data–secara berurutan.

Latar Belakang

Berawal dari pengalaman kegagalan dalam menghadapi CPNS 2024, saya membuat analisis hasil CPNS (Calon Pegawai Negeri Sipil) untuk mengetahui lebih mendalam tentang kompetitor saya. Walau begitu, pengumuman hasil CPNS yang dipublikasikan oleh Kementerian sangat sulit untuk dianalisis mengingat jumlah halamannya yang banyak. Oleh karena itu, saya berinisiatif untuk melakukan analisis data hasil CPNS menggunakan teknik rekayasa informasi (data engineerfing, data analysis). Selain itu, mengingat banyak rekan saya yang memiliki cita-cita untuk menjadi ASN (Aparatur Sipil Negara), hasil analisis ini saya persembahkan untuk seluruh warga Indonesia yang hendak menjadi ASN di kemudian hari.

Mengingat pengumuman hasil CPNS yang disiarkan per instansi, akan sangat sulit bagi saya untuk mendapatkan semua data secara holistik. Selain itu, lingkungan sosial dimana saya tumbuh didominasi dengan (calon) pendidik sehingga saya tertarik dengan data yang lebih spesifik. Dengan pertimbangan ini, saya memutuskan untuk mengambil data dari Kementerian yang berhubungan dengan dunia pendidikan. Di sini saya tidak spesifik merujuk pada Kementerian Pendidikan Dasar dan Menengah (Kemendikdasmen) ataupun Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi (Kemendikbudristek) karena nama Kementerian cenderung berganti seiring dengan pergantian kepemimpinan negara. Dengan pertimbangan ini, saya memutuskan untuk menggunakan terminologi Kementerian Pendidikan (Kemendik) sebagai definisi payung untuk Kementerian yang bergerak secara khusus di bidang pendidikan.

Proyek ini bersifat kontinyu/berkelanjutan. Pengumuman hasil CPNS 5 periode sebelum 2024 dan setelah periode 2024 (dan seterusnya) akan saya analisis.

Pertanyaan Riset

Investigasi ini memiliki beberapa pertanyaan yang akan memandu proses analisis, diantaranya adalah:

Secara umum, berapa skor TWK, TIU, TKP, dan total yang aman untuk lolos ke tahap SKB?
Berapa skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan dari rumpun keguruan dan ilmu pendidikan untuk lolos ke tahap SKB?
Berapa skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan dari rumpun non keguruan dan ilmu pendidikan untuk lolos ke tahap SKB?
Berapa skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan dan tujuan jabatan formasi yang berkaitan dengan “Inggris” untuk lolos ke tahap SKB?
Berapa skor TWK, TIU, TKP, dan total yang aman bagi pelamar Dosen Asisten Ahli dan kualifikasi latar pendidikan yang berkaitan dengan “Inggris” untuk lolos ke tahap SKB?
Berapa skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan yang berkaitan dengan “Fisika” untuk lolos ke tahap SKB?
Berapa skor TWK, TIU, TKP, dan total yang aman bagi pelamar Widyaiswara untuk lolos ke tahap SKB?
Secara umum, berapa skor SKB yang aman untuk lolos tahap SKB?
Berapa skor SKB yang aman bagi pelamar dengan latar pendidikan dari rumpun keguruan dan ilmu pendidikan untuk lolos tahap SKB?
Berapa skor SKB yang aman bagi pelamar dengan latar pendidikan dari rumpun non keguruan dan ilmu pendidikan untuk lolos tahap SKB?
Berapa skor SKB yang aman bagi pelamar dengan latar pendidikan yang berkaitan dengan “Inggris” untuk lolos tahap SKB?
Berapa skor SKB yang aman bagi pelamar Dosen Asisten Ahli untuk formasi yang berkaitan dengan “Inggris” untuk lolos tahap SKB?
Berapa skor SKB yang aman bagi pelamar dengan latar pendidikan yang berkaitan dengan “Fisika” untuk lolos tahap SKB?
Berapa skor SKB yang aman bagi pelamar WIdyaiswara untuk lolos tahap SKB?
Di masing-masing formasi jabatan CPNS 2024 Kemendik, berapa proporsi kelulusan SKD-nya?
Di masing-masing formasi jabatan CPNS 2024 Kemendik, berapa proporsi kelulusan SKB-nya?
Jabatan formasi di instansi mana yang paling banyak peminatnya?
Jabatan formasi di instansi mana yang paling sedikit peminatnya?
Daerah mana yang paling banyak diminati oleh pelamar CPNS 2024 Kemendik?
Daerah mana yang paling sedikit diminati oleh pelamar CPNS 2024 Kemendik?
Berapa probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Bahasa Inggris dan posisi yang dilamar adalah Dosen Asisten Ahli?
Berapa probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-3 Pendidikan Bahasa Inggris dan posisi yang dilamar adalah Dosen Lektor?
Berapa probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Bahasa Inggris dan posisi yang dilamar adalah Widyaiswara?
Berapa probabilitas lulus menjadi PNS di setiap formasi yang ada jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Bahasa Inggris?
Berapa probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Fisika dan posisi yang dilamar adalah Dosen Asisten Ahli?
Berapa probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-3 Pendidikan Fisika dan posisi yang dilamar adalah Dosen Lektor?
Berapa probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Fisika dan posisi yang dilamar adalah Widyaiswara?
Berapa probabilitas lulus menjadi PNS di setiap formasi yang ada jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Fisika?

Tujuan Riset

Secara umum, dilakukannya investigasi ini adalah untuk memberikan gambaran umum tentang kompetitor pada rekrutmen CPNS. Tujuan lebih spesifik tertera di bawah ini:

Menentukan skor TWK, TIU, TKP, dan total yang aman secara umum untuk lolos ke tahap SKB.
Menentukan skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan dari rumpun keguruan dan ilmu pendidikan untuk lolos ke tahap SKB.
Menentukan skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan dari rumpun non keguruan dan ilmu pendidikan untuk lolos ke tahap SKB.
Menentukan skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan dan tujuan jabatan formasi yang berkaitan dengan “Inggris” untuk lolos ke tahap SKB.
Menentukan skor TWK, TIU, TKP, dan total yang aman bagi pelamar Dosen Asisten Ahli dan kualifikasi latar pendidikan yang berkaitan dengan “Inggris” untuk lolos ke tahap SKB.
Menentukan skor TWK, TIU, TKP, dan total yang aman bagi pelamar dengan latar pendidikan yang berkaitan dengan “Fisika” untuk lolos ke tahap SKB.
Menentukan skor TWK, TIU, TKP, dan total yang aman bagi pelamar Widyaiswara untuk lolos ke tahap SKB.
Menentukan skor SKB yang aman secara umum untuk lolos tahap SKB.
Menentukan skor SKB yang aman bagi pelamar dengan latar pendidikan dari rumpun keguruan dan ilmu pendidikan untuk lolos tahap SKB.
Menentukan skor SKB yang aman bagi pelamar dengan latar pendidikan dari rumpun non keguruan dan ilmu pendidikan untuk lolos tahap SKB.
Menentukan skor SKB yang aman bagi pelamar dengan latar pendidikan yang berkaitan dengan “Inggris” untuk lolos tahap SKB.
Menentukan skor SKB yang aman bagi pelamar Dosen Asisten Ahli untuk formasi yang berkaitan dengan “Inggris” untuk lolos tahap SKB.
Menentukan skor SKB yang aman bagi pelamar dengan latar pendidikan yang berkaitan dengan “Fisika” untuk lolos tahap SKB.
Menentukan skor SKB yang aman bagi pelamar Widyaiswara untuk lolos tahap SKB.
Menghitung proporsi kelulusan SKD di masing-masing formasi jabatan CPNS 2024 Kemendik.
Menghitung proporsi kelulusan SKB di masing-masing formasi jabatan CPNS 2024 Kemendik.
Mengidentifikasi jabatan formasi di instansi yang paling banyak peminatnya.
Mengidentifikasi jabatan formasi di instansi yang paling sedikit peminatnya.
Mengidentifikasi daerah yang paling banyak diminati oleh pelamar CPNS 2024 Kemendik.
Mengidentifikasi daerah yang paling sedikit diminati oleh pelamar CPNS 2024 Kemendik.
Menghitung probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Bahasa Inggris dan posisi yang dilamar adalah Dosen Asisten Ahli.
Menghitung probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-3 Pendidikan Bahasa Inggris dan posisi yang dilamar adalah Dosen Lektor.
Menghitung probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Bahasa Inggris dan posisi yang dilamar adalah Widyaiswara.
Menghitung probabilitas lulus menjadi PNS di setiap formasi yang ada jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Bahasa Inggris.
Menghitung probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Fisika dan posisi yang dilamar adalah Dosen Asisten Ahli.
Menghitung probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-3 Pendidikan Fisika dan posisi yang dilamar adalah Dosen Lektor.
Menghitung probabilitas lulus menjadi PNS jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Fisika dan posisi yang dilamar adalah Widyaiswara.
Menghitung probabilitas lulus menjadi PNS di setiap formasi yang ada jika latar belakang pendidikan yang dimiliki adalah S-2 Pendidikan Fisika.

Kontribusi Riset

Investigasi ini menitikberatkan kontribusi praktikal yang bisa digunakan oleh seluruh warga Indonesia yang memiliki motivasi untuk mengikuti CPNS, terutama bagi mereka yang menargetkan Kementerian Pendidikan. Dengan wawasan yang didapat dari hasil investigasi ini, saya berharap calon PNS dapat membuat rencana belajar yang efektif dan efisien, analisa kompetitor, dan peluang keberhasilan lolos di masing-masing tahap tes CPNS.

Di samping kontribusi praktikal, hasil analisis ini juga menawarkan wawasan yang bersifat teoretis-eksploratif tentang karakteristik dari demografi calon PNS berdasarkan sudut pandang retrospektif. Analisis prediktif yang disajikan dalam hasil investigasi ini juga dapat dijadikan sebagai bahan dasar dalam perencanaan peningkatan mutu SDM (Sumber Daya Alam) PNS generasi yang akan datang.

Tidak terlewat juga kontribusi berupa data empiris yang ditawarkan dari hasil investigasi ini. Jumlah data yang masif ini memiliki nilai yang berharga untuk pengambilan keputusan baik di sektor formal atau informal, di level operasional maupun managerial, dan/atau di level eksekutif.

Sumber Data

Data diambil dari pengumuman hasil SKD dan SKB (dua pengumuman berbeda) CPNS 2024 spesifik pada Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi (Kemendikbudristek).

Persiapan Data

Perkakas (Library)

Kode di bawah ini akan mempersiapkan library yang diperlukan untuk menunjang analisis.

Show code

library(tidyverse)
library(ggplot2)
library(ggthemes)
library(ggridges)
library(ggtext)
library(ggdist)
library(glue)
library(patchwork)
library(RColorBrewer)
library(viridis)
library(visdat)
library(psych)
library(MetBrewer)

Impor Data

Data sudah melalui tahap ekstraksi dari PDF ke CSV menggunakan Python. Setelah data diekstrak ke format CSV, data kemudian dibersihkan menggunakan PostgreSQL. Pada dokumen ini, impor data yang dimaksud adalah impor data dari CSV ke R. Kode di bawah ini akan mengimpor data dari CSV ke R.

Hasil SKD

Show code

hasil_skd <- read_csv("2024/test1v3.csv",
                      col_types = cols(rank = col_number(),
                                       twk = col_integer(),
                                       tiu = col_integer(),
                                       tkp = col_integer(),
                                       skd = col_integer(),
                                       allotment = col_integer(),
                                       page_num = col_integer()
                      ))
hasil_skd

# A tibble: 99,547 × 14
    rank id       full_name last_edu   twk   tiu   tkp   skd decl_code
   <dbl> <chr>    <chr>     <chr>    <int> <int> <int> <int> <chr>    
 1     1 2430102… ANITA VE… S-1 HUK…   115   120   195   430 P/L      
 2     2 2430102… AISYAH S… S-1 HUK…   100   120   196   416 P/L      
 3     3 2430102… DYAH AYU… S-1 HUK…    85   135   191   411 P/L      
 4     4 2430102… MUHAMMAD… S-1 HUK…    85   115   199   399 P/L      
 5     5 2430102… EDO DWI … S-1 HUK…    90   115   193   398 P/L      
 6     6 2430102… SILVIA M… S-1 HUK…    90   105   201   396 P/L      
 7     7 2430102… WIDYA PU… S-1 HUK…    90   105   196   391 P/L      
 8     8 2430102… RHEA ART… S-1 HUK…    95   110   184   389 P/L      
 9     9 2430102… DICHO SI… S-1 HUK…    90   100   192   382 P/L      
10    10 2430102… FARADITA… S-1 HUK…    85   110   180   375 P/L      
# ℹ 99,537 more rows
# ℹ 5 more variables: jp_code <chr>, loc_code <chr>, type_code <chr>,
#   allotment <int>, page_num <int>

Hasil SKB

Show code

hasil_skb <- read_csv("2024/test2v1.csv", 
                      col_types = cols(id = col_character())
                      )
hasil_skb

# A tibble: 14,989 × 21
    rank id      birthdate  last_edu edu_group   gpa   twk   tiu   tkp
   <dbl> <chr>   <date>     <chr>    <chr>     <dbl> <dbl> <dbl> <dbl>
 1     1 243010… 1997-05-26 S-1 HUK… Universi…  2.92    85   135   191
 2     2 243010… 1997-03-17 S-1 HUK… Universi…  3.87    95   110   184
 3     3 243010… 2003-04-20 S-1 HUK… Universi…  3.93   100   120   196
 4     4 243010… 2001-10-12 S-1 HUK… Universi…  3.78    90   105   201
 5     5 243010… 2001-07-26 S-1 HUK… Universi…  3.84    90   100   192
 6     6 243010… 1996-05-03 S-1 HUK… Universi…  3.26    70    90   178
 7     7 243010… 2000-01-01 S-1 HUK… Universi…  3.74    85   115   199
 8     8 243010… 2001-11-23 S-1 HUK… Universi…  3.84    80   100   182
 9     9 243010… 1993-03-29 S-1 HUK… Universi…  3.8     85   110   180
10    10 243010… 1994-09-19 S-1 HUK… Universi…  3.66    80   100   177
# ℹ 14,979 more rows
# ℹ 12 more variables: skd <dbl>, skd40 <dbl>, skb <dbl>,
#   skb60 <dbl>, final_score <dbl>, decl_code <chr>, jp_code <chr>,
#   loc_code <chr>, type_code <chr>, edu_qual <chr>,
#   num_edu_qual <chr>, page_num <dbl>

Jabatan Formasi

Show code

jabatan_formasi <- read_csv("2024/jabatan_formasi.csv") %>% 
  rename(jp_code = parent)

jabatan_formasi

# A tibble: 51 × 2
   jp_code   job_position                                    
   <chr>     <chr>                                           
 1 JF0000334 ANALIS HUKUM AHLI PERTAMA                       
 2 JF0000905 DOSEN LEKTOR                                    
 3 JF0000908 DOSEN ASISTEN AHLI                              
 4 JF0001001 PENGEMBANG TEKNOLOGI PEMBELAJARAN AHLI PERTAMA  
 5 JF0008014 ANALIS SUMBER DAYA MANUSIA APARATUR AHLI PERTAMA
 6 JF0008017 PRANATA SUMBER DAYA MANUSIA APARATUR TERAMPIL   
 7 JF0008403 PAMONG BUDAYA AHLI PERTAMA                      
 8 JF0008406 PAMONG BUDAYA TERAMPIL                          
 9 JF0008904 PERENCANA AHLI PERTAMA                          
10 JF0010504 PRANATA KOMPUTER AHLI PERTAMA                   
# ℹ 41 more rows

Lokasi Formasi

Show code

lokasi_formasi <- read_csv("2024/lokasi_formasi_cleaning1.csv")

Pembersihan Data

Dataset SKD

Tahap ini akan memberikan ringkasan jumlah data duplikat. Di sini saya mengecek secara (1) keseluruhan, (2) variabel id, dan (3) variabel full_name.

Show code

chk_dupl_skd_all <- sum(duplicated(hasil_skd))
chk_dupl_skd_id <- sum(duplicated(hasil_skd$id))
chk_dupl_skd_full_name <- sum(duplicated(hasil_skd$full_name))

chk_dupl_skd_all

[1] 30885

Show code

chk_dupl_skd_id

[1] 30885

Show code

chk_dupl_skd_full_name

[1] 33641

Ketika dicek berdasarkan variabel id dan full_name, ada 30885 dan 33641 data duplikat pada masing-masing variabel id dan full_name. Inkonsistensi data ini akan menyebabkan menurunnya keakuratan hasil analisis di tahap yang akan datang sehingga perlu didalami lebih lanjut.

Show code

hasil_skd %>% 
  select(id, full_name, twk) %>% # tambah variabel full_name dan twk untuk V&V (verifikasi dan validasi)
  group_by(id) %>% 
  filter(n() > 1) %>% 
  ungroup()

# A tibble: 61,770 × 3
   id                full_name                                     twk
   <chr>             <chr>                                       <int>
 1 24301020120017621 "LINGGOMI ADINDA TAMARADHINA\r\nNAPITUPULU"    80
 2 24301020120017621 "LINGGOMI ADINDA TAMARADHINA\r\nNAPITUPULU"    80
 3 24301020110021143 "MUH ANDRI ALVIAN RAMADHAN\r\nALPHAROEDI"      NA
 4 24301020110021143 "MUH ANDRI ALVIAN RAMADHAN\r\nALPHAROEDI"      NA
 5 24301020120001553 "DIAN ASWITA"                                  75
 6 24301020120001553 "DIAN ASWITA"                                  75
 7 24301020110008472 "RAHMAT SALEH"                                105
 8 24301020110008472 "RAHMAT SALEH"                                105
 9 24301020120023931 "ANDI ANDARIANA"                              100
10 24301020120023931 "ANDI ANDARIANA"                              100
# ℹ 61,760 more rows

Variabel full_name tampak memiliki duplikat untuk nama yang memiliki sedikit perbedaan. Dalam hal ini, data yang mengandung \r, \n atau \r\nakan dianggap data yang berbeda walaupun secara holistik tidak ada perbedaan. Untuk memperbaiki hal ini, menghapus lalu menyisakan satu data unik dari variabel id akan lebih tepat.

Show code

hasil_skd_no_dupl <- hasil_skd %>% 
  distinct(id, .keep_all = TRUE)

hasil_skd_no_dupl

# A tibble: 68,662 × 14
    rank id       full_name last_edu   twk   tiu   tkp   skd decl_code
   <dbl> <chr>    <chr>     <chr>    <int> <int> <int> <int> <chr>    
 1     1 2430102… ANITA VE… S-1 HUK…   115   120   195   430 P/L      
 2     2 2430102… AISYAH S… S-1 HUK…   100   120   196   416 P/L      
 3     3 2430102… DYAH AYU… S-1 HUK…    85   135   191   411 P/L      
 4     4 2430102… MUHAMMAD… S-1 HUK…    85   115   199   399 P/L      
 5     5 2430102… EDO DWI … S-1 HUK…    90   115   193   398 P/L      
 6     6 2430102… SILVIA M… S-1 HUK…    90   105   201   396 P/L      
 7     7 2430102… WIDYA PU… S-1 HUK…    90   105   196   391 P/L      
 8     8 2430102… RHEA ART… S-1 HUK…    95   110   184   389 P/L      
 9     9 2430102… DICHO SI… S-1 HUK…    90   100   192   382 P/L      
10    10 2430102… FARADITA… S-1 HUK…    85   110   180   375 P/L      
# ℹ 68,652 more rows
# ℹ 5 more variables: jp_code <chr>, loc_code <chr>, type_code <chr>,
#   allotment <int>, page_num <int>

Perlu dicatat bahwa kolom/variabel full_name tidak perlu dibersihkan lebih lanjut (terutama untuk menghapus \r, \n, atau \r\n) karena tidak ada sama sekali urgensi untuk menginvestigasi satu atau sekian nama secara spesifik. Walau begitu, kolom last_edu memiliki kendala new rows dan/atau new lines yang terpatri dalam datanya sehingga pembersihan lanjutan sangat diperlukan untuk tahap analisis.

Show code

hasil_skd_no_dupl$last_edu <- 
  str_replace_all(hasil_skd_no_dupl$last_edu, "[\\r\\n]", " ") %>%
  str_squish()

hasil_skd_no_dupl

# A tibble: 68,662 × 14
    rank id       full_name last_edu   twk   tiu   tkp   skd decl_code
   <dbl> <chr>    <chr>     <chr>    <int> <int> <int> <int> <chr>    
 1     1 2430102… ANITA VE… S-1 HUK…   115   120   195   430 P/L      
 2     2 2430102… AISYAH S… S-1 HUK…   100   120   196   416 P/L      
 3     3 2430102… DYAH AYU… S-1 HUK…    85   135   191   411 P/L      
 4     4 2430102… MUHAMMAD… S-1 HUK…    85   115   199   399 P/L      
 5     5 2430102… EDO DWI … S-1 HUK…    90   115   193   398 P/L      
 6     6 2430102… SILVIA M… S-1 HUK…    90   105   201   396 P/L      
 7     7 2430102… WIDYA PU… S-1 HUK…    90   105   196   391 P/L      
 8     8 2430102… RHEA ART… S-1 HUK…    95   110   184   389 P/L      
 9     9 2430102… DICHO SI… S-1 HUK…    90   100   192   382 P/L      
10    10 2430102… FARADITA… S-1 HUK…    85   110   180   375 P/L      
# ℹ 68,652 more rows
# ℹ 5 more variables: jp_code <chr>, loc_code <chr>, type_code <chr>,
#   allotment <int>, page_num <int>

Tahap pembersihan data selanjutnya adalah menyeregamkan data NULL. Di dataset ini, data kosong diisi dengan NULL atau NA (system default R). Data poin NULL harus diganti menjadi NA (system default R) sehingga menjadi seragam.

Show code

hasil_skd_standardized_null <- hasil_skd_no_dupl %>% 
  mutate(across(where(is.character), ~ str_replace_all(.x, "^NULL$", NA_character_)))

hasil_skd_standardized_null

# A tibble: 68,662 × 14
    rank id       full_name last_edu   twk   tiu   tkp   skd decl_code
   <dbl> <chr>    <chr>     <chr>    <int> <int> <int> <int> <chr>    
 1     1 2430102… ANITA VE… S-1 HUK…   115   120   195   430 P/L      
 2     2 2430102… AISYAH S… S-1 HUK…   100   120   196   416 P/L      
 3     3 2430102… DYAH AYU… S-1 HUK…    85   135   191   411 P/L      
 4     4 2430102… MUHAMMAD… S-1 HUK…    85   115   199   399 P/L      
 5     5 2430102… EDO DWI … S-1 HUK…    90   115   193   398 P/L      
 6     6 2430102… SILVIA M… S-1 HUK…    90   105   201   396 P/L      
 7     7 2430102… WIDYA PU… S-1 HUK…    90   105   196   391 P/L      
 8     8 2430102… RHEA ART… S-1 HUK…    95   110   184   389 P/L      
 9     9 2430102… DICHO SI… S-1 HUK…    90   100   192   382 P/L      
10    10 2430102… FARADITA… S-1 HUK…    85   110   180   375 P/L      
# ℹ 68,652 more rows
# ℹ 5 more variables: jp_code <chr>, loc_code <chr>, type_code <chr>,
#   allotment <int>, page_num <int>

Setelah standarisasi data kosong (NULL/NA), langkah selanjutnya adalah melakukan pengisian data kosong. Pada baris data ke 19 sampai 75, banyak data (jp_code, loc_code, type_code, allotment) yang kosong karena proses impor data yang kurang akurat dan presisi. Untuk mengisi kekosongan data ini, saya menggunakan forward filling dengan kondisi sebagai berikut:

IF page_num == page_num | page_num == page_num + 1 THEN forward fill ELSE do nothing

Show code

hasil_skd_forward_fill <- hasil_skd_standardized_null %>% 
  mutate(breakk = !(page_num == lag(page_num) | page_num == lag(page_num) + 1),
         group_id = cumsum(replace_na(breakk, TRUE))) %>%
  group_by(group_id) %>% 
  fill(c(jp_code, loc_code, type_code, allotment), .direction = "down") %>% 
  ungroup() %>% 
  select(-breakk, -group_id)

hasil_skd_forward_fill

# A tibble: 68,662 × 14
    rank id       full_name last_edu   twk   tiu   tkp   skd decl_code
   <dbl> <chr>    <chr>     <chr>    <int> <int> <int> <int> <chr>    
 1     1 2430102… ANITA VE… S-1 HUK…   115   120   195   430 P/L      
 2     2 2430102… AISYAH S… S-1 HUK…   100   120   196   416 P/L      
 3     3 2430102… DYAH AYU… S-1 HUK…    85   135   191   411 P/L      
 4     4 2430102… MUHAMMAD… S-1 HUK…    85   115   199   399 P/L      
 5     5 2430102… EDO DWI … S-1 HUK…    90   115   193   398 P/L      
 6     6 2430102… SILVIA M… S-1 HUK…    90   105   201   396 P/L      
 7     7 2430102… WIDYA PU… S-1 HUK…    90   105   196   391 P/L      
 8     8 2430102… RHEA ART… S-1 HUK…    95   110   184   389 P/L      
 9     9 2430102… DICHO SI… S-1 HUK…    90   100   192   382 P/L      
10    10 2430102… FARADITA… S-1 HUK…    85   110   180   375 P/L      
# ℹ 68,652 more rows
# ℹ 5 more variables: jp_code <chr>, loc_code <chr>, type_code <chr>,
#   allotment <int>, page_num <int>

Kolom twk, tiu, tkp, dan skd tidak diterapkan forward filling ini karena data kosong di kolom tersebut menandakan peserta yang tidak hadir dalam tes CPNS sehingga tidak ada nilai yang terekam. WAlau begitu, nilai NA pada 4 kolom tersebut akan digantikan dengan dengan nilai 0 alih-alih NA.

Show code

hasil_skd_na2zero <- hasil_skd_forward_fill %>% 
  replace_na(list(twk = 0L,
                  tiu = 0L,
                  tkp = 0L,
                  skd = 0L))

hasil_skd_na2zero

# A tibble: 68,662 × 14
    rank id       full_name last_edu   twk   tiu   tkp   skd decl_code
   <dbl> <chr>    <chr>     <chr>    <int> <int> <int> <int> <chr>    
 1     1 2430102… ANITA VE… S-1 HUK…   115   120   195   430 P/L      
 2     2 2430102… AISYAH S… S-1 HUK…   100   120   196   416 P/L      
 3     3 2430102… DYAH AYU… S-1 HUK…    85   135   191   411 P/L      
 4     4 2430102… MUHAMMAD… S-1 HUK…    85   115   199   399 P/L      
 5     5 2430102… EDO DWI … S-1 HUK…    90   115   193   398 P/L      
 6     6 2430102… SILVIA M… S-1 HUK…    90   105   201   396 P/L      
 7     7 2430102… WIDYA PU… S-1 HUK…    90   105   196   391 P/L      
 8     8 2430102… RHEA ART… S-1 HUK…    95   110   184   389 P/L      
 9     9 2430102… DICHO SI… S-1 HUK…    90   100   192   382 P/L      
10    10 2430102… FARADITA… S-1 HUK…    85   110   180   375 P/L      
# ℹ 68,652 more rows
# ℹ 5 more variables: jp_code <chr>, loc_code <chr>, type_code <chr>,
#   allotment <int>, page_num <int>

Show code

summary(hasil_skd_na2zero)

      rank           id             full_name        
 Min.   :   1   Length:68662       Length:68662      
 1st Qu.:   5   Class :character   Class :character  
 Median :  18   Mode  :character   Mode  :character  
 Mean   : 123                                        
 3rd Qu.:  98                                        
 Max.   :1879                                        
 NA's   :1                                           
   last_edu              twk              tiu              tkp       
 Length:68662       Min.   :  0.00   Min.   :  0.00   Min.   :  0.0  
 Class :character   1st Qu.: 55.00   1st Qu.: 60.00   1st Qu.:172.0  
 Mode  :character   Median : 70.00   Median : 85.00   Median :183.0  
                    Mean   : 66.93   Mean   : 80.78   Mean   :167.6  
                    3rd Qu.: 85.00   3rd Qu.:105.00   3rd Qu.:190.0  
                    Max.   :140.00   Max.   :175.00   Max.   :218.0  
                                                                     
      skd         decl_code           jp_code         
 Min.   :  0.0   Length:68662       Length:68662      
 1st Qu.:299.0   Class :character   Class :character  
 Median :338.0   Mode  :character   Mode  :character  
 Mean   :315.3                                        
 3rd Qu.:372.0                                        
 Max.   :499.0                                        
                                                      
   loc_code          type_code           allotment     
 Length:68662       Length:68662       Min.   : 1.000  
 Class :character   Class :character   1st Qu.: 2.000  
 Mode  :character   Mode  :character   Median : 3.000  
                                       Mean   : 5.462  
                                       3rd Qu.: 5.000  
                                       Max.   :91.000  
                                       NA's   :1       
    page_num    
 Min.   :    4  
 1st Qu.: 8246  
 Median :13977  
 Mean   :12104  
 3rd Qu.:16360  
 Max.   :17798  
 NA's   :1

Show code

which(is.na(hasil_skd_na2zero$rank))

[1] 68662

Dataset SKB

Setelah membersihkan dataset SKD, selanjutnya adalah pembersihan dataset SKB. Prosedur pembersihan ini mirip dengan prosedur pembersihan data SKD pada bagian sebelumnya. Diawali dengan pengecekan secara umum tentang dataset SKB.

Show code

hasil_skb

# A tibble: 14,989 × 21
    rank id      birthdate  last_edu edu_group   gpa   twk   tiu   tkp
   <dbl> <chr>   <date>     <chr>    <chr>     <dbl> <dbl> <dbl> <dbl>
 1     1 243010… 1997-05-26 S-1 HUK… Universi…  2.92    85   135   191
 2     2 243010… 1997-03-17 S-1 HUK… Universi…  3.87    95   110   184
 3     3 243010… 2003-04-20 S-1 HUK… Universi…  3.93   100   120   196
 4     4 243010… 2001-10-12 S-1 HUK… Universi…  3.78    90   105   201
 5     5 243010… 2001-07-26 S-1 HUK… Universi…  3.84    90   100   192
 6     6 243010… 1996-05-03 S-1 HUK… Universi…  3.26    70    90   178
 7     7 243010… 2000-01-01 S-1 HUK… Universi…  3.74    85   115   199
 8     8 243010… 2001-11-23 S-1 HUK… Universi…  3.84    80   100   182
 9     9 243010… 1993-03-29 S-1 HUK… Universi…  3.8     85   110   180
10    10 243010… 1994-09-19 S-1 HUK… Universi…  3.66    80   100   177
# ℹ 14,979 more rows
# ℹ 12 more variables: skd <dbl>, skd40 <dbl>, skb <dbl>,
#   skb60 <dbl>, final_score <dbl>, decl_code <chr>, jp_code <chr>,
#   loc_code <chr>, type_code <chr>, edu_qual <chr>,
#   num_edu_qual <chr>, page_num <dbl>

Show code

sum(duplicated(hasil_skb$id))

[1] 0

Tidak tampak data duplikat pada dataset SKB. Namun begitu, kolom jp_code, loc_code, type_code, edu_qual, dan num_edu_qual memiliki data NULL yang tidak konsisten dengan nilai kosong system default R. Maka dari itu, penyeragaman perlu dilakukan untuk standarisasi nilai kosong.

Show code

hasil_skb_standardized_nulls <- hasil_skb %>% 
  mutate(across(where(is.character), ~ str_replace_all(.x, "^NULL$", NA_character_)))

hasil_skb_standardized_nulls

# A tibble: 14,989 × 21
    rank id      birthdate  last_edu edu_group   gpa   twk   tiu   tkp
   <dbl> <chr>   <date>     <chr>    <chr>     <dbl> <dbl> <dbl> <dbl>
 1     1 243010… 1997-05-26 S-1 HUK… Universi…  2.92    85   135   191
 2     2 243010… 1997-03-17 S-1 HUK… Universi…  3.87    95   110   184
 3     3 243010… 2003-04-20 S-1 HUK… Universi…  3.93   100   120   196
 4     4 243010… 2001-10-12 S-1 HUK… Universi…  3.78    90   105   201
 5     5 243010… 2001-07-26 S-1 HUK… Universi…  3.84    90   100   192
 6     6 243010… 1996-05-03 S-1 HUK… Universi…  3.26    70    90   178
 7     7 243010… 2000-01-01 S-1 HUK… Universi…  3.74    85   115   199
 8     8 243010… 2001-11-23 S-1 HUK… Universi…  3.84    80   100   182
 9     9 243010… 1993-03-29 S-1 HUK… Universi…  3.8     85   110   180
10    10 243010… 1994-09-19 S-1 HUK… Universi…  3.66    80   100   177
# ℹ 14,979 more rows
# ℹ 12 more variables: skd <dbl>, skd40 <dbl>, skb <dbl>,
#   skb60 <dbl>, final_score <dbl>, decl_code <chr>, jp_code <chr>,
#   loc_code <chr>, type_code <chr>, edu_qual <chr>,
#   num_edu_qual <chr>, page_num <dbl>

Show code

hasil_skb_forward_fill <- hasil_skb_standardized_nulls %>% 
  mutate(breakk = !(page_num == lag(page_num) | page_num == lag(page_num) + 1),
         group_id = cumsum(replace_na(breakk, TRUE))) %>%
  group_by(group_id) %>% 
  fill(c(jp_code, loc_code, type_code, edu_qual, num_edu_qual), .direction = "down") %>% 
  ungroup() %>% 
  select(-breakk, -group_id)

hasil_skb_forward_fill

# A tibble: 14,989 × 21
    rank id      birthdate  last_edu edu_group   gpa   twk   tiu   tkp
   <dbl> <chr>   <date>     <chr>    <chr>     <dbl> <dbl> <dbl> <dbl>
 1     1 243010… 1997-05-26 S-1 HUK… Universi…  2.92    85   135   191
 2     2 243010… 1997-03-17 S-1 HUK… Universi…  3.87    95   110   184
 3     3 243010… 2003-04-20 S-1 HUK… Universi…  3.93   100   120   196
 4     4 243010… 2001-10-12 S-1 HUK… Universi…  3.78    90   105   201
 5     5 243010… 2001-07-26 S-1 HUK… Universi…  3.84    90   100   192
 6     6 243010… 1996-05-03 S-1 HUK… Universi…  3.26    70    90   178
 7     7 243010… 2000-01-01 S-1 HUK… Universi…  3.74    85   115   199
 8     8 243010… 2001-11-23 S-1 HUK… Universi…  3.84    80   100   182
 9     9 243010… 1993-03-29 S-1 HUK… Universi…  3.8     85   110   180
10    10 243010… 1994-09-19 S-1 HUK… Universi…  3.66    80   100   177
# ℹ 14,979 more rows
# ℹ 12 more variables: skd <dbl>, skd40 <dbl>, skb <dbl>,
#   skb60 <dbl>, final_score <dbl>, decl_code <chr>, jp_code <chr>,
#   loc_code <chr>, type_code <chr>, edu_qual <chr>,
#   num_edu_qual <chr>, page_num <dbl>

Dataset Lokasi Formasi

Show code

lokasi_cleaning1 <- lokasi_formasi %>% 
  # Hapus noise "... KEMENTERIAN ..." di dalam data
  mutate(across(c(data1:data6), ~ str_remove(.x, "\\s\\d+\\sKEMENTERIAN.*")))

# Locate data point berdasarkan keywords lalu salin ke kolom baru "instansi"
keywords_instansi <- c("Universitas", "Sekretariat", 
                       "Direktorat", "Institut", 
                       "Politeknik", "Kantor", 
                       "Balai Bahasa Provinsi", "Pusat",
                       "Akademi", "Inspektorat")
pattern_instansi <- paste0("^(", paste(keywords_instansi, collapse = "|"), ")")

lokasi_cleaning1$instansi <- apply(lokasi_cleaning1[c("data1", "data2", "data3", "data4", "data5", "data6")],
                                   1, 
                                   function(row) {
                                     match <- grep(pattern_instansi, 
                                                   row, 
                                                   value = TRUE,
                                                   ignore.case = TRUE)
                                     if (length(match) > 0) match[1] 
                                     else NA})

# Locate data point berdasarkan keywords lalu salin ke kolom baru "fa_bag" (fakultas atau bagian)
keywords_fa_bag <- c("Fakultas", "Badan", "Lembaga",
                     "Balai", "Program Pascasarjana",
                     "Pascasarjana", "Bagian",
                     "Wakil", "UPT", "UPA", "Biro", 
                     "Pusat Layana", "Pusat Prestasi",
                     "Pusat Data", "Unit Penunjang")
pattern_fa_bag <- paste0("^(", paste(keywords_fa_bag, collapse = "|"), ")")

lokasi_cleaning1$fa_bag <- apply(lokasi_cleaning1[c("data1", "data2", "data3", "data4", "data5", "data6")],
                                   1, 
                                   function(row) {
                                     match <- grep(pattern_fa_bag, 
                                                   row, 
                                                   value = TRUE,
                                                   ignore.case = TRUE)
                                     if (length(match) > 0) match[1] 
                                     else NA})

# Locate data point berdasarkan keywords lalu salin ke kolom baru "prodi_subbag" (program studi atau subbagian)
keywords_prodi_subbag <- c("Program Studi", "Prodi",
                           "S-1", "S1", "S2", "S-2", "S3", "S-3",
                           "D1", "D-1", "D-I", "D2", "D-2", "D-II",
                           "D3", "D-3", "D-III", "D4", "D-4", "D-IV",
                           "Jurusan S1", "Jurusan S2", "Jurusan S3",
                           "Program Studi S1", "Program Studi S2",
                           "Jurusan", "Bagian Nutrisi", "Profesi",
                           "Bagian S1", "Bagian S2", 
                           "Balai Guru Penggerak",
                           "Subbagian", "Biro Umum", "Bagian Umum",
                           "Fakultas Program Studi S1", "Biro Kepegawaian",
                           "Biro Keuangan", "Wakil Direktur", "Biro Perencanaan",
                           "Bagian Akademik", "Bagian Ilmu Hukum",
                           "Biro Sumber Daya", "Biro Hukum", "Bagian Hukum Keperdataan",
                           "Balai Pelestarian", "Penyakit Jantung",
                           "Bagian Hukum", "Bagian Produksi")
pattern_prodi_subbag <- paste0("^(", paste(keywords_prodi_subbag, collapse = "|"), ")")

lokasi_cleaning1$prodi_subbag <- apply(lokasi_cleaning1[c("data1", "data2", "data3", "data4", "data5", "data6")],
                                   1, 
                                   function(row) {
                                     match <- grep(pattern_prodi_subbag, 
                                                   row, 
                                                   value = TRUE,
                                                   ignore.case = TRUE)
                                     if (length(match) > 0) match[1] 
                                     else NA})

# Check here
# sum(is.na(lokasi_cleaning1$prodi_subbag))
# lokasi_cleaning1 %>% 
#  filter(is.na(prodi_subbag))

# Return necessary columns
lokasi_cleaning2 <- lokasi_cleaning1 %>% 
  select(loc_code, instansi:prodi_subbag)

# Remove noise dari kolom "fa_bag"
lokasi_cleaning3 <- lokasi_cleaning2 %>% 
  # Hapus noise "\\s\\d+\\d+\\s/*" di dalam data
  mutate(across(c(instansi:prodi_subbag), ~ str_remove(.x, "\\s\\d+\\d+\\s.*"))) %>% 
  distinct(loc_code, .keep_all = TRUE) %>% 
  arrange(loc_code)

lokasi_cleaning3

# A tibble: 3,362 × 4
   loc_code instansi                               fa_bag prodi_subbag
   <chr>    <chr>                                  <chr>  <chr>       
 1 30100001 Institut Seni Indonesia Denpasar       Fakul… Program Stu…
 2 30100004 Politeknik Perikanan Negeri Tual       <NA>   Jurusan Tek…
 3 30100005 Universitas Sembilanbelas November Ko… Fakul… Prodi D3 Ke…
 4 30100006 Universitas Lampung                    Fakul… Jurusan Pro…
 5 30100007 Politeknik Negeri Banyuwangi           <NA>   Jurusan Tek…
 6 30100008 Universitas Borneo Tarakan             Fakul… Jurusan S1 …
 7 30100009 Universitas Jember                     Fakul… Program Stu…
 8 30100010 Universitas Nusa Cendana               Fakul… Prodi S1 Il…
 9 30100015 Politeknik Negeri Ujung Pandang        <NA>   Jurusan Tek…
10 30100016 Politeknik Negeri Ujung Pandang        <NA>   Jurusan Adm…
# ℹ 3,352 more rows

Hasil Pembersihan Data

Data SKD dan SKB yang sudah bersih dan siap untuk dianalisa sudah direkam dan bisa dipanggil menggunakan variabel berikut:

hasil_skd_na2zero untuk data SKD

hasil_skb_forward_fill untuk data SKB

lokasi_cleaning3 untuk data lokasi formasi (prototype)

Analisis Data

Pada bagian ini, saya menjawab pertanyaan riset tidak secara berurutan seperti pada Tujuan Riset namun mengelompokkannya menjadi SKD dan SKB secara terpisah. Hal ini bertujuan untuk meningkatkan fokus bahasan dan diskusi data dan menghindari distraksi yang mungkin akan timbul apabila hasil analisis berpindah-pindah dari SKD ke SKB lalu kembali ke SKD dan diulangi terus menerus. Walau bahasan hasil tes CPNS ini tidak mengikuti kronologi di Tujuan Riset, alur analisis tetap sama dengan yang apa yang tertera.

1. Skor TWK, TIU, TKP, dan Total yang aman untuk lolos ke tahap SKB

Show code

hasil_skd_na2zero %>% 
  select(twk, tiu, tkp, skd) %>% 
  pivot_longer(cols = twk:skd,
               values_to = "skor",
               names_to = "tipe_tes") %>% 
  mutate(tipe_tes = factor(tipe_tes, levels = c("skd", "tkp", "tiu", "twk"))) %>% 
  ggplot(aes(x = skor, y = tipe_tes, fill = tipe_tes)) +
  theme_bw() +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(shape = 1,
              size = .02,
              alpha = .05) +
  labs(title = "Sebaran Nilai Masing-Masing Subtes SKD (Umum)",
       subtitle = 
         paste0("Rekomendasi capaian nilai (Q3):\n", 
           "TWK >= ", round(quantile(hasil_skd_na2zero$twk, .75)), "; ",
           "TIU >= ", round(quantile(hasil_skd_na2zero$tiu, .75)), "; ",
           "TKP >= ", round(quantile(hasil_skd_na2zero$tkp, .75)), "; ",
           "SKD >= ", round(quantile(hasil_skd_na2zero$skd, .75))
           ),
       x = "skor",
       y = "subtes") +
  theme(legend.position = "none")

2. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan FKIP untuk lolos ke tahap SKB

Show code

skd_rumpun_fkip <- hasil_skd_na2zero %>% 
  select(last_edu:skd) %>% 
  filter(str_detect(last_edu, "PENDIDIKAN"))

skd_rumpun_fkip %>% 
  select(-last_edu) %>% 
  pivot_longer(cols = twk:skd,
               names_to = "subtes",
               values_to = "skor") %>% 
  mutate(subtes = factor(subtes, 
                         levels = c("skd", "tkp", "tiu", "twk"))) %>% 
  ggplot(aes(x = skor, y = subtes, fill = subtes)) +
  theme_bw() +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = .02,
              alpha = .05) +
  theme(legend.position = "none") +
  labs(title = "Sebaran Nilai SKD rumpun FKIP",
       subtitle = paste0("Rekomendasi capaian nilai (Q3):\n", 
           "TWK >= ", round(quantile(skd_rumpun_fkip$twk, .75)), "; ",
           "TIU >= ", round(quantile(skd_rumpun_fkip$tiu, .75)), "; ",
           "TKP >= ", round(quantile(skd_rumpun_fkip$tkp, .75)), "; ",
           "SKD >= ", round(quantile(skd_rumpun_fkip$skd, .75))
           ),
       x = "skor",
       y = "subtes") +
  theme(legend.position = "none")

3. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan non-FKIP untuk lolos ke tahap SKB

Show code

skd_rumpun_non_fkip <- hasil_skd_na2zero %>% 
  select(last_edu:skd)

skd_rumpun_non_fkip %>% 
  select(-last_edu) %>% 
  pivot_longer(cols = twk:skd,
               names_to = "subtes",
               values_to = "skor") %>% 
  mutate(subtes = factor(subtes, 
                         levels = c("skd", "tkp", "tiu", "twk"))) %>% 
  ggplot(aes(x = skor, y = subtes, fill = subtes)) +
  theme_bw() +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = .02,
              alpha = .03) +
  theme(legend.position = "none") +
  labs(title = "Sebaran Nilai SKD rumpun non-FKIP",
       subtitle = paste0("Rekomendasi capaian nilai (Q3):\n", 
           "TWK >= ", round(quantile(skd_rumpun_non_fkip$twk, .75)), "; ",
           "TIU >= ", round(quantile(skd_rumpun_non_fkip$tiu, .75)), "; ",
           "TKP >= ", round(quantile(skd_rumpun_non_fkip$tkp, .75)), "; ",
           "SKD >= ", round(quantile(skd_rumpun_non_fkip$skd, .75))
           ),
       x = "skor",
       y = "subtes") +
  theme(legend.position = "none")

4. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan jurusan “Inggris” untuk lolos ke tahap SKB di jabatan formasi yang tersedia

Show code

skd_jf_ing <- hasil_skd_na2zero %>% 
  filter(str_detect(last_edu, "INGGRIS")) %>% 
  select(jp_code, twk:skd) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  replace_na(list(job_position = "PENERJEMAH BAHASA INGGRIS")) %>% 
  select(-jp_code)

median_twk_ing <- median(skd_jf_ing$twk, na.rm = TRUE)
median_tiu_ing <- median(skd_jf_ing$tiu, na.rm = TRUE)
median_tkp_ing <- median(skd_jf_ing$tkp, na.rm = TRUE)
median_skd_ing <- median(skd_jf_ing$skd, na.rm = TRUE)
n_skd_ing <- nrow(skd_jf_ing)

font_family <- "Fira Sans"

plot_subtitle_skd_ing <- glue("Komparasi dari berbagai Jabatan Formasi yang
                      tersedia untuk kualifikasi pendidikan yang berkaitan
                      dengan 'Inggris'. (n = {scales::number(n_skd_ing, big.mark = ',')})")

# TWK
skd_jf_ing %>% 
  ggplot(aes(x = twk, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "E") +
  geom_vline(xintercept = median_twk_ing,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_twk_ing + 16,
           y = 10.2,
           label = glue("Median TWK
                        {scales::number(median_twk_ing)}"),
           #family = font_family,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai TWK"),
    subtitle = plot_subtitle_skd_ing,
    x = "Skor TWK",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

Show code

# TIU
skd_jf_ing %>% 
  ggplot(aes(x = tiu, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "E") +
  geom_vline(xintercept = median_tiu_ing,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_tiu_ing + 20,
           y = 10.2,
           label = glue("Median TIU
                        {scales::number(median_tiu_ing)}"),
           #family = font_family,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai TIU"),
    subtitle = plot_subtitle_skd_ing,
    x = "Skor TIU",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

Show code

# TKP
skd_jf_ing %>% 
  ggplot(aes(x = tkp, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "E") +
  geom_vline(xintercept = median_tkp_ing,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_tkp_ing + 20,
           y = 10.2,
           label = glue("Median TKP
                        {scales::number(median_tkp_ing)}"),
           #family = font_family,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai TKP"),
    subtitle = plot_subtitle_skd_ing,
    x = "Skor TKP",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

Show code

# Skor Total SKD
skd_jf_ing %>% 
  ggplot(aes(x = skd, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "E") +
  geom_vline(xintercept = median_skd_ing,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_skd_ing + 80,
           y = 10.2,
           label = glue("Median Skor Total 
                        {scales::number(median_skd_ing)}"),
           #family = font_family,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai Skor Total"),
    subtitle = plot_subtitle_skd_ing,
    x = "Skor Total",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

5. Skor TWK, TIU, TKP, dan Total yang aman bagi pelamar Dosen jurusan “Pendidikan Bahasa Inggris” untuk lolos ke tahap SKB

Show code

skd_dosen_ing <- hasil_skd_na2zero %>% 
  select(last_edu:skd, jp_code) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(job_position, "DOSEN"),
         str_detect(last_edu, "PENDIDIKAN BAHASA INGGRIS")) %>% 
  select(-last_edu, -jp_code)


n_skd_dosen_ing <- nrow(skd_dosen_ing)

skd_dosen_ing_long <- skd_dosen_ing %>%
  pivot_longer(cols = twk:skd,
               values_to = "skor",
               names_to = "subtes") %>% 
  mutate(subtes = factor(subtes, levels = c("twk", "tiu", "tkp", "skd")))

plot_subtitle_skd_ing <- glue("Komparasi nilai untuk Jabatan Formasi Dosen (Asisten Ahli, Lektor) bagi pelamar 
                              dengan latar belakang Pendidikan Bahasa Inggris. (n = {scales::number(n_skd_dosen_ing, big.mark = ',')})
                              Rekomendasi Analis (Q3):
                              TWK >= {round(quantile(skd_dosen_ing$twk, 0.75))}; TIU >= {round(quantile(skd_dosen_ing$tiu, 0.75))}; TKP >= {round(quantile(skd_dosen_ing$tkp, 0.75))}; SKD >= {round(quantile(skd_dosen_ing$skd, 0.75))}")

# Histogram faceted
skd_dosen_ing_long %>% 
  ggplot(aes(x = skor, fill = job_position)) +
  geom_histogram(binwidth = 10, alpha = .50) +
  facet_grid(job_position ~ subtes, scale = "free_y") +
  labs(
    title = "Sebaran nilai TWK, TIU, TKP",
    subtitle = plot_subtitle_skd_ing,
    fill = "Jabatan Formasi"
  ) +
  theme_bw() +
  theme(legend.position = "none")

Show code

# Density overlap
skd_dosen_ing_long %>% 
  ggplot(aes(x = skor, fill = job_position)) +
  geom_density(alpha = .50) +
  facet_wrap(~subtes) +
  labs(
    title = "Sebaran nilai TWK, TIU, TKP",
    subtitle = plot_subtitle_skd_ing,
    fill = "Jabatan Formasi"
  ) +
  theme_bw()

6. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan jurusan “Fisika” untuk lolos ke tahap SKB di jabatan formasi yang tersedia

Show code

skd_jf_fis <- hasil_skd_na2zero %>% 
  filter(str_detect(last_edu, "FISIKA")) %>% 
  select(jp_code, twk:skd) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  #replace_na(list(job_position = "PENERJEMAH BAHASA INGGRIS")) %>% 
  select(-jp_code)

median_twk_fis <- median(skd_jf_fis$twk, na.rm = TRUE)
median_tiu_fis <- median(skd_jf_fis$tiu, na.rm = TRUE)
median_tkp_fis <- median(skd_jf_fis$tkp, na.rm = TRUE)
median_skd_fis <- median(skd_jf_fis$skd, na.rm = TRUE)
q3_twk_fis <- quantile(skd_jf_fis$twk, 3/4)
q3_tiu_fis <- quantile(skd_jf_fis$tiu, 3/4)
q3_tkp_fis <- quantile(skd_jf_fis$tkp, 3/4)
q3_skd_fis <- quantile(skd_jf_fis$skd, 3/4)
n_skd_fis <- nrow(skd_jf_fis)
plot_subtitle_skd_fis <- glue("Komparasi dari berbagai Jabatan Formasi yang
                      tersedia untuk kualifikasi pendidikan yang berkaitan
                      dengan 'Fisika'. (n = {scales::number(n_skd_fis, big.mark = ',')})")

Show code

# TWK
skd_jf_fis %>% 
  ggplot(aes(x = twk, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  geom_vline(xintercept = median_twk_fis,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_twk_fis - 2,
           y = 5,
           label = glue("Median TWK
                        {scales::number(median_twk_fis)}"),
           hjust = 1,
           size = 3) +
  geom_vline(xintercept = q3_twk_fis,
             col = "red") +
  annotate("text", 
           x = q3_twk_fis + 2,
           y = 6,
           label = glue("Q3 TWK
                        {scales::number(q3_twk_fis)}"),
           hjust = 0,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai TWK"),
    subtitle = plot_subtitle_skd_fis,
    x = "Skor TWK",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

Show code

# TIU
skd_jf_fis %>% 
  ggplot(aes(x = tiu, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  geom_vline(xintercept = median_tiu_fis,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_tiu_fis - 2,
           y = 5,
           label = glue("Median TIU
                        {scales::number(median_tiu_fis)}"),
           hjust = 1,
           size = 3) +
  geom_vline(xintercept = q3_tiu_fis,
             col = "red") +
  annotate("text", 
           x = q3_tiu_fis + 2,
           y = 6,
           label = glue("Q3 TIU
                        {scales::number(q3_tiu_fis)}"),
           hjust = 0,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai TIU"),
    subtitle = plot_subtitle_skd_fis,
    x = "Skor TIU",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

Show code

# TKP
skd_jf_fis %>% 
  ggplot(aes(x = tkp, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "E") +
  geom_vline(xintercept = median_tkp_fis,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_tkp_fis - 5,
           y = 5,
           label = glue("Median TKP
                        {scales::number(median_tkp_fis)}"),
           hjust = 1,
           size = 3) +
  geom_vline(xintercept = q3_tkp_fis,
             col = "red") +
  annotate("text", 
           x = q3_tkp_fis + 5,
           y = 6,
           label = glue("Q3 TKP
                        {scales::number(q3_tkp_fis)}"),
           hjust = 0,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai TKP"),
    subtitle = plot_subtitle_skd_fis,
    x = "Skor TKP",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

Show code

# Skor Total SKD
skd_jf_fis %>% 
  ggplot(aes(x = skd, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "E") +
  geom_vline(xintercept = median_skd_fis,
             lty = "dashed",
             col = "black") +
  annotate("text", 
           x = median_skd_fis - 10,
           y = 5,
           label = glue("Median Skor Total 
                        {scales::number(median_skd_fis)}"),
           hjust = 1,
           size = 3) +
  geom_vline(xintercept = q3_skd_fis,
             col = "red") +
  annotate("text", 
           x = q3_skd_fis + 10,
           y = 6,
           label = glue("Q3 Skor Total
                        {scales::number(q3_skd_fis)}"),
           hjust = 0,
           size = 3) +
  labs(
    title = glue("Sebaran Nilai Skor Total"),
    subtitle = plot_subtitle_skd_fis,
    x = "Skor Total SKD",
    y = "Jabatan Formasi") +
  theme_bw() +
  theme(panel.spacing = unit(0.1, "lines"),
        legend.position = "none")

7. Skor TWK, TIU, TKP, dan Total yang aman bagi pelamar Widyaiswara untuk lolos ke tahap SKB

Show code

skd_wi <- hasil_skd_na2zero %>% 
  select(last_edu:skd, jp_code) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(job_position, "WIDYAISWARA")) %>% 
  select(-last_edu, -jp_code)


n_skd_wi <- nrow(skd_wi)

skd_wi_long <- skd_wi %>%
  pivot_longer(cols = twk:skd,
               values_to = "skor",
               names_to = "subtes") %>% 
  mutate(subtes = factor(subtes, levels = c("twk", "tiu", "tkp", "skd")))

plot_subtitle_wi <- glue("Komparasi nilai untuk Jabatan Formasi Widyaiswara (n = {scales::number(n_skd_dosen_ing, big.mark = ',')})
                              Rekomendasi Analis (Q3):
                              TWK >= {round(quantile(skd_wi$twk, 0.75))}; TIU >= {round(quantile(skd_wi$tiu, 0.75))}; TKP >= {round(quantile(skd_wi$tkp, 0.75))}; SKD >= {round(quantile(skd_wi$skd, 0.75))}")

skd_wi_long %>% 
  ggplot(aes(x = skor, fill = job_position)) +
  geom_density(alpha = .50) +
  facet_wrap(~ subtes) +
  labs(
    title = "Sebaran nilai TWK, TIU, TKP",
    subtitle = plot_subtitle_wi
  ) +
  theme(legend.position = "none") +
  guides(fill = "none") +
  theme_bw()

8. Skor SKB yang aman untuk lolos SKB

Show code

q8_skb <- hasil_skb_forward_fill %>% 
  select(skb, decl_code) %>% 
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

q8_filtered_data <- hasil_skb_forward_fill %>% 
  filter(decl_code != "TH") %>% 
  select(skb)

median_skb <- median(q8_filtered_data$skb)
q3_skb <- quantile(q8_filtered_data$skb, 3/4)

n_skb_all <- q8_skb %>% 
  nrow()

q8_subtitile_plot <- glue("Komparasi skor SKB Umum (n = {scales::number(n_skb_all, big.mark = ',')})")

Show code

# Ridgeline Plot
q8_skb %>% 
  ggplot(aes(x = skb, y = decl_code, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb,
             color = "black",
             lty = "dashed") +
  annotate("text", 
           x = median_skb - 2,
           y = 5,
           label = glue("Median SKB\n {scales::number(median_skb)}"),
           hjust = 1) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb,
             color = "red") +
  annotate("text",
           x = q3_skb + 2,
           y = 6,
           label = glue("Q3 SKB\n {scales::number(q3_skb)}"),
           hjust = 0) +
  labs(title = "Distribusi Nilai SKB Umum",
       subtitle = q8_subtitile_plot,
       x = "SKB",
       y = "Status Kelulusan",
       fill = "n") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
q8_skb %>% 
  ggplot(aes(x = skb, y = decl_code, fill = decl_code)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(shape = 1,
              size = .1,
              alpha = .2) +
  theme(legend.position = "none") +
  labs(title = "Sebaran Nilai SKB Umum",
       subtitle = q8_subtitile_plot,
       x = "SKB",
       y = "Status Kelulusan") +
  guides(fill = "none") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb,
             color = "black") +
  annotate("text", 
           x = median_skb - 2, 
           y = 7,
           label = glue("Median SKB\n {scales::number(median_skb)}"),
           hjust = 1) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb,
             color = "red") +
  annotate("text", 
           x = q3_skb + 2, 
           y = 9,
           label = glue("Q3 SKB\n {scales::number(q3_skb)}"),
           hjust = 0) +
  theme_bw()

9. Skor SKB yang aman bagi lulusan FKIP untuk lolos SKB

Show code

skb_fkip <- hasil_skb_forward_fill %>% # Filterisasi lulusan FKIP
  filter(str_detect(last_edu, "PENDIDIKAN")) %>% 
  select(skb, decl_code) %>% 
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

median_skb_fkip <- median(skb_fkip$skb)
q3_skb_fkip <- quantile(skb_fkip$skb, 3/4)

n_skb_fkip <- skb_fkip %>% 
  nrow()

q9_subtitile_plot <- glue("Komparasi skor SKB lulusan FKIP (n = {scales::number(n_skb_fkip, big.mark = ',')})")

Show code

# Ridgeline Plot
ggplot(skb_fkip, aes(x = skb, 
                     y = decl_code, 
                     fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_fkip,
             color = "black",
             lty = "dashed") + 
  annotate("text", 
           x = median_skb_fkip - 2, 
           y = 5,
           hjust = 1, 
           label = glue("Median SKB\n {scales::number(median_skb_fkip)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_fkip,
             color = "red") +
  annotate("text", 
           x = q3_skb_fkip + 2, 
           y = 6, 
           hjust = 0,
           label = glue("Q3 SKB\n {scales::number(q3_skb_fkip)}")) +
  labs(title = "Sebaran Nilai SKB lulusan FKIP",
       subtitle = q9_subtitile_plot,
       x = "Skor SKB",
       y = "Status Kelulusan") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
ggplot(skb_fkip, aes(x = skb, 
                     y = decl_code, 
                     fill = decl_code)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = .1,
              alpha = .2) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_fkip,
             color = "black") + 
  annotate("text", 
           x = median_skb_fkip - 2, 
           y = 5,
           hjust = 1, 
           label = glue("Median SKB\n {scales::number(median_skb_fkip)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_fkip,
             color = "red") +
  annotate("text", 
           x = q3_skb_fkip + 2, 
           y = 6, 
           hjust = 0,
           label = glue("Q3 SKB\n {scales::number(q3_skb_fkip)}")) +
  labs(title = "Sebaran Nilai SKB lulusan FKIP",
       subtitle = q9_subtitile_plot,
       x = "Skor SKB",
       y = "Status Kelulusan") +
  guides(fill = "none") +
  theme_bw()

10. SKor SKB yang aman bagi lulusan non-FKIP untuk lolos SKB

Show code

skb_nonfkip <- hasil_skb_forward_fill %>% # Filterisasi lulusan FKIP
  filter(!str_detect(last_edu, "PENDIDIKAN")) %>% 
  select(skb, decl_code) %>% 
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

median_skb_nonfkip <- median(skb_nonfkip$skb)
q3_skb_nonfkip <- quantile(skb_nonfkip$skb, 3/4)

n_skb_nonfkip <- skb_nonfkip %>% 
  nrow()

q10_subtitle_plot <- glue("Komparasi skor SKB lulusan non-FKIP (n = {scales::number(n_skb_nonfkip, big.mark = ',')})")

Show code

# Ridgeline Plot
ggplot(skb_nonfkip, aes(x = skb, 
                     y = decl_code, 
                     fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_nonfkip,
             color = "black",
             lty = "dashed") + 
  annotate("text", 
           x = median_skb_nonfkip - 2, 
           y = 5,
           hjust = 1, 
           label = glue("Median SKB\n {scales::number(median_skb_nonfkip)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_nonfkip,
             color = "red") +
  annotate("text", 
           x = q3_skb_fkip + 2, 
           y = 6, 
           hjust = 0,
           label = glue("Q3 SKB\n {scales::number(q3_skb_nonfkip)}")) +
  labs(title = "Sebaran Nilai SKB lulusan non-FKIP",
       subtitle = q10_subtitle_plot,
       x = "Skor SKB",
       y = "Status Kelulusan") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
ggplot(skb_nonfkip, aes(x = skb, 
                     y = decl_code, 
                     fill = decl_code)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = .1,
              alpha = .2) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_nonfkip,
             color = "black") + 
  annotate("text", 
           x = median_skb_nonfkip - 2, 
           y = 7,
           hjust = 1, 
           label = glue("Median SKB\n {scales::number(median_skb_fkip)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_nonfkip,
             color = "red") +
  annotate("text", 
           x = q3_skb_nonfkip + 2, 
           y = 8, 
           hjust = 0,
           label = glue("Q3 SKB\n {scales::number(q3_skb_nonfkip)}")) +
  labs(title = "Sebaran Nilai SKB lulusan non-FKIP",
       subtitle = q10_subtitle_plot,
       x = "Skor SKB",
       y = "Status Kelulusan") +
  guides(fill = "none") +
  theme_bw()

11. Skor SKB yang aman yang aman bagi lulusan jurusan “Inggris” untuk lolos tahap SKB di jabatan formasi yang tersedia

Show code

q11_skb_ing <- hasil_skb_forward_fill %>% 
  filter(str_detect(last_edu, "INGGRIS")) %>% 
  select(skb, decl_code, jp_code) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  select(-jp_code) %>% 
  replace_na(list(job_position = "PENERJEMAH BAHASA INGGRIS")) %>% 
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

median_skb_ing <- median(q11_skb_ing$skb)
q3_skb_ing <- quantile(q11_skb_ing$skb, 3/4)

n_q11_skb_ing <- nrow(q11_skb_ing)

q11_subtitle_plot <- glue("Komparasi nilai SKB lulusan terkait 'Inggris' (n = {scales::number(n_q11_skb_ing, big.mark = ',')})")

Show code

# Ridgeline Plot
q11_skb_ing %>% 
  ggplot(aes(x = skb, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_ing,
             color = "black") +
  annotate("text",
           x = median_skb_ing - 2,
           y = 5,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_ing)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_ing,
             color = "red") +
  annotate("text", 
           x = q3_skb_ing + 2,
           y = 6,
           hjust = 0,
           label= glue("Q3 SKB\n {scales::number(q3_skb_ing)}")) +
  labs(title = "Distribusi Skor SKB Lulusan Terkait 'Inggris'",
       subtitle = q11_subtitle_plot,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
q11_skb_ing %>% 
  ggplot(aes(x = skb, y = job_position, fill = job_position)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = 1,
              alpha = .5,
              shape = 1) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_ing,
             color = "black") +
  annotate("text",
           x = median_skb_ing - 2,
           y = 7,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_ing)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_ing,
             color = "red") +
  annotate("text", 
           x = q3_skb_ing + 2,
           y = 8,
           hjust = 0,
           label= glue("Q3 SKB\n {scales::number(q3_skb_ing)}")) +
  labs(title = "Distribusi Skor SKB Lulusan Terkait 'Inggris'",
       subtitle = q11_subtitle_plot,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  guides(fill = "none") +
  theme_bw()

12. Skor SKB yang aman bagi pelamar Dosen jurusan “Inggris” untuk lolos tahap SKB

Show code

# Filter hanya posisi dosen lulusan Pendidikan Bahasa Inggris
q12_skb_dosen_ing <- hasil_skb_forward_fill %>% 
  filter(str_detect(last_edu, "INGGRIS")) %>% 
  select(skb, decl_code, jp_code) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(job_position, "DOSEN")) %>% 
  select(-jp_code) %>% 
  replace_na(list(job_position = "PENERJEMAH BAHASA INGGRIS")) %>% 
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

# Filter Dosen Asisten Ahli Pendidikan Bahasa Inggris
q12_skb_dosenaa_ing <- q12_skb_dosen_ing %>% 
  filter(str_detect(job_position, "ASISTEN")) %>%
  select(skb)
median_skb_dosenaa_ing <- median(q12_skb_dosenaa_ing$skb)
q3_skb_dosenaa_ing <- quantile(q12_skb_dosenaa_ing$skb, 3/4)

# Filter Dosen Lektor Pendidikan Bahasa Inggris
q12_skb_dosenl_ing <- q12_skb_dosen_ing %>% 
  filter(str_detect(job_position, "LEKTOR")) %>%
  select(skb)
median_skb_dosenl_ing <- median(q12_skb_dosenl_ing$skb)
q3_skb_dosenl_ing <- quantile(q12_skb_dosenl_ing$skb, 3/4)

n_q12_skb_dosenaa_ing <- nrow(q12_skb_dosenaa_ing)
n_q12_skb_dosenl_ing <- nrow(q12_skb_dosenl_ing)

q12_subtitle_plot_dosenaa <- glue("Komparasi nilai SKB (n = {scales::number(n_q12_skb_dosenaa_ing, big.mark = ',')})")
q12_subtitle_plot_dosenl <- glue("Komparasi nilai SKB (n = {scales::number(n_q12_skb_dosenl_ing, big.mark = ',')})")

Show code

# Ridgeline Plot Dosen Asisten Ahli
q12_skb_dosen_ing %>% 
  filter(str_detect(job_position, "ASISTEN")) %>%
  ggplot(aes(x = skb, y = decl_code, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_dosenaa_ing,
             color = "black") +
  annotate("text",
           x = median_skb_dosenaa_ing - 2,
           y = 5,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_dosenaa_ing)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_dosenaa_ing,
             color = "red") +
  annotate("text", 
           x = q3_skb_dosenaa_ing + 2,
           y = 6,
           hjust = 0,
           label= glue("Q3 SKB\n {scales::number(q3_skb_dosenaa_ing)}")) +
  labs(title = glue("Distribusi Skor SKB Jabatan Formasi Dosen Asisten Ahli 
       Lulusan Pendidikan Bahasa Inggris"),
       subtitle = q12_subtitle_plot_dosenaa,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
q12_skb_dosen_ing %>% 
  filter(str_detect(job_position, "ASISTEN")) %>%
  ggplot(aes(x = skb, y = decl_code, fill = decl_code)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = 1,
              alpha = .5,
              shape = 1) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_dosenaa_ing,
             color = "black") +
  annotate("text",
           x = median_skb_dosenaa_ing - 2,
           y = 7,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_dosenaa_ing)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_dosenaa_ing,
             color = "red") +
  annotate("text", 
           x = q3_skb_dosenaa_ing + 2,
           y = 8,
           hjust = 0,
           label= glue("Q3 SKB\n {scales::number(q3_skb_dosenaa_ing)}")) +
  labs(title = glue("Distribusi Skor SKB Jabatan Formasi Dosen Asisten Ahli 
       Lulusan Pendidikan Bahasa Inggris"),
       subtitle = q12_subtitle_plot_dosenaa,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  theme_bw()

Show code

# Ridgeline Plot Dosen Lektor
q12_skb_dosen_ing %>% 
  filter(str_detect(job_position, "LEKTOR")) %>%
  ggplot(aes(x = skb, y = decl_code, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_dosenl_ing,
             color = "black") +
  annotate("text",
           x = median_skb_dosenl_ing - 1,
           y = 1,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_dosenl_ing)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_dosenl_ing,
             color = "red") +
  annotate("text", 
           x = q3_skb_dosenl_ing + 1,
           y = 1,
           hjust = 0,
           label= glue("Q3 SKB\n {scales::number(q3_skb_dosenl_ing)}")) +
  labs(title = glue("Distribusi Skor SKB Jabatan Formasi Dosen Lektor 
       Lulusan Pendidikan Bahasa Inggris"),
       subtitle = q12_subtitle_plot_dosenl,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
q12_skb_dosen_ing %>% 
  filter(str_detect(job_position, "LEKTOR")) %>%
  ggplot(aes(x = skb, y = decl_code, fill = decl_code)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = 2) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_dosenl_ing,
             color = "black") +
  annotate("text",
           x = median_skb_dosenl_ing - .5,
           y = 1,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_dosenl_ing)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_dosenl_ing,
             color = "red") +
  annotate("text", 
           x = q3_skb_dosenl_ing + .5,
           y = 1,
           hjust = 0,
           label= glue("Q3 SKB\n {scales::number(q3_skb_dosenl_ing)}")) +
  labs(title = glue("Distribusi Skor SKB Jabatan Formasi Dosen Lektor 
       Lulusan Pendidikan Bahasa Inggris"),
       subtitle = q12_subtitle_plot_dosenl,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  guides(fill = "none") +
  theme_bw()

13. Skor SKB yang aman yang aman bagi lulusan jurusan “Fisika” untuk lolos tahap SKB di jabatan formasi yang tersedia

Show code

q13_skb_fis <- hasil_skb_forward_fill %>% 
  filter(str_detect(last_edu, "FISIKA")) %>% 
  select(last_edu, skb, decl_code, jp_code) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  select(-jp_code) %>% 
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

median_skb_fis <- median(q13_skb_fis$skb)
q3_skb_fis <- quantile(q13_skb_fis$skb, 3/4)

n_skb_fis <- nrow(q13_skb_fis)

q13_subtitile_plot <- glue("Komparasi skor SKB Lulusan 'Fisika' (n = {scales::number(n_skb_fis)})")

Show code

# Density Plot
q13_skb_fis %>% 
  ggplot(aes(x = skb, y = job_position, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis(option = "G") +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_fis,
             color = "black") +
  annotate("text", 
           x = median_skb_fis - 2,
           y = 5,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_fis)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_fis,
             color = "red") +
  annotate("text",
           x = q3_skb_fis + 2,
           y = 6,
           hjust = 0,
           label = glue("Q3 SKB\n {scales::number(q3_skb_fis)}")) +
  labs(title = "Distribusi skor SKB Lulusan 'Fisika'",
       subtitle = q13_subtitile_plot,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
q13_skb_fis %>% 
  ggplot(aes(x = skb, y = job_position, fill = job_position)) +
  geom_boxplot(outliers = FALSE) + 
  geom_jitter(size = .5,
              alpha = .4) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_fis,
             color = "black") +
  annotate("text", 
           x = median_skb_fis - 2,
           y = 7,
           hjust = 1,
           label = glue("Median SKB\n {scales::number(median_skb_fis)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_fis,
             color = "red") +
  annotate("text",
           x = q3_skb_fis + 2,
           y = 6,
           hjust = 0,
           label = glue("Q3 SKB\n {scales::number(q3_skb_fis)}")) +
  labs(title = "Distribusi skor SKB Lulusan 'Fisika'",
       subtitle = q13_subtitile_plot,
       x = "Skor SKB",
       y = "Jabatan Formasi") +
  guides(fill = "none") +
  theme_bw()

14. Skor SKB yang aman bagi pelamar Widyaiswara untuk lolos tahap SKB

Show code

q14_skb_wi <- hasil_skb_forward_fill %>% 
  select(skb, decl_code, jp_code) %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(job_position, "WIDYAISWARA")) %>% 
  select(-jp_code) %>%
  mutate(decl_code = factor(decl_code, levels = c("TH", "TMS-1", "TMS", "TL", "APS", "P/L-U3", "P/L-U1", "P/L-E3", "P/L-E2", "P/L-E1", "P/L")))

median_skb_wi <- median(q14_skb_wi$skb)
q3_skb_wi <- quantile(q14_skb_wi$skb, 3/4)

n_skb_wi <- nrow(q14_skb_wi)

q14_subtitle_plot <- glue("Komparasi skor SKB berdasarkan Status Kelulusan (n = {scales::number(n_skb_wi)})")

Show code

# Ridgeline Plot
q14_skb_wi %>% 
  ggplot(aes(x = skb,y = decl_code, fill = ..x..)) +
  geom_density_ridges_gradient() +
  scale_fill_viridis() +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_wi,
             color = "black") +
  annotate("text",
           x = median_skb_wi - 1,
           y = 1,
           hjust = 1,
           label = glue("Median\n {scales::number(median_skb_wi)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_wi,
             color = "red") +
  annotate("text",
           x = q3_skb_wi + 1,
           y = 3,
           hjust = 0,
           label = glue("Q3\n {scales::number(q3_skb_wi)}")) +
  labs(title = "Distribusi Skor SKB Widyaiswara",
       subtitle = q14_subtitle_plot,
       x = "Skor SKB",
       y = "Status Kelulusan") +
  theme_bw()

Show code

# Boxplot + Jitter Plot
q14_skb_wi %>% 
  ggplot(aes(x = skb,y = decl_code, fill = decl_code)) +
  geom_boxplot(outliers = FALSE) +
  geom_jitter(size = 1,
              alpha = .75,
              shape = 1) +
  # Garis vertikal median
  geom_vline(xintercept = median_skb_wi,
             color = "black") +
  annotate("text",
           x = median_skb_wi - 1,
           y = 1,
           hjust = 1,
           label = glue("Median\n {scales::number(median_skb_wi)}")) +
  # Garis vertikal Q3
  geom_vline(xintercept = q3_skb_wi,
             color = "red") +
  annotate("text",
           x = q3_skb_wi + 1,
           y = 3,
           hjust = 0,
           label = glue("Q3\n {scales::number(q3_skb_wi)}")) +
  labs(title = glue("Distribusi Skor SKB Widyaiswara"),
       subtitle = q14_subtitle_plot,
       x = "Skor SKB",
       y = "Status Kelulusan") +
  guides(fill = "none") +
  theme_bw()

15. Proporsi Kelulusan SKD masing-masing jabatan formasi

Show code

# Tabel untuk proporsi berdasarkan decl_code (status kelulusan)
piv_wider_decl_code_skd <- hasil_skd_na2zero %>% 
  select(decl_code, loc_code, jp_code) %>% 
  group_by(loc_code, jp_code, decl_code) %>% 
  mutate(decl_code = factor(as.factor(decl_code),  levels = c("P/L", "P", "TL", "TH"))) %>% 
  summarize(count = n()) %>% 
  arrange(loc_code, jp_code, decl_code) %>% 
  pivot_wider(names_from = decl_code,
              values_from = count)

# Replace NA values dengan 0 (integer) dan buat kolom baru "total"
n_status_kelulusan_skd <- piv_wider_decl_code_skd %>% 
  mutate(across(where(is.numeric), ~replace_na(.x, 0))) %>% 
  mutate(n_total = rowSums(across(c("P/L", "TL", "TH", "P")))) %>% 
  select(-`NA`) %>% 
  ungroup() %>% 
  left_join(lokasi_cleaning3, by = "loc_code") %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  select(-jp_code, -loc_code)

proporsi_status_kelulusan_skd <- n_status_kelulusan_skd %>% 
  mutate(`P/L` = round(`P/L` / n_total * 100, 2),
         TL = round(TL / n_total * 100, 2),
         TH = round(TH / n_total * 100, 2),
         P = round(P / n_total * 100, 2)) %>% 
  arrange(desc(n_total))

n_status_kelulusan_skd

# A tibble: 3,421 × 9
   `P/L`    TL    TH     P n_total instansi        fa_bag prodi_subbag
   <int> <int> <int> <int>   <dbl> <chr>           <chr>  <chr>       
 1     3    10     0     0      13 Institut Seni … Fakul… Program Stu…
 2     1     5     0     0       6 Politeknik Per… <NA>   Jurusan Tek…
 3     0     1     0     0       1 Universitas Se… Fakul… Prodi D3 Ke…
 4     2     0     0     0       2 Universitas La… Fakul… Jurusan Pro…
 5     1     2     1     0       4 Politeknik Neg… <NA>   Jurusan Tek…
 6     3     2     0     0       5 Universitas Nu… Fakul… Prodi S1 Il…
 7     1     1     0     0       2 Politeknik Neg… <NA>   Jurusan Adm…
 8     2     1     0     0       3 Politeknik Neg… <NA>   Jurusan Tek…
 9     1     2     2     0       5 Politeknik Neg… <NA>   Jurusan Tek…
10     3     2     0     0       5 Universitas Te… Unit … <NA>        
# ℹ 3,411 more rows
# ℹ 1 more variable: job_position <chr>

Show code

proporsi_status_kelulusan_skd

# A tibble: 3,421 × 9
   `P/L`    TL    TH     P n_total instansi        fa_bag prodi_subbag
   <dbl> <dbl> <dbl> <dbl>   <dbl> <chr>           <chr>  <chr>       
 1  0.48  59.7 14.6   25.3    1879 Direktorat Jen… Balai… Balai Peles…
 2  1     55.0 11.3   32.7    1198 PUSAT PERBUKUAN Badan… SUBBAGIAN T…
 3  0.76  72.4 14.8   12.1    1186 Direktorat Jen… Balai… Balai Peles…
 4  0.83  50.0 11.7   37.5    1089 Universitas Ne… Biro … Biro Umum d…
 5 10.1   48.2  9.46  32.2    1036 Inspektorat Je… <NA>   <NA>        
 6  1.24  63.5 16.0   19.3     964 Direktorat Jen… Bagia… Bagian Umum 
 7  0.96  68.6 11.5   19.0     934 Direktorat Jen… Balai… Balai Peles…
 8  1.06  71.8 11.1   16.1     846 Direktorat Jen… Balai… Balai Peles…
 9  2.46  46.4 11.2   39.9     812 PUSAT KURIKULU… Badan… <NA>        
10  1.12  65.4 15.2   18.2     801 Direktorat Jen… Balai… Balai Peles…
# ℹ 3,411 more rows
# ℹ 1 more variable: job_position <chr>

16. Proporsi Kelulusan SKB masing-masing jabatan formasi

17. Jabatan formasi dengan peminat paling banyak

Show code

jf_peminat_desc <- n_status_kelulusan_skd %>% 
  select(-instansi, -fa_bag, -prodi_subbag) %>% 
  group_by(job_position) %>% 
  summarize(`P/L` = sum(`P/L`),
            P = sum(P),
            TL = sum(TL),
            TH = sum(TH),
            n_total = sum(n_total)) %>% 
  arrange(desc(n_total))

jf_peminat_desc

# A tibble: 47 × 6
   job_position                        `P/L`     P    TL    TH n_total
   <chr>                               <int> <int> <int> <int>   <dbl>
 1 DOSEN ASISTEN AHLI                  10444  5161 11189  1410   28204
 2 POLISI KHUSUS CAGAR BUDAYA            129  1424  5227  1067    7847
 3 ARSIPARIS AHLI PERTAMA                346  1928  3587   558    6419
 4 PRANATA LABORATORIUM PENDIDIKAN AH…   837  1924  2477   438    5676
 5 PENYULUH BAHASA                       114   864  1786   215    2979
 6 PRANATA LABORATORIUM PENDIDIKAN TE…   621   601  1287   245    2754
 7 WIDYAISWARA AHLI PERTAMA              201   833   774    83    1891
 8 EDITOR BUKU                            15   460   702   146    1323
 9 <NA>                                   62   442   466    75    1045
10 AUDITOR AHLI PERTAMA                  105   334   499    98    1036
# ℹ 37 more rows

18. Jabatan formasi dengan peminat paling sedikit

Show code

jf_peminat_asc <- n_status_kelulusan_skd %>% 
  select(-instansi, -fa_bag, -prodi_subbag) %>% 
  group_by(job_position) %>% 
  summarize(`P/L` = sum(`P/L`),
            P = sum(P),
            TL = sum(TL),
            TH = sum(TH),
            n_total = sum(n_total)) %>% 
  arrange(n_total)

jf_peminat_asc

# A tibble: 47 × 6
   job_position                        `P/L`     P    TL    TH n_total
   <chr>                               <int> <int> <int> <int>   <dbl>
 1 DOKUMENTALIS HUKUM                      0     0     1     0       1
 2 PRANATA HUBUNGAN MASYARAKAT TERAMP…     3     0     7     1      11
 3 PENATA KELOLA HUKUM DAN PERUNDANG-…     6     0     6     4      16
 4 PERANCANG PERATURAN PERUNDANG-UNDA…    10     0     9     3      22
 5 STATISTISI AHLI PERTAMA                13     7    14     4      38
 6 ANALIS PENGEMBANGAN KOMPETENSI ASN…     9     9    30     6      54
 7 PENGEMBANG BUKU ELEKTRONIK              6     8    35     6      55
 8 REGISTRAR                              15     0    32     8      55
 9 EDUKATOR                                6    16    27     8      57
10 ASISTEN PERPUSTAKAAN TERAMPIL          24     0    35     2      61
# ℹ 37 more rows

19. Instansi yang paling banyak diminati

Show code

instansi_peminat_desc <- n_status_kelulusan_skd %>% 
  select(-job_position, -fa_bag, -prodi_subbag) %>% 
  group_by(instansi) %>% 
  summarize(`P/L` = sum(`P/L`),
            P = sum(P),
            TL = sum(TL),
            TH = sum(TH),
            n_total = sum(n_total)) %>% 
  arrange(desc(n_total))

instansi_peminat_desc

# A tibble: 190 × 6
   instansi                            `P/L`     P    TL    TH n_total
   <chr>                               <int> <int> <int> <int>   <dbl>
 1 Direktorat Jenderal Kebudayaan        471  1875  6514  1349   10209
 2 Universitas Negeri Jakarta            434  1289  1719   395    3837
 3 Universitas Negeri Makassar           874   621  1501   145    3141
 4 Universitas Sriwijaya                 639   653  1080   117    2489
 5 Universitas Jambi                     389   576  1233   120    2318
 6 Universitas Lampung                   392   712   877   104    2085
 7 Direktorat Jenderal Guru dan Tenag…   216   766   874    81    1937
 8 PUSAT PERBUKUAN                        34   519   909   179    1641
 9 Sekretariat Jenderal                  287   327   746   157    1517
10 Universitas Riau                      446   335   548    72    1401
# ℹ 180 more rows

20. Instansi yang paling sedikit diminati

Show code

instansi_peminat_asc <- n_status_kelulusan_skd %>% 
  select(-job_position, -fa_bag, -prodi_subbag) %>% 
  group_by(instansi) %>% 
  summarize(`P/L` = sum(`P/L`),
            P = sum(P),
            TL = sum(TL),
            TH = sum(TH),
            n_total = sum(n_total)) %>% 
  arrange(n_total)

instansi_peminat_asc

# A tibble: 190 × 6
   instansi                            `P/L`     P    TL    TH n_total
   <chr>                               <int> <int> <int> <int>   <dbl>
 1 Institut Seni Indonesia Padang Par…     0     0     1     0       1
 2 Institut Seni Indonesia Padang Pen…     0     0     1     0       1
 3 Politeknik Elektronika Negeri dan …     0     0     1     0       1
 4 Politeknik Manufaktur Negeri Manuf…     1     0     0     0       1
 5 Politeknik Pertanian Negeri Produk…     0     0     1     0       1
 6 Universitas Sultan Ageng Bisnis         0     0     1     0       1
 7 Institut Seni Indonesia Padang Kom…     1     0     1     0       2
 8 Institut Seni Indonesia Padang Mas…     0     0     2     0       2
 9 Institut Seni Indonesia Padang Sen…     0     0     2     0       2
10 Politeknik Manufaktur Negeri Manuf…     1     0     1     0       2
# ℹ 180 more rows

21. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Bahasa Inggris dan jabatan formasi adalah Dosen Asisten Ahli

\(P(Lulus \space CPNS \space | \space S-2 \space Pendidikan Bahasa Inggris \space \cap \space Dosen Asisten Ahli)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq21 <- "S-2 PENDIDIKAN BAHASA INGGRIS"
formasi_dilamar_rq21 <- "DOSEN ASISTEN AHLI"
status_lulus <- c("P/L", "P/L-E1", "P/L-U1", "P/L-E2", "P/L-E3", "P/L-U3")

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Bahasa Inggris dan melamar pada jabatan formasi Dosen Asisten Ahli
n_pbing_daa <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq21),
         job_position == formasi_dilamar_rq21) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Bahasa Inggris, melamar pada jabatan formasi Dosen Asisten Ahli, dan lulus CPNS
n_pbing_daa_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq21),
         job_position == formasi_dilamar_rq21,
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq21 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq21}, dan
     2. Melamar di jabatan formasi {formasi_dilamar_rq21}
     adalah {round(n_pbing_daa_lulus / n_pbing_daa * 100, 2)} %")

rq21

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN BAHASA INGGRIS, dan
2. Melamar di jabatan formasi DOSEN ASISTEN AHLI
adalah 5.51 %

22. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-3 Pendidikan Bahasa Inggris dan jabatan formasi adalah Dosen Lektor

\(P(Lulus \space CPNS \space | \space S-3 Pendidikan Bahasa Inggris \space \cap \space Dosen Lektor)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq22 <- "S-3 PENDIDIKAN BAHASA INGGRIS"
formasi_dilamar_dl <- "DOSEN LEKTOR"

# Pool peserta CPNS dengan kriteria S-3 Pendidikan Bahasa Inggris dan melamar pada jabatan formasi Dosen Lektor
n_pbing_dl <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq22),
         job_position == formasi_dilamar_dl) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-3 Pendidikan Bahasa Inggris, melamar pada jabatan formasi Dosen Lektor, dan lulus CPNS
n_pbing_dl_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq22),
         job_position == formasi_dilamar_dl,
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq22 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq22}, dan
     2. Melamar di jabatan formasi {formasi_dilamar_dl}
     adalah {round(n_pbing_dl_lulus / n_pbing_dl * 100, 2)} %")

rq22

Peluang lulus CPNS bagi:
1. lulusan S-3 PENDIDIKAN BAHASA INGGRIS, dan
2. Melamar di jabatan formasi DOSEN LEKTOR
adalah 55.56 %

23. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Bahasa Inggris dan jabatan formasi Widyaiswara

\(P(Lulus \space CPNS \space | \space S-2 Pendidikan Bahasa Inggris \space \cap \space Widyaiswara)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq23 <- "S-2 PENDIDIKAN BAHASA INGGRIS"
formasi_dilamar_rq23 <- "JF0010904"

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Bahasa Inggris dan melamar pada jabatan formasi Widyaiswara
n_pbing_wi <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq23),
         jp_code == formasi_dilamar_rq23) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Bahasa Inggris, melamar pada jabatan formasi Dosen Asisten Ahli, dan lulus CPNS
n_pbing_wi_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq23),
         jp_code == formasi_dilamar_rq23,
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq23 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq23}, dan
     2. Melamar di jabatan formasi WIDYAISWARA AHLI PERTAMA
     adalah {round(n_pbing_wi_lulus / n_pbing_wi * 100, 2)} %")

rq23

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN BAHASA INGGRIS, dan
2. Melamar di jabatan formasi WIDYAISWARA AHLI PERTAMA
adalah 3.06 %

24. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Bahasa Inggris

\(P(Lulus \space CPNS \space | \space S-2 Pendidikan Bahasa Inggris)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq24 <- "S-2 PENDIDIKAN BAHASA INGGRIS"

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Bahasa Inggris
n_pbing_all <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq24)) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Bahasa Inggris dan lulus CPNS
n_pbing_all_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq24),
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq24 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq24}
     adalah {round(n_pbing_all_lulus / n_pbing_all * 100, 2)} %")

rq24

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN BAHASA INGGRIS
adalah 5.21 %

25. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Fisika dan jabatan formasi adalah Dosen Asisten Ahli

\(P(Lulus \space CPNS \space | \space S-2 Pendidikan Fisika \space \cap \space Dosen Asisten Ahli)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq25 <- "S-2 PENDIDIKAN FISIKA"
formasi_dilamar_rq25 <- "DOSEN ASISTEN AHLI"

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Fisika dan melamar pada jabatan formasi Dosen Asisten Ahli
n_pfis_daa <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq25),
         job_position == formasi_dilamar_rq25) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Fisika, melamar pada jabatan formasi Dosen Asisten Ahli, dan lulus CPNS
n_pfis_daa_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq25),
         job_position == formasi_dilamar_rq25,
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq25 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq25}, dan
     2. Melamar di jabatan formasi {formasi_dilamar_rq25}
     adalah {round(n_pfis_daa_lulus / n_pfis_daa * 100, 2)} %")

rq25

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN FISIKA, dan
2. Melamar di jabatan formasi DOSEN ASISTEN AHLI
adalah 9.58 %

26. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-3 Pendidikan Fisika dan jabatan formasi adalah Dosen Lektor

\(P(Lulus \space CPNS \space | \space S-3 Pendidikan Fisika \space \cap \space Dosen Lektor)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq26 <- "S-3 PENDIDIKAN FISIKA"
formasi_dilamar_rq26 <- "DOSEN LEKTOR"

# Pool peserta CPNS dengan kriteria S-3 Pendidikan Fisika dan melamar pada jabatan formasi Dosen Lektor
n_pfis_dl <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq26),
         job_position == formasi_dilamar_rq26) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Fisika, melamar pada jabatan formasi Dosen Lektor, dan lulus CPNS
n_pfis_dl_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq26),
         job_position == formasi_dilamar_rq26,
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq26 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq26}, dan
     2. Melamar di jabatan formasi {formasi_dilamar_rq26}
     adalah {round(n_pfis_dl_lulus / n_pfis_dl * 100, 2)} %")

rq26

Peluang lulus CPNS bagi:
1. lulusan S-3 PENDIDIKAN FISIKA, dan
2. Melamar di jabatan formasi DOSEN LEKTOR
adalah 66.67 %

27. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Fisika dan jabatan formasi adalah Widyaiswara

\(P(Lulus \spcae CPNS \space | \space S-2 Pendidikan Fisika \space \cap \space Widyaiswara)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq27 <- "S-2 PENDIDIKAN FISIKA"
formasi_dilamar_rq27 <- "JF0010904"

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Fisika dan melamar pada jabatan formasi Widyaiswara
n_pfis_wi <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq27),
         jp_code == formasi_dilamar_rq27) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Fisika, melamar pada jabatan formasi Widyaiswara, dan lulus CPNS
n_pfis_wi_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq27),
         jp_code == formasi_dilamar_rq27,
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq27 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq27}, dan
     2. Melamar di jabatan formasi {formasi_dilamar_rq27} / WIDYAISWARA AHLI PERTAMA
     adalah {round(n_pfis_wi_lulus / n_pfis_wi * 100, 2)} %")

rq27

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN FISIKA, dan
2. Melamar di jabatan formasi JF0010904 / WIDYAISWARA AHLI PERTAMA
adalah 4.11 %

28. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Fisika

\(P(Lulus \space CPNS \space | \space S-2 Pendidikan Fisika)\)

Show code

# Variabel untuk kondisi probabilitas
lulusan_rq28 <- "S-2 PENDIDIKAN FISIKA"

# Pool peserta CPNS dengan kriteria S-2 Pendidikan FIsika
n_pfis_all <- hasil_skd_na2zero %>% 
  left_join(jabatan_formasi, by = "jp_code") %>%
  filter(str_detect(last_edu, lulusan_rq28)) %>% 
  nrow()

# Pool peserta CPNS dengan kriteria S-2 Pendidikan Fisika dan lulus CPNS
n_pfis_all_lulus <- hasil_skb_forward_fill %>% 
  left_join(jabatan_formasi, by = "jp_code") %>% 
  filter(str_detect(last_edu, lulusan_rq28),
         decl_code %in% status_lulus) %>% 
  nrow()

# Probabilitas 
rq28 <- glue("Peluang lulus CPNS bagi:
     1. lulusan {lulusan_rq28}
     adalah {round(n_pfis_all_lulus / n_pfis_all * 100, 2)} %")

rq28

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN FISIKA
adalah 7.98 %

Show code

glue(rq21, "\n\n", rq22, "\n\n", rq23, "\n\n", rq24)

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN BAHASA INGGRIS, dan
2. Melamar di jabatan formasi DOSEN ASISTEN AHLI
adalah 5.51 %

Peluang lulus CPNS bagi:
1. lulusan S-3 PENDIDIKAN BAHASA INGGRIS, dan
2. Melamar di jabatan formasi DOSEN LEKTOR
adalah 55.56 %

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN BAHASA INGGRIS, dan
2. Melamar di jabatan formasi WIDYAISWARA AHLI PERTAMA
adalah 3.06 %

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN BAHASA INGGRIS
adalah 5.21 %

Show code

glue(rq25, "\n\n", rq26, "\n\n", rq27, "\n\n", rq28)

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN FISIKA, dan
2. Melamar di jabatan formasi DOSEN ASISTEN AHLI
adalah 9.58 %

Peluang lulus CPNS bagi:
1. lulusan S-3 PENDIDIKAN FISIKA, dan
2. Melamar di jabatan formasi DOSEN LEKTOR
adalah 66.67 %

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN FISIKA, dan
2. Melamar di jabatan formasi JF0010904 / WIDYAISWARA AHLI PERTAMA
adalah 4.11 %

Peluang lulus CPNS bagi:
1. lulusan S-2 PENDIDIKAN FISIKA
adalah 7.98 %

Penutup

Kesimpulan

Melihat kembali Pertanyaan Riset serta tujuan utama dari investigasi kali ini, sangat disarankan untuk mencapai skor sesuai dengan disarankan. Di investigasi kali ini, saya menyarankan untuk mencapai nilai SKD dan SKB minimal di batas kuartal ke-3 dari masing-masing instansi, bagian/fakultas, dan subbagian/program studi yang dilamar, dengan penekanan tinggi pada nilai SKB karena bobotnya yang lebih besar daripada skor SKD. Sebagai tambahan, perlu diingat juga bahwa CPNS ini menganut sistem ranking di level kategorisasi terkecil, yaitu subbagian/program studi. Oleh karenanya, saya juga menyarankan untuk mencari dan melamar formasi jabatan program studi/subbagian di instansi dan fakultas/bagian dengan peminat paling sedikit. Hal ini dikarenakan peluang untuk lulus CPNS di kriteria tersebut lebih tinggi dibandingkan dengan jabatan formasi lain yang populer atau banyak peminat.

Limitasi

Proyek ini (CPNS Kemendik 2024) tidaklah tanpa kekurangan. Saya menyadari banyak sekali aspek yang dapat dikembangkan lebih jauh lagi. Berikut adalah beberapa poin yang saya pikir perlu ditingkatkan:

Impor data yang lebih akurat dan presisi serta menyeluruh: Pada awalnya saya hanya merencanakan untuk menganalisa data peserta CPNS saja sehingga mengabaikan data lainnya yang ternyata tidak kalah pentingnya dalam pengambilan keputusan. Data seperti (1) detail lokasi, (2) detail jurusan yang boleh melamar di suatu formasi jabatan per subbagian, per bagian, dan per institusi, (3) tahun skor SKD, dan (4) jumlah kebutuhan di tiap formasi jabatan per subbagian, per bagian, dan per institusi. Data-data tersebut akan sangat berguna untuk proses analisis data karena bisa memberikan wawasan yang lebih komprehensif dan menyeluruh tentang tren pelamar CPNS.
Metode analisis: Saya menyadari bahwa analisis yang telah saya lakukan masih banyak aspek yang perlu ditingkatkan. Hal ini terjadi lantaran kurangnya pengetahuan saya terhadap analisis data kuantitatif. Contohnya, analisis pada investigasi ini bisa saja menggunakan sampling dan/atau bootstrap sampling untuk melakukan analisis yang lebih mendalam.
Penyajian temuan: Karena sifat dari dokumen dan investigasi ini yang cenderung formal-akademik, presentasi temuan hasil investigasi masih berfokus pada visualisasi yang minimal. Hal ini dikarenakan kurangnya pengalaman baik secara teori maupun praktikal dalam penggunaan infografis untuk penyajian hasil analisis data. Jika temuan yang didapat dipresentasikan dalam bentuk yang lebih menarik dan mudah dicerna oleh masyarakat luas, kebermanfaatan investigasi ini tentu akan jauh lebih luas dan besar dampaknya dari yang saat ini.
Bahasa pemrograman alternatif: Per tanggal pada saat investigasi ini selesai dibuat dan dipublikasikan di platform pilihan, bahasa pemrograman yang predominan digunakan adalah R. Bahasa lain seperti SQL (MySQL, PostgreSQL) dan Python memiliki proporsi yang jauh lebih sedikit. Mengingat dominasi bahasa pemrograman Python yang lebih banyak diadopsi pada saat ini, saya berpikir bahwa investigasi ini akan jauh lebih mudah untuk direplikasi.

Rekomendasi

Berkaca dari kekurangan investigasi ini, saya mengajukan beberapa rekomendasi untuk investigasi selanjutnya yang mana dapat memberikan dampak yang lebih besar dan luas. Di bawah ini adalah beberapa rekomendasi yang saya sarankan:

Data engineering: Buat script yang bisa menangkap data secara lebih menyeluruh, akurat, dan presisi.
Data analysis: Gunakan metode analisis yang lebih beragam untuk mengekstrak insight yang lebih kaya.
Data visualization: Buat infografis untuk penyajian data yang lebih ringkas namun tetap bermakna.
Flexibility: Disamping bahasa pemrograman utama, tambah bahasa pemrograman lain untuk memudahkan replikasi hasil analisis (contoh: Jupyter Notebook)

Ucapan Terima Kasih

Dari proyek/investigasi data ini, banyak sekali pihak yang mendukung saya. Mulai dari orang tua saya yang mendukung penuh arah karir saya sebagai Data Analyst/Data Scientist, teman-teman saya yang antusias terhadap hasil analisis saya. Di samping itu, saya juga sangat berterima kasih kepada DataCamp atas materi kursus yang ditawarkannya. Investigasi ini tidak mungkin eksis tanpa kursus yang ditawarkan oleh DataCamp. Satu lagi, saya juga mengucapkan terima kasih yang besar kepada Alex The Analyst karena kursus gratis beliau lah yang memercikkan api semangat analis dalam diri saya sehingga investigasi ini pun bisa terwujud. Akhir kata, saya mengucapkan banyak terima kasih kepada semua pihak yang terlibat secara aktif maupun pasif, karena dengan bantuan orang lain lah saya bisa menyelesaikan proyek/investigasi ini.

Analisis Hasil CPNS 2024 Kemendik

Abstrak

Pendahuluan

Latar Belakang

Pertanyaan Riset

Tujuan Riset

Kontribusi Riset

Sumber Data

Persiapan Data

Perkakas (Library)

Impor Data

Hasil SKD

Hasil SKB

Jabatan Formasi

Lokasi Formasi

Pembersihan Data

Dataset SKD

Dataset SKB

Dataset Lokasi Formasi

Hasil Pembersihan Data

Analisis Data

1. Skor TWK, TIU, TKP, dan Total yang aman untuk lolos ke tahap SKB

2. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan FKIP untuk lolos ke tahap SKB

3. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan non-FKIP untuk lolos ke tahap SKB

4. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan jurusan “Inggris” untuk lolos ke tahap SKB di jabatan formasi yang tersedia

5. Skor TWK, TIU, TKP, dan Total yang aman bagi pelamar Dosen jurusan “Pendidikan Bahasa Inggris” untuk lolos ke tahap SKB

6. Skor TWK, TIU, TKP, dan Total yang aman bagi lulusan jurusan “Fisika” untuk lolos ke tahap SKB di jabatan formasi yang tersedia

7. Skor TWK, TIU, TKP, dan Total yang aman bagi pelamar Widyaiswara untuk lolos ke tahap SKB

8. Skor SKB yang aman untuk lolos SKB

9. Skor SKB yang aman bagi lulusan FKIP untuk lolos SKB

10. SKor SKB yang aman bagi lulusan non-FKIP untuk lolos SKB

11. Skor SKB yang aman yang aman bagi lulusan jurusan “Inggris” untuk lolos tahap SKB di jabatan formasi yang tersedia

12. Skor SKB yang aman bagi pelamar Dosen jurusan “Inggris” untuk lolos tahap SKB

13. Skor SKB yang aman yang aman bagi lulusan jurusan “Fisika” untuk lolos tahap SKB di jabatan formasi yang tersedia

14. Skor SKB yang aman bagi pelamar Widyaiswara untuk lolos tahap SKB

15. Proporsi Kelulusan SKD masing-masing jabatan formasi

16. Proporsi Kelulusan SKB masing-masing jabatan formasi

17. Jabatan formasi dengan peminat paling banyak

18. Jabatan formasi dengan peminat paling sedikit

19. Instansi yang paling banyak diminati

20. Instansi yang paling sedikit diminati

21. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Bahasa Inggris dan jabatan formasi adalah Dosen Asisten Ahli

22. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-3 Pendidikan Bahasa Inggris dan jabatan formasi adalah Dosen Lektor

23. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Bahasa Inggris dan jabatan formasi Widyaiswara

24. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Bahasa Inggris

25. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Fisika dan jabatan formasi adalah Dosen Asisten Ahli

26. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-3 Pendidikan Fisika dan jabatan formasi adalah Dosen Lektor

27. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Fisika dan jabatan formasi adalah Widyaiswara

28. Probabilitas kelulusan PNS jika latar belakang pendidikan adalah S-2 Pendidikan Fisika

Penutup

Kesimpulan

Limitasi

Rekomendasi

Ucapan Terima Kasih