Dosen Pengampu : Prof. Dr. Suhartono, M.Kom

Mata Kuliah : Linear Algebra

Prodi : Teknik Informatika

Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang”

Pengertian Data Set

Dataset adalah sebuah kumpulan data yang bersifat sebagai himpunan data yang berasal dari informasi-informasi pada masa sebelumnya dan siap untuk dikelola menjadi sebuah informasi baru dengan menggunakan teknik pembelajaran superised learning. Dimana digunakan untuk sistem prediksi sebagai acuan pendukung keputusan.Tujuan dari data set untuk menguji suatu metode penelitian yang dikembangkan oleh para pakar peneliti dengan public dataset maupun private dataset. Berikut relasional data set Jumlah Tindak Pidana Menurut kepolisian dengan Persentase penyelesaian Tindak Pidana Tahun 2020.

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Tabel Data Jumlah Tindak Pidana Menurut Kepolisian tahun 2020

data_JumlahPidana <- data.frame(
  Provinsi = c("Jawa Barat", "Jawa Tengah", "Gorontalo", "Jawa Timur", "Banten", "Bali", "Nusa Tenggara Barat", "Nusa Tenggara Timur", "Kalimantan Barat"), 
  Jumlah = c(11256.00, 10712.00, 2518.00
, 17642.00, 4250.00, 2597.00, 8591.00, 4790.00, 3858.00),
stringsAsFactors = FALSE)
data_JumlahPidana
##              Provinsi Jumlah
## 1          Jawa Barat  11256
## 2         Jawa Tengah  10712
## 3           Gorontalo   2518
## 4          Jawa Timur  17642
## 5              Banten   4250
## 6                Bali   2597
## 7 Nusa Tenggara Barat   8591
## 8 Nusa Tenggara Timur   4790
## 9    Kalimantan Barat   3858

Visualisasi Data Jumlah Tindak Pidana Menurut Kepolisian Tahun 2020

barplot(data_JumlahPidana$Jumlah, main = "Data Jumlah Tindak Pidana", col = "cadetblue")

Tabel Data Persentase Penyelesaian Tindak Pidana tahun 2020

data_PersentasePenyelesaian <- data.frame(
  Provinsi = c("Jawa Barat", "Jawa Tengah", "Jawa Timur", "Banten", "Bali", "Nusa Tenggara Barat", "Nusa Tenggara Timur", "Kalimantan Barat", "Kalimantan Selatan"), 
  Persentase = c(88.23, 36.35, 52.74, 73.08, 90.26, 49.27, 49.27, 101.94, 82.29  ),
stringsAsFactors = FALSE)
data_PersentasePenyelesaian
##              Provinsi Persentase
## 1          Jawa Barat      88.23
## 2         Jawa Tengah      36.35
## 3          Jawa Timur      52.74
## 4              Banten      73.08
## 5                Bali      90.26
## 6 Nusa Tenggara Barat      49.27
## 7 Nusa Tenggara Timur      49.27
## 8    Kalimantan Barat     101.94
## 9  Kalimantan Selatan      82.29

Visualisasi Data Persentase Penyelesaian Tindak Pindana Tahun 2020

barplot(data_PersentasePenyelesaian$Persentase, main = "Data Persentase Penyelesaian", col = "grey")

Inner Joins antara Jumlah Tindak Pidana dengan Data Persentase Penyelesaian Tindak Pidana

library(dplyr)
InnerJoins <- data_JumlahPidana %>%  
  inner_join(data_PersentasePenyelesaian, by = "Provinsi")
InnerJoins
##              Provinsi Jumlah Persentase
## 1          Jawa Barat  11256      88.23
## 2         Jawa Tengah  10712      36.35
## 3          Jawa Timur  17642      52.74
## 4              Banten   4250      73.08
## 5                Bali   2597      90.26
## 6 Nusa Tenggara Barat   8591      49.27
## 7 Nusa Tenggara Timur   4790      49.27
## 8    Kalimantan Barat   3858     101.94

Outer Joins antara Jumlah Tindak Pidana dengan Data Persentase Penyelesaian Tindak Pidana

1. A left joint

Leftjoins <- left_join(data_JumlahPidana,data_PersentasePenyelesaian)
## Joining, by = "Provinsi"
Leftjoins
##              Provinsi Jumlah Persentase
## 1          Jawa Barat  11256      88.23
## 2         Jawa Tengah  10712      36.35
## 3           Gorontalo   2518         NA
## 4          Jawa Timur  17642      52.74
## 5              Banten   4250      73.08
## 6                Bali   2597      90.26
## 7 Nusa Tenggara Barat   8591      49.27
## 8 Nusa Tenggara Timur   4790      49.27
## 9    Kalimantan Barat   3858     101.94

2. A right joint

Rightjoins <- right_join(data_JumlahPidana,data_PersentasePenyelesaian)
## Joining, by = "Provinsi"
Rightjoins
##              Provinsi Jumlah Persentase
## 1          Jawa Barat  11256      88.23
## 2         Jawa Tengah  10712      36.35
## 3          Jawa Timur  17642      52.74
## 4              Banten   4250      73.08
## 5                Bali   2597      90.26
## 6 Nusa Tenggara Barat   8591      49.27
## 7 Nusa Tenggara Timur   4790      49.27
## 8    Kalimantan Barat   3858     101.94
## 9  Kalimantan Selatan     NA      82.29

3. A full joint

fullJoins <- full_join(data_JumlahPidana,data_PersentasePenyelesaian)
## Joining, by = "Provinsi"
fullJoins 
##               Provinsi Jumlah Persentase
## 1           Jawa Barat  11256      88.23
## 2          Jawa Tengah  10712      36.35
## 3            Gorontalo   2518         NA
## 4           Jawa Timur  17642      52.74
## 5               Banten   4250      73.08
## 6                 Bali   2597      90.26
## 7  Nusa Tenggara Barat   8591      49.27
## 8  Nusa Tenggara Timur   4790      49.27
## 9     Kalimantan Barat   3858     101.94
## 10  Kalimantan Selatan     NA      82.29

Visualisasi Relasional Data Set Jumlah Tindak Pidana Menurut kepolisian dengan Persentase penyelesaian Tindak Pidana Tahun 2020

plot(InnerJoins$Jumlah,type = "o", col= "cyan")
lines(InnerJoins$Persentase, ,type = "o", col= "darkorchid")
legend("top",c("Jumlah Tindak Pidana","Persentase Penyelesaian Tindak Pidana"),fill=c("cyan", "darkorchid"))

## REFERENSI

https://www.pengalaman-edukasi.com/2020/11/apa-itu-dataset.html

https://www.bps.go.id/indicator/34/297/1/persentase-penyelesaian-tindak-pidana.html

https://www.bps.go.id/indicator/34/101/1/jumlah-tindak-pidana-menurut-kepolisian-daerah.html

https://rpubs.com/suhartono-uinmaliki/aplikasirational