Universitas : UIN MAULANA MALIK IBRAHIM MALANG

Jurusan : Teknik Informatika

Pengertian Relational Data Set

Dataset adalah sebuah kumpulan data yang bersifat sebagai himpunan data yang berasal dari informasi-informasi pada masa sebelumnya dan siap untuk dikelola menjadi sebuah informasi baru dengan menggunakan teknik pembelajaran superised learning. Tujuan dari dataset adalah untuk menguji suatu metode penelitian yang dikembangkan oleh para pakar peneliti dengan public dataset maupun private dataset. Dataset sendiri tidak serta merta didapatkan dengan mudah, karena harus mempunyai tujuan yang bersifat Comparable, repetable dan veriviable. Jenis dataset sendiri harus bisa pilah agar bisa memilih sebuah metode apa yang nantinya akan digunakan untuk penelitian dengan menggunakan pembelajaran supervised learning.

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Tabel Data Jumlah Kecelakaan di Yogyakarta

Datalalulintas1 <- data.frame(
  Tahun = c(2018, 2019, 2020, 2021), 
  Keterangan1 = c("Jumlah Kecelakaan"),
stringsAsFactors = FALSE)
Datalalulintas1
##   Tahun       Keterangan1
## 1  2018 Jumlah Kecelakaan
## 2  2019 Jumlah Kecelakaan
## 3  2020 Jumlah Kecelakaan
## 4  2021 Jumlah Kecelakaan
Hasil1 <- data.frame(
  Tahun = c(2018, 2019, 2020, 2021),
  jumlah1 = c(5061, 5944, 4559, 5350),
stringsAsFactors = FALSE)
Hasil1
##   Tahun jumlah1
## 1  2018    5061
## 2  2019    5944
## 3  2020    4559
## 4  2021    5350
library(dplyr)
Data1 <- merge(
  x = Datalalulintas1,
  y = Hasil1,
  by = 'Tahun',
  all = TRUE
)
Data1
##   Tahun       Keterangan1 jumlah1
## 1  2018 Jumlah Kecelakaan    5061
## 2  2019 Jumlah Kecelakaan    5944
## 3  2020 Jumlah Kecelakaan    4559
## 4  2021 Jumlah Kecelakaan    5350

Visualisasi Data Jumlah Kecelakaan di Yogyakarta

plot(Data1$jumlah1,type = "l", col= "blue")

Tabel Data Jumlah Korban Meninggal Akibat Kecelakaan di Yogyakarta

Datalalulintas2 <- data.frame(
  Tahun = c(2018, 2019, 2020, 2021), 
  Keterangan2 = c("Korban Meninggal Dunia"),
stringsAsFactors = FALSE)
Datalalulintas2
##   Tahun            Keterangan2
## 1  2018 Korban Meninggal Dunia
## 2  2019 Korban Meninggal Dunia
## 3  2020 Korban Meninggal Dunia
## 4  2021 Korban Meninggal Dunia
Hasil2 <- data.frame(
  Tahun = c(2018, 2019, 2020, 2021),
  jumlah2 = c(485, 419, 346, 452),
stringsAsFactors = FALSE)
Hasil2
##   Tahun jumlah2
## 1  2018     485
## 2  2019     419
## 3  2020     346
## 4  2021     452
library(dplyr)
Data2 <- merge(
  x = Datalalulintas2,
  y = Hasil2,
  by = 'Tahun',
  all = TRUE
)
Data2
##   Tahun            Keterangan2 jumlah2
## 1  2018 Korban Meninggal Dunia     485
## 2  2019 Korban Meninggal Dunia     419
## 3  2020 Korban Meninggal Dunia     346
## 4  2021 Korban Meninggal Dunia     452

Visualisasi Data Jumlah Korban Meninggal Akibat Kecelakaan di Yogyakarta

plot(Data2$jumlah2,type = "l", col= "red")

Inner Joins antara Data Kecelakaan dan Jumlah Korban

InnerJoins <- Data1 %>% 
  inner_join(Data2, by = "Tahun")
InnerJoins
##   Tahun       Keterangan1 jumlah1            Keterangan2 jumlah2
## 1  2018 Jumlah Kecelakaan    5061 Korban Meninggal Dunia     485
## 2  2019 Jumlah Kecelakaan    5944 Korban Meninggal Dunia     419
## 3  2020 Jumlah Kecelakaan    4559 Korban Meninggal Dunia     346
## 4  2021 Jumlah Kecelakaan    5350 Korban Meninggal Dunia     452

Outer Joins antara Data Kecelakaan dan Jumlah Korban

1. A left joint

Leftjoins2 <- left_join(Data1,Data2)
## Joining, by = "Tahun"
Leftjoins2
##   Tahun       Keterangan1 jumlah1            Keterangan2 jumlah2
## 1  2018 Jumlah Kecelakaan    5061 Korban Meninggal Dunia     485
## 2  2019 Jumlah Kecelakaan    5944 Korban Meninggal Dunia     419
## 3  2020 Jumlah Kecelakaan    4559 Korban Meninggal Dunia     346
## 4  2021 Jumlah Kecelakaan    5350 Korban Meninggal Dunia     452

2. A right joint

Rightjoins2 <- right_join(Data1,Data2)
## Joining, by = "Tahun"
Rightjoins2
##   Tahun       Keterangan1 jumlah1            Keterangan2 jumlah2
## 1  2018 Jumlah Kecelakaan    5061 Korban Meninggal Dunia     485
## 2  2019 Jumlah Kecelakaan    5944 Korban Meninggal Dunia     419
## 3  2020 Jumlah Kecelakaan    4559 Korban Meninggal Dunia     346
## 4  2021 Jumlah Kecelakaan    5350 Korban Meninggal Dunia     452

3. A full joint

fullJoins2 <- full_join(Data1,Data2)
## Joining, by = "Tahun"
fullJoins2
##   Tahun       Keterangan1 jumlah1            Keterangan2 jumlah2
## 1  2018 Jumlah Kecelakaan    5061 Korban Meninggal Dunia     485
## 2  2019 Jumlah Kecelakaan    5944 Korban Meninggal Dunia     419
## 3  2020 Jumlah Kecelakaan    4559 Korban Meninggal Dunia     346
## 4  2021 Jumlah Kecelakaan    5350 Korban Meninggal Dunia     452

Visualisasi Relational Data Set

plot(InnerJoins$jumlah1, InnerJoins$jumlah2,type = "o", col= "brown")

Daftar Pustaka

https://www.pengalaman-edukasi.com/2020/11/apa-itu-dataset.html

https://rpubs.com/suhartono-uinmaliki/relational

http://bappeda.jogjaprov.go.id/dataku/data_dasar/cetak/548-data-kecelakaan-dan-pelanggaran-lalu-lintas