Universitas : UIN MAULANA MALIK IBRAHIM MALANG
Jurusan : Teknik Informatika
Dataset adalah sebuah kumpulan data yang bersifat sebagai himpunan data yang berasal dari informasi-informasi pada masa sebelumnya dan siap untuk dikelola menjadi sebuah informasi baru dengan menggunakan teknik pembelajaran superised learning. Tujuan dari dataset adalah untuk menguji suatu metode penelitian yang dikembangkan oleh para pakar peneliti dengan public dataset maupun private dataset. Dataset sendiri tidak serta merta didapatkan dengan mudah, karena harus mempunyai tujuan yang bersifat Comparable, repetable dan veriviable. Jenis dataset sendiri harus bisa pilah agar bisa memilih sebuah metode apa yang nantinya akan digunakan untuk penelitian dengan menggunakan pembelajaran supervised learning.
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
Datalalulintas1 <- data.frame(
Tahun = c(2018, 2019, 2020, 2021),
Keterangan1 = c("Jumlah Kecelakaan"),
stringsAsFactors = FALSE)
Datalalulintas1
## Tahun Keterangan1
## 1 2018 Jumlah Kecelakaan
## 2 2019 Jumlah Kecelakaan
## 3 2020 Jumlah Kecelakaan
## 4 2021 Jumlah Kecelakaan
Hasil1 <- data.frame(
Tahun = c(2018, 2019, 2020, 2021),
jumlah1 = c(5061, 5944, 4559, 5350),
stringsAsFactors = FALSE)
Hasil1
## Tahun jumlah1
## 1 2018 5061
## 2 2019 5944
## 3 2020 4559
## 4 2021 5350
library(dplyr)
Data1 <- merge(
x = Datalalulintas1,
y = Hasil1,
by = 'Tahun',
all = TRUE
)
Data1
## Tahun Keterangan1 jumlah1
## 1 2018 Jumlah Kecelakaan 5061
## 2 2019 Jumlah Kecelakaan 5944
## 3 2020 Jumlah Kecelakaan 4559
## 4 2021 Jumlah Kecelakaan 5350
plot(Data1$jumlah1,type = "l", col= "blue")
Datalalulintas2 <- data.frame(
Tahun = c(2018, 2019, 2020, 2021),
Keterangan2 = c("Korban Meninggal Dunia"),
stringsAsFactors = FALSE)
Datalalulintas2
## Tahun Keterangan2
## 1 2018 Korban Meninggal Dunia
## 2 2019 Korban Meninggal Dunia
## 3 2020 Korban Meninggal Dunia
## 4 2021 Korban Meninggal Dunia
Hasil2 <- data.frame(
Tahun = c(2018, 2019, 2020, 2021),
jumlah2 = c(485, 419, 346, 452),
stringsAsFactors = FALSE)
Hasil2
## Tahun jumlah2
## 1 2018 485
## 2 2019 419
## 3 2020 346
## 4 2021 452
library(dplyr)
Data2 <- merge(
x = Datalalulintas2,
y = Hasil2,
by = 'Tahun',
all = TRUE
)
Data2
## Tahun Keterangan2 jumlah2
## 1 2018 Korban Meninggal Dunia 485
## 2 2019 Korban Meninggal Dunia 419
## 3 2020 Korban Meninggal Dunia 346
## 4 2021 Korban Meninggal Dunia 452
plot(Data2$jumlah2,type = "l", col= "red")
InnerJoins <- Data1 %>%
inner_join(Data2, by = "Tahun")
InnerJoins
## Tahun Keterangan1 jumlah1 Keterangan2 jumlah2
## 1 2018 Jumlah Kecelakaan 5061 Korban Meninggal Dunia 485
## 2 2019 Jumlah Kecelakaan 5944 Korban Meninggal Dunia 419
## 3 2020 Jumlah Kecelakaan 4559 Korban Meninggal Dunia 346
## 4 2021 Jumlah Kecelakaan 5350 Korban Meninggal Dunia 452
Leftjoins2 <- left_join(Data1,Data2)
## Joining, by = "Tahun"
Leftjoins2
## Tahun Keterangan1 jumlah1 Keterangan2 jumlah2
## 1 2018 Jumlah Kecelakaan 5061 Korban Meninggal Dunia 485
## 2 2019 Jumlah Kecelakaan 5944 Korban Meninggal Dunia 419
## 3 2020 Jumlah Kecelakaan 4559 Korban Meninggal Dunia 346
## 4 2021 Jumlah Kecelakaan 5350 Korban Meninggal Dunia 452
Rightjoins2 <- right_join(Data1,Data2)
## Joining, by = "Tahun"
Rightjoins2
## Tahun Keterangan1 jumlah1 Keterangan2 jumlah2
## 1 2018 Jumlah Kecelakaan 5061 Korban Meninggal Dunia 485
## 2 2019 Jumlah Kecelakaan 5944 Korban Meninggal Dunia 419
## 3 2020 Jumlah Kecelakaan 4559 Korban Meninggal Dunia 346
## 4 2021 Jumlah Kecelakaan 5350 Korban Meninggal Dunia 452
fullJoins2 <- full_join(Data1,Data2)
## Joining, by = "Tahun"
fullJoins2
## Tahun Keterangan1 jumlah1 Keterangan2 jumlah2
## 1 2018 Jumlah Kecelakaan 5061 Korban Meninggal Dunia 485
## 2 2019 Jumlah Kecelakaan 5944 Korban Meninggal Dunia 419
## 3 2020 Jumlah Kecelakaan 4559 Korban Meninggal Dunia 346
## 4 2021 Jumlah Kecelakaan 5350 Korban Meninggal Dunia 452
plot(InnerJoins$jumlah1, InnerJoins$jumlah2,type = "o", col= "brown")