Universitas : UIN MAULANA MALIK IBRAHIM MALANG

Jurusan : Teknik Informatika

Pengertian Relational Data Set

Dataset adalah sebuah kumpulan data yang bersifat sebagai himpunan data yang berasal dari informasi-informasi pada masa sebelumnya dan siap untuk dikelola menjadi sebuah informasi baru dengan menggunakan teknik pembelajaran superised learning. Tujuan dari dataset adalah untuk menguji suatu metode penelitian yang dikembangkan oleh para pakar peneliti dengan public dataset maupun private dataset. Dataset sendiri tidak serta merta didapatkan dengan mudah, karena harus mempunyai tujuan yang bersifat Comparable, repetable dan veriviable. Jenis dataset sendiri harus bisa pilah agar bisa memilih sebuah metode apa yang nantinya akan digunakan untuk penelitian dengan menggunakan pembelajaran supervised learning.

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Profil Mahasiswa UIN Malang Angkatan 21

TinggiBadan <- data.frame(
  Nama = c("Ridwan Jauhar Kafabihi", "Muhammad Addi Rizza Rahman", "Ramadhan Tri Nanda", "Adam Abiyyu Febrisyam", "Rafi Ronalda Purnama Hakim", "Nurhisam Ari Kusnaini", "Charles Iqbal Rizanta", "Mohamad Fani Dwi Setiawan", "Fuaidil Ikhrom", "An Nisa Puja Karimah", "A. Muhammad Irham DJ", "Aji Prabowo Pamungkas"), 
  TinggiBadan = c(170, 165, 163, 162, 164, 164, 161, 166, 167,160, 163, 167),
stringsAsFactors = FALSE)
TinggiBadan
##                          Nama TinggiBadan
## 1      Ridwan Jauhar Kafabihi         170
## 2  Muhammad Addi Rizza Rahman         165
## 3          Ramadhan Tri Nanda         163
## 4       Adam Abiyyu Febrisyam         162
## 5  Rafi Ronalda Purnama Hakim         164
## 6       Nurhisam Ari Kusnaini         164
## 7       Charles Iqbal Rizanta         161
## 8   Mohamad Fani Dwi Setiawan         166
## 9              Fuaidil Ikhrom         167
## 10       An Nisa Puja Karimah         160
## 11       A. Muhammad Irham DJ         163
## 12      Aji Prabowo Pamungkas         167

NIM Mahasiswa

nim <- data.frame(
  Nama = c("Ridwan Jauhar Kafabihi", "Muhammad Addi Rizza Rahman", "Ramadhan Tri Nanda", "Adam Abiyyu Febrisyam", "Rafi Ronalda Purnama Hakim", "Nurhisam Ari Kusnaini", "Charles Iqbal Rizanta", "Mohamad Fani Dwi Setiawan", "Fuaidil Ikhrom", "An Nisa Puja Karimah", "A. Muhammad Irham DJ", "Aji Prabowo Pamungkas"), 
  NIM = c(210605110069, 210605110070, 210605110071, 210605110072, 210605110073, 210605110074, 210605110075, 210605110076, 210605110077, 210605110078, 210605110079, 210605110080),
  stringsAsFactors = FALSE)
nim
##                          Nama          NIM
## 1      Ridwan Jauhar Kafabihi 210605110069
## 2  Muhammad Addi Rizza Rahman 210605110070
## 3          Ramadhan Tri Nanda 210605110071
## 4       Adam Abiyyu Febrisyam 210605110072
## 5  Rafi Ronalda Purnama Hakim 210605110073
## 6       Nurhisam Ari Kusnaini 210605110074
## 7       Charles Iqbal Rizanta 210605110075
## 8   Mohamad Fani Dwi Setiawan 210605110076
## 9              Fuaidil Ikhrom 210605110077
## 10       An Nisa Puja Karimah 210605110078
## 11       A. Muhammad Irham DJ 210605110079
## 12      Aji Prabowo Pamungkas 210605110080
library(dplyr)
Mahasiswa <- merge(
  x = nim,
  y = TinggiBadan,
  by = 'Nama',
  all = TRUE
)
Mahasiswa
##                          Nama          NIM TinggiBadan
## 1        A. Muhammad Irham DJ 210605110079         163
## 2       Adam Abiyyu Febrisyam 210605110072         162
## 3       Aji Prabowo Pamungkas 210605110080         167
## 4        An Nisa Puja Karimah 210605110078         160
## 5       Charles Iqbal Rizanta 210605110075         161
## 6              Fuaidil Ikhrom 210605110077         167
## 7   Mohamad Fani Dwi Setiawan 210605110076         166
## 8  Muhammad Addi Rizza Rahman 210605110070         165
## 9       Nurhisam Ari Kusnaini 210605110074         164
## 10 Rafi Ronalda Purnama Hakim 210605110073         164
## 11         Ramadhan Tri Nanda 210605110071         163
## 12     Ridwan Jauhar Kafabihi 210605110069         170

Berat Badan

BeratBadan <- data.frame(
  Nama = c("Ridwan Jauhar Kafabihi", "Muhammad Addi Rizza Rahman", "Ramadhan Tri Nanda", "Adam Abiyyu Febrisyam", "Rafi Ronalda Purnama Hakim", "Nurhisam Ari Kusnaini", "Charles Iqbal Rizanta", "Mohamad Fani Dwi Setiawan", "Fuaidil Ikhrom", "An Nisa Puja Karimah", "A. Muhammad Irham DJ", "Aji Prabowo Pamungkas"), 
  beratbadan = c("67", "58", "64", "62", "66", "54", "54", "60", "64", "54", "63", "64"),
stringsAsFactors = FALSE)
BeratBadan
##                          Nama beratbadan
## 1      Ridwan Jauhar Kafabihi         67
## 2  Muhammad Addi Rizza Rahman         58
## 3          Ramadhan Tri Nanda         64
## 4       Adam Abiyyu Febrisyam         62
## 5  Rafi Ronalda Purnama Hakim         66
## 6       Nurhisam Ari Kusnaini         54
## 7       Charles Iqbal Rizanta         54
## 8   Mohamad Fani Dwi Setiawan         60
## 9              Fuaidil Ikhrom         64
## 10       An Nisa Puja Karimah         54
## 11       A. Muhammad Irham DJ         63
## 12      Aji Prabowo Pamungkas         64
library(dplyr)
Mahasiswa1 <- merge(
  x = Mahasiswa,
  y = BeratBadan,
  by = 'Nama',
  all = TRUE
)
Mahasiswa1
##                          Nama          NIM TinggiBadan beratbadan
## 1        A. Muhammad Irham DJ 210605110079         163         63
## 2       Adam Abiyyu Febrisyam 210605110072         162         62
## 3       Aji Prabowo Pamungkas 210605110080         167         64
## 4        An Nisa Puja Karimah 210605110078         160         54
## 5       Charles Iqbal Rizanta 210605110075         161         54
## 6              Fuaidil Ikhrom 210605110077         167         64
## 7   Mohamad Fani Dwi Setiawan 210605110076         166         60
## 8  Muhammad Addi Rizza Rahman 210605110070         165         58
## 9       Nurhisam Ari Kusnaini 210605110074         164         54
## 10 Rafi Ronalda Purnama Hakim 210605110073         164         66
## 11         Ramadhan Tri Nanda 210605110071         163         64
## 12     Ridwan Jauhar Kafabihi 210605110069         170         67

Data Mahasiswa dengan “NIM” sebagai key dan “Nama” sebagai value

nim <- data.frame(
  Nama = c("Ridwan Jauhar Kafabihi", "Muhammad Addi Rizza Rahman", "Ramadhan Tri Nanda", "Adam Abiyyu Febrisyam", "Rafi Ronalda Purnama Hakim", "Nurhisam Ari Kusnaini", "Charles Iqbal Rizanta", "Mohamad Fani Dwi Setiawan", "Fuaidil Ikhrom", "An Nisa Puja Karimah", "A. Muhammad Irham DJ", "Aji Prabowo Pamungkas"), 
  NIM = c(210605110069, 210605110070, 210605110071, 210605110072, 210605110073, 210605110074, 210605110075, 210605110076, 210605110077, 210605110078, 210605110079, 210605110080),
  stringsAsFactors = FALSE)
nim
##                          Nama          NIM
## 1      Ridwan Jauhar Kafabihi 210605110069
## 2  Muhammad Addi Rizza Rahman 210605110070
## 3          Ramadhan Tri Nanda 210605110071
## 4       Adam Abiyyu Febrisyam 210605110072
## 5  Rafi Ronalda Purnama Hakim 210605110073
## 6       Nurhisam Ari Kusnaini 210605110074
## 7       Charles Iqbal Rizanta 210605110075
## 8   Mohamad Fani Dwi Setiawan 210605110076
## 9              Fuaidil Ikhrom 210605110077
## 10       An Nisa Puja Karimah 210605110078
## 11       A. Muhammad Irham DJ 210605110079
## 12      Aji Prabowo Pamungkas 210605110080

Penerapan Data Mahasiswa Teknik Informatika Angkatan 2021 pada inner Join

innerjoin <- Mahasiswa1 %>%
  inner_join(nim, by = "Nama")
innerjoin
##                          Nama        NIM.x TinggiBadan beratbadan        NIM.y
## 1        A. Muhammad Irham DJ 210605110079         163         63 210605110079
## 2       Adam Abiyyu Febrisyam 210605110072         162         62 210605110072
## 3       Aji Prabowo Pamungkas 210605110080         167         64 210605110080
## 4        An Nisa Puja Karimah 210605110078         160         54 210605110078
## 5       Charles Iqbal Rizanta 210605110075         161         54 210605110075
## 6              Fuaidil Ikhrom 210605110077         167         64 210605110077
## 7   Mohamad Fani Dwi Setiawan 210605110076         166         60 210605110076
## 8  Muhammad Addi Rizza Rahman 210605110070         165         58 210605110070
## 9       Nurhisam Ari Kusnaini 210605110074         164         54 210605110074
## 10 Rafi Ronalda Purnama Hakim 210605110073         164         66 210605110073
## 11         Ramadhan Tri Nanda 210605110071         163         64 210605110071
## 12     Ridwan Jauhar Kafabihi 210605110069         170         67 210605110069

Penerapan Data Mahasiswa Teknik Informatika Angkatan 2021 pada Set Outer Join

1. A left join

leftjoin <- left_join(Mahasiswa1,nim)
## Joining, by = c("Nama", "NIM")
leftjoin
##                          Nama          NIM TinggiBadan beratbadan
## 1        A. Muhammad Irham DJ 210605110079         163         63
## 2       Adam Abiyyu Febrisyam 210605110072         162         62
## 3       Aji Prabowo Pamungkas 210605110080         167         64
## 4        An Nisa Puja Karimah 210605110078         160         54
## 5       Charles Iqbal Rizanta 210605110075         161         54
## 6              Fuaidil Ikhrom 210605110077         167         64
## 7   Mohamad Fani Dwi Setiawan 210605110076         166         60
## 8  Muhammad Addi Rizza Rahman 210605110070         165         58
## 9       Nurhisam Ari Kusnaini 210605110074         164         54
## 10 Rafi Ronalda Purnama Hakim 210605110073         164         66
## 11         Ramadhan Tri Nanda 210605110071         163         64
## 12     Ridwan Jauhar Kafabihi 210605110069         170         67

2. A Right join

rightjoin <- right_join(Mahasiswa1,nim)
## Joining, by = c("Nama", "NIM")
rightjoin
##                          Nama          NIM TinggiBadan beratbadan
## 1        A. Muhammad Irham DJ 210605110079         163         63
## 2       Adam Abiyyu Febrisyam 210605110072         162         62
## 3       Aji Prabowo Pamungkas 210605110080         167         64
## 4        An Nisa Puja Karimah 210605110078         160         54
## 5       Charles Iqbal Rizanta 210605110075         161         54
## 6              Fuaidil Ikhrom 210605110077         167         64
## 7   Mohamad Fani Dwi Setiawan 210605110076         166         60
## 8  Muhammad Addi Rizza Rahman 210605110070         165         58
## 9       Nurhisam Ari Kusnaini 210605110074         164         54
## 10 Rafi Ronalda Purnama Hakim 210605110073         164         66
## 11         Ramadhan Tri Nanda 210605110071         163         64
## 12     Ridwan Jauhar Kafabihi 210605110069         170         67

3. A full join

fulljoin <- full_join(Mahasiswa1,nim)
## Joining, by = c("Nama", "NIM")
fulljoin
##                          Nama          NIM TinggiBadan beratbadan
## 1        A. Muhammad Irham DJ 210605110079         163         63
## 2       Adam Abiyyu Febrisyam 210605110072         162         62
## 3       Aji Prabowo Pamungkas 210605110080         167         64
## 4        An Nisa Puja Karimah 210605110078         160         54
## 5       Charles Iqbal Rizanta 210605110075         161         54
## 6              Fuaidil Ikhrom 210605110077         167         64
## 7   Mohamad Fani Dwi Setiawan 210605110076         166         60
## 8  Muhammad Addi Rizza Rahman 210605110070         165         58
## 9       Nurhisam Ari Kusnaini 210605110074         164         54
## 10 Rafi Ronalda Purnama Hakim 210605110073         164         66
## 11         Ramadhan Tri Nanda 210605110071         163         64
## 12     Ridwan Jauhar Kafabihi 210605110069         170         67

Refrensi

https://www.pengalaman-edukasi.com/2020/11/apa-itu-dataset.html

https://rpubs.com/suhartono-uinmaliki/relational