Dataset adalah istilah informal yang merujuk pada kumpulan data. Secara umum, dataset berisi lebih dari satu variabel dan menyangkut suatu topik tertentu.Selain itu,dataset juga merupakan sebuah kumpulan data yang berasal dari informasi-informasi pada masa lalu dan siap untuk dikelola menjadi sebuah informasi baru.Kumpulan data yang ada di dataset bisa di-load dari sumber data apa pun yang valid, seperti SQL Server database, Microsoft Access database, ataupun dari XML file.
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
data_murni <-data.frame (
Prov = c("JAWA BARAT","JAWA TENGAH","JAWA TIMUR","BALI","KALIMANTAN UTARA","MALUKU", "SUMATRA UTARA" , "GORONTALO"),
Angka_murni = c(58.58 , 60.46 , 62.63 , 74.82 , 65.37 , 64.71 , 67.99 , 58.21),
stringsAsFactors = FALSE)
data_murni
## Prov Angka_murni
## 1 JAWA BARAT 58.58
## 2 JAWA TENGAH 60.46
## 3 JAWA TIMUR 62.63
## 4 BALI 74.82
## 5 KALIMANTAN UTARA 65.37
## 6 MALUKU 64.71
## 7 SUMATRA UTARA 67.99
## 8 GORONTALO 58.21
data_murni
## Prov Angka_murni
## 1 JAWA BARAT 58.58
## 2 JAWA TENGAH 60.46
## 3 JAWA TIMUR 62.63
## 4 BALI 74.82
## 5 KALIMANTAN UTARA 65.37
## 6 MALUKU 64.71
## 7 SUMATRA UTARA 67.99
## 8 GORONTALO 58.21
barplot(data_murni$Angka_murni,type = "o", col= "purple" , main = "Data Angka Partisipasi Murni SMA di Beberapa Provinsi")
## Warning in plot.window(xlim, ylim, log = log, ...): graphical parameter "type"
## is obsolete
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## graphical parameter "type" is obsolete
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): graphical
## parameter "type" is obsolete
data_kasar <-data.frame (
Prov = c("JAWA BARAT","JAWA TENGAH","JAWA TIMUR","BALI","KALIMANTAN UTARA","MALUKU","PAPUA","SUMATRA UTARA"),
Angka_kasar = c(78.10 , 86.65 , 87.55 , 89.87 , 96.55 , 95.74 , 75.05 , 96.75),
stringsAsFactors = FALSE)
data_kasar
## Prov Angka_kasar
## 1 JAWA BARAT 78.10
## 2 JAWA TENGAH 86.65
## 3 JAWA TIMUR 87.55
## 4 BALI 89.87
## 5 KALIMANTAN UTARA 96.55
## 6 MALUKU 95.74
## 7 PAPUA 75.05
## 8 SUMATRA UTARA 96.75
data_kasar
## Prov Angka_kasar
## 1 JAWA BARAT 78.10
## 2 JAWA TENGAH 86.65
## 3 JAWA TIMUR 87.55
## 4 BALI 89.87
## 5 KALIMANTAN UTARA 96.55
## 6 MALUKU 95.74
## 7 PAPUA 75.05
## 8 SUMATRA UTARA 96.75
barplot(data_kasar$Angka_kasar,type = "o", col= "orange" , main = "Data Angka Partisipasi Kasar SMA di Beberapa Provinsi")
## Warning in plot.window(xlim, ylim, log = log, ...): graphical parameter "type"
## is obsolete
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## graphical parameter "type" is obsolete
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): graphical
## parameter "type" is obsolete
library(dplyr)
innerjoin <- data_murni %>%
inner_join(data_kasar, by = "Prov")
innerjoin
## Prov Angka_murni Angka_kasar
## 1 JAWA BARAT 58.58 78.10
## 2 JAWA TENGAH 60.46 86.65
## 3 JAWA TIMUR 62.63 87.55
## 4 BALI 74.82 89.87
## 5 KALIMANTAN UTARA 65.37 96.55
## 6 MALUKU 64.71 95.74
## 7 SUMATRA UTARA 67.99 96.75
Leftjoins <- left_join(data_murni,data_kasar)
## Joining, by = "Prov"
Leftjoins
## Prov Angka_murni Angka_kasar
## 1 JAWA BARAT 58.58 78.10
## 2 JAWA TENGAH 60.46 86.65
## 3 JAWA TIMUR 62.63 87.55
## 4 BALI 74.82 89.87
## 5 KALIMANTAN UTARA 65.37 96.55
## 6 MALUKU 64.71 95.74
## 7 SUMATRA UTARA 67.99 96.75
## 8 GORONTALO 58.21 NA
Rightjoins <- right_join(data_murni,data_kasar)
## Joining, by = "Prov"
Rightjoins
## Prov Angka_murni Angka_kasar
## 1 JAWA BARAT 58.58 78.10
## 2 JAWA TENGAH 60.46 86.65
## 3 JAWA TIMUR 62.63 87.55
## 4 BALI 74.82 89.87
## 5 KALIMANTAN UTARA 65.37 96.55
## 6 MALUKU 64.71 95.74
## 7 SUMATRA UTARA 67.99 96.75
## 8 PAPUA NA 75.05
fullJoins <- full_join(data_murni,data_kasar)
## Joining, by = "Prov"
fullJoins
## Prov Angka_murni Angka_kasar
## 1 JAWA BARAT 58.58 78.10
## 2 JAWA TENGAH 60.46 86.65
## 3 JAWA TIMUR 62.63 87.55
## 4 BALI 74.82 89.87
## 5 KALIMANTAN UTARA 65.37 96.55
## 6 MALUKU 64.71 95.74
## 7 SUMATRA UTARA 67.99 96.75
## 8 GORONTALO 58.21 NA
## 9 PAPUA NA 75.05
plot(innerjoin$Angka_murni,type = "o", col = "green")
lines(innerjoin$Angka_kasar,type = "o", col = "red")
legend("top",c("Angka Murni SMA","Angka Kasar SMA"),fill = c("green","red"))