Dataset adalah istilah informal yang merujuk pada kumpulan data. Secara umum, dataset berisi lebih dari satu variabel dan menyangkut suatu topik tertentu.Selain itu,dataset juga merupakan sebuah kumpulan data yang berasal dari informasi-informasi pada masa lalu dan siap untuk dikelola menjadi sebuah informasi baru.Kumpulan data yang ada di dataset bisa di-load dari sumber data apa pun yang valid, seperti SQL Server database, Microsoft Access database, ataupun dari XML file.
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
data_huruf <-data.frame (
Prov = c("ACEH","RIAU","JAMBI","JAWA BARAT","JAWA TENGAH","DI YOGYAKARTA","JAWA TIMUR","BALI"),
Angka_melek = c(97.04 , 98.48 , 99.22 , 96.86 , 91.71 , 92.82 , 90.49 , 91.03),
stringsAsFactors = FALSE)
data_huruf
## Prov Angka_melek
## 1 ACEH 97.04
## 2 RIAU 98.48
## 3 JAMBI 99.22
## 4 JAWA BARAT 96.86
## 5 JAWA TENGAH 91.71
## 6 DI YOGYAKARTA 92.82
## 7 JAWA TIMUR 90.49
## 8 BALI 91.03
data_huruf
## Prov Angka_melek
## 1 ACEH 97.04
## 2 RIAU 98.48
## 3 JAMBI 99.22
## 4 JAWA BARAT 96.86
## 5 JAWA TENGAH 91.71
## 6 DI YOGYAKARTA 92.82
## 7 JAWA TIMUR 90.49
## 8 BALI 91.03
barplot(data_huruf$Angka_melek,type = "o", col= "darkblue" , main = "Data Angka Melek Huruf di Beberapa Provinsi")
## Warning in plot.window(xlim, ylim, log = log, ...): graphical parameter "type"
## is obsolete
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## graphical parameter "type" is obsolete
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): graphical
## parameter "type" is obsolete
data_hidup <-data.frame (
Prov = c("ACEH","RIAU","JAMBI","DKI JAKARTA","JAWA BARAT","JAWA TENGAH","DI YOGYAKARTA","BALI"),
Angka_hidup = c(69.40 , 71.73 , 69.61 , 73.56 , 68.84 , 71.97 , 73.62 , 71.20),
stringsAsFactors = FALSE)
data_hidup
## Prov Angka_hidup
## 1 ACEH 69.40
## 2 RIAU 71.73
## 3 JAMBI 69.61
## 4 DKI JAKARTA 73.56
## 5 JAWA BARAT 68.84
## 6 JAWA TENGAH 71.97
## 7 DI YOGYAKARTA 73.62
## 8 BALI 71.20
data_hidup
## Prov Angka_hidup
## 1 ACEH 69.40
## 2 RIAU 71.73
## 3 JAMBI 69.61
## 4 DKI JAKARTA 73.56
## 5 JAWA BARAT 68.84
## 6 JAWA TENGAH 71.97
## 7 DI YOGYAKARTA 73.62
## 8 BALI 71.20
barplot(data_hidup$Angka_hidup,type = "o", col= "orange", main = "Data Angka Harapan Hidup di Beberapa Provinsi ")
## Warning in plot.window(xlim, ylim, log = log, ...): graphical parameter "type"
## is obsolete
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## graphical parameter "type" is obsolete
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): graphical
## parameter "type" is obsolete
library(dplyr)
innerjoin <- data_huruf %>%
inner_join(data_hidup, by = "Prov")
innerjoin
## Prov Angka_melek Angka_hidup
## 1 ACEH 97.04 69.40
## 2 RIAU 98.48 71.73
## 3 JAMBI 99.22 69.61
## 4 JAWA BARAT 96.86 68.84
## 5 JAWA TENGAH 91.71 71.97
## 6 DI YOGYAKARTA 92.82 73.62
## 7 BALI 91.03 71.20
Leftjoins <- left_join(data_huruf,data_hidup)
## Joining, by = "Prov"
Leftjoins
## Prov Angka_melek Angka_hidup
## 1 ACEH 97.04 69.40
## 2 RIAU 98.48 71.73
## 3 JAMBI 99.22 69.61
## 4 JAWA BARAT 96.86 68.84
## 5 JAWA TENGAH 91.71 71.97
## 6 DI YOGYAKARTA 92.82 73.62
## 7 JAWA TIMUR 90.49 NA
## 8 BALI 91.03 71.20
Rightjoins <- right_join(data_huruf,data_hidup)
## Joining, by = "Prov"
Rightjoins
## Prov Angka_melek Angka_hidup
## 1 ACEH 97.04 69.40
## 2 RIAU 98.48 71.73
## 3 JAMBI 99.22 69.61
## 4 JAWA BARAT 96.86 68.84
## 5 JAWA TENGAH 91.71 71.97
## 6 DI YOGYAKARTA 92.82 73.62
## 7 BALI 91.03 71.20
## 8 DKI JAKARTA NA 73.56
fullJoins <- full_join(data_huruf,data_hidup)
## Joining, by = "Prov"
fullJoins
## Prov Angka_melek Angka_hidup
## 1 ACEH 97.04 69.40
## 2 RIAU 98.48 71.73
## 3 JAMBI 99.22 69.61
## 4 JAWA BARAT 96.86 68.84
## 5 JAWA TENGAH 91.71 71.97
## 6 DI YOGYAKARTA 92.82 73.62
## 7 JAWA TIMUR 90.49 NA
## 8 BALI 91.03 71.20
## 9 DKI JAKARTA NA 73.56
plot(innerjoin$Angka_melek,type = "o", col = "blue")
lines(innerjoin$Angka_hidup,type = "o", col = "red")
legend("top",c("Angka Melek Huruf","Angka Harapan Hidup"),fill = c("blue","red"))