Pada hari ini kita akan belajar memvisualisasikan data Anda menggunakan ggplot2. tapi sebelum membuat Visualisasi data maka kita harus menginstall ggplot2. adapun fungsi dari ggplot yaitu untuk membuat grafik, tetapi ggplot2 adalah salah satu yang paling elegan dan paling serbaguna. ggplot2 digunakan untuk mengimplementasikan tata bahasa grafik, sistem yang koheren untuk mendeskripsikan dan membangun grafik.

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.0.6     v dplyr   1.0.4
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
#Maka akan menampilkan Package yang terinstall
#> ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.0 ──
#> ✔ ggplot2 3.3.2     ✔ purrr   0.3.4
#> ✔ tibble  3.0.3     ✔ dplyr   1.0.2
#> ✔ tidyr   1.1.2     ✔ stringr 1.4.0
#> ✔ readr   1.4.0     ✔ forcats 0.5.0
#> ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
#> ✖ dplyr::filter() masks stats::filter()
#> ✖ dplyr::lag()    masks stats::lag()
install.packages("tidyverse")
## Warning: package 'tidyverse' is in use and will not be installed
library(tidyverse)

disini kita akan melakukan uji coba menggunakan data dari kumpulan variabel yang berisi pengamatan yang dikumpulkan oleh Badan Perlindungan Lingkungan AS pada 38 model mobil.

mpg
## # A tibble: 234 x 11
##    manufacturer model    displ  year   cyl trans   drv     cty   hwy fl    class
##    <chr>        <chr>    <dbl> <int> <int> <chr>   <chr> <int> <int> <chr> <chr>
##  1 audi         a4         1.8  1999     4 auto(l~ f        18    29 p     comp~
##  2 audi         a4         1.8  1999     4 manual~ f        21    29 p     comp~
##  3 audi         a4         2    2008     4 manual~ f        20    31 p     comp~
##  4 audi         a4         2    2008     4 auto(a~ f        21    30 p     comp~
##  5 audi         a4         2.8  1999     6 auto(l~ f        16    26 p     comp~
##  6 audi         a4         2.8  1999     6 manual~ f        18    26 p     comp~
##  7 audi         a4         3.1  2008     6 auto(a~ f        18    27 p     comp~
##  8 audi         a4 quat~   1.8  1999     4 manual~ 4        18    26 p     comp~
##  9 audi         a4 quat~   1.8  1999     4 auto(l~ 4        16    25 p     comp~
## 10 audi         a4 quat~   2    2008     4 manual~ 4        20    28 p     comp~
## # ... with 224 more rows
#> # A tibble: 234 x 11
#>   manufacturer model displ  year   cyl trans      drv     cty   hwy fl    class 
#>   <chr>        <chr> <dbl> <int> <int> <chr>      <chr> <int> <int> <chr> <chr> 
#> 1 audi         a4      1.8  1800     4 auto(l5)   f        20    29 p     compa…
#> 2 audi         a4      1.8  1800     4 manual(m5) f        21    29 p     compa…
#> 3 audi         a4      2    2008     4 manual(m6) f        20    31 p     compa…
#> 4 audi         a4      2    2008     4 auto(av)   f        21    30 p     compa…
#> 5 audi         a4      2.8  2999     6 auto(l5)   f        15    26 p     compa…
#> 6 audi         a4      2.8  2999     6 manual(m5) f        18    26 p     compa…
#> # … with 228 more rows
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy))

Plot diatas menunjukkan bahwa hubungan negatif antara ukuran mesin (displ) dan efisiensi bahan bakar (hwy). maka dapat disimpulkan bahwa mobil bermesin besar menggunakan lebih banyak bahan bakar.

Adapun Setiap fungsi geom di ggplot2 menggunakan argumen pemetaan. Ini menentukan bagaimana variabel dalam kumpulan data Anda dipetakan ke properti visual. Argumen pemetaan selalu dipasangkan dengan aes (), dan argumen x dan y dari aes () menentukan variabel mana yang akan dipetakan ke sumbu x dan y. ggplot2 mencari variabel yang dipetakan dalam argumen data, dalam hal ini, mpg.

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, size = class))
## Warning: Using size for a discrete variable is not advised.

#> Warning: Using size for a discrete variable is not advised.

Untuk memetakan estetika ke variabel, maka kita menggunakan Variable aes(). Dalam contoh di atas, kami memetakan kelas ke estetika warna, tetapi kami dapat memetakan kelas ke estetika ukuran dengan cara yang sama.

# Left
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, alpha = class))
## Warning: Using alpha for a discrete variable is not advised.

# Right
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, shape = class))
## Warning: The shape palette can deal with a maximum of 6 discrete values because
## more than 6 becomes difficult to discriminate; you have 7. Consider
## specifying shapes manually if you must have them.
## Warning: Removed 62 rows containing missing values (geom_point).

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy), color = "blue")