Lembaga : UIN Maulana Malik Ibrahim Malang
Jurusan : Teknik Informatika

1 . Pendahuluan

Saat melakukan manipulasi data pada R kita dapat menggunakan package dplyr. Package ini dibuat oleh Handley Wickham dan Roman Francois yang berisi kumpulan fungsi yang memudahkan manipulasi data yaitu antara lain: sample() untuk mengambil sampel secara acak dari tabel, mutate() untuk menambah kolom, select() untuk mengambil data atau variabel yang dibutuhkan, arrange() untuk mengurutkan data, filter() untuk menyaring data, groupby() untuk mengelompokkan data dan lain lain.

2 . Data Inflow Pulau Jawa

library(readxl)
## Warning: package 'readxl' was built under R version 4.1.3
manInflow <- read_excel(path = "inflow tahunan Jaw.xlsx")
manInflow
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## Warning: package 'ggplot2' was built under R version 4.1.3
## Warning: package 'tibble' was built under R version 4.1.3
## Warning: package 'tidyr' was built under R version 4.1.3
## Warning: package 'readr' was built under R version 4.1.3
## Warning: package 'purrr' was built under R version 4.1.3
## Warning: package 'dplyr' was built under R version 4.1.3
## Warning: package 'forcats' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

3 . Menghapus Beberapa Variable yang Tidak Diperlukan

## Menghapus Semua Kolom Kecuali Kolom Tahun 2012
jaw2012 <- select(manInflow, '2012')
jaw2012
## Menghapus semua Kolom Kecuali Kolom tahun 2012,2013,2014
jaw200 <- select(manInflow, `2012`,`2013`,`2014`)
jaw200

4 . Memilih Variable yang ingin Digunakan

## Memilih semua kolom kecuali kolom 2012
jawaex2012 <- select(manInflow, -'2012')
jawaex2012

Select dapat juga digunakan untuk merubah atau mengganti nama Kolom

## Mengganti Kolom 2012 Menjadi 2k12
jawa300 <- manInflow %>% 
  select("2k12" = `2012` , `2018` , `2019`)
jawa300

5 . Mengganti Kolom Tahun pada tabel

library(dplyr)
jawa400 <- manInflow %>% rename("2k13" = '2013')
head(jawa400)

6 . Mengambil Nilai yang Tidak duplikasi dari Variable

6.1 . Di Suatu Variable

jawa4 <- distinct(manInflow, `2015`)
jawa4

6.2 . Di Semua Variable

jawa5 <- distinct(manInflow, `2015`, .keep_all = TRUE)
jawa5

7 . Menyeleksi Baris Pada Tabel

## Menyeleksi Menggunakan fungsi Filter()   

jawa5 <- manInflow %>%
  filter(Provinsi <= 'Jawa Timur') %>%
    select(`2011`,`2012`)
jawa5
jawa6 <- manInflow %>%
  filter(Provinsi == 'Jawa Timur', Provinsi == 'Jawa Tengah') %>%
    select( -`2017`)
jawa6
str(manInflow)
## tibble [6 x 12] (S3: tbl_df/tbl/data.frame)
##  $ Provinsi: chr [1:6] "Jawa" "Jawa Barat" "Jawa Tengah" "Yogyakarta" ...
##  $ 2011    : num [1:6] 123917 43775 35137 6490 38515 ...
##  $ 2012    : num [1:6] 160482 60629 43298 9173 47383 ...
##  $ 2013    : num [1:6] 134998 35190 42182 8939 48687 ...
##  $ 2014    : num [1:6] 217303 78660 60476 13890 64276 ...
##  $ 2015    : num [1:6] 230141 81303 65198 14831 68808 ...
##  $ 2016    : num [1:6] 261607 88036 72782 17350 83439 ...
##  $ 2017    : num [1:6] 277609 83220 77031 17483 98380 ...
##  $ 2018    : num [1:6] 306911 87243 87829 20574 106433 ...
##  $ 2019    : num [1:6] 324624 94846 90751 20899 113651 ...
##  $ 2020    : num [1:6] 259444 76883 84970 7348 86848 ...
##  $ 2021    : num [1:6] 187816 57295 62024 6714 58986 ...
str(manInflow %>% group_by(Provinsi))
## grouped_df [6 x 12] (S3: grouped_df/tbl_df/tbl/data.frame)
##  $ Provinsi: chr [1:6] "Jawa" "Jawa Barat" "Jawa Tengah" "Yogyakarta" ...
##  $ 2011    : num [1:6] 123917 43775 35137 6490 38515 ...
##  $ 2012    : num [1:6] 160482 60629 43298 9173 47383 ...
##  $ 2013    : num [1:6] 134998 35190 42182 8939 48687 ...
##  $ 2014    : num [1:6] 217303 78660 60476 13890 64276 ...
##  $ 2015    : num [1:6] 230141 81303 65198 14831 68808 ...
##  $ 2016    : num [1:6] 261607 88036 72782 17350 83439 ...
##  $ 2017    : num [1:6] 277609 83220 77031 17483 98380 ...
##  $ 2018    : num [1:6] 306911 87243 87829 20574 106433 ...
##  $ 2019    : num [1:6] 324624 94846 90751 20899 113651 ...
##  $ 2020    : num [1:6] 259444 76883 84970 7348 86848 ...
##  $ 2021    : num [1:6] 187816 57295 62024 6714 58986 ...
##  - attr(*, "groups")= tibble [6 x 2] (S3: tbl_df/tbl/data.frame)
##   ..$ Provinsi: chr [1:6] "Banten" "Jawa" "Jawa Barat" "Jawa Tengah" ...
##   ..$ .rows   : list<int> [1:6] 
##   .. ..$ : int 6
##   .. ..$ : int 1
##   .. ..$ : int 2
##   .. ..$ : int 3
##   .. ..$ : int 5
##   .. ..$ : int 4
##   .. ..@ ptype: int(0) 
##   ..- attr(*, ".drop")= logi TRUE

8 . Pengelompokan dan Pengumpulan Data

8.1 . Pengelompokan

## Menggunakan Fugnsi group_by()  
  
jawag1 <- manInflow %>%
    group_by(Provinsi)
jawag1

8.2 . Pengurutan

jawasort <- arrange(manInflow, `2012`)
jawasort

9 . Menambahkan Kolom Pada Tabel

jawaup1 <- manInflow %>%
    mutate(`2021` = manInflow$`2020`/2)
jawaup1

10 . Visualisasi Data

10.1 . Menggunakan Grafik Dot / Titik

ggplot(data = manInflow, mapping = aes(x = Provinsi, y = `2011`)) +
  geom_point()

ggplot(data = manInflow, mapping = aes(x = Provinsi, y = `2012`)) +
  geom_point()