Objektif
Ini adalah catatan untuk memandu secara singkat dalam melakukan visualisasi data untuk kebutuhan eksplorasi data atau publikasi menggunakan R dan beberapa package yang menjadi bagian dari package tidyverse
. Tujuan dari tutorial ini adalah untuk membantu Anda memahami operator %>%
.
Cakupan Materi
Materi yang akan dibahas:
Install dan Load Packages
Jalankan perintah di bawah ini untuk install package (jika Anda belum pernah install) yang akan digunakan untuk dapat mengikuti tutorial ini sampai selesai.
install.packages(c("tidyr", "dplyr", "ggplot2"))
# atau
install.packages(c("tidyverse"))
Panggil package yang sudah Anda install dengan fungsi library()
.
# Panggil package yang sudah terisntall
library(tidyr)
library(dplyr)
library(ggplot2)
# atau cukup memanggil
# library(tidyverse)
# untuk memanggil package di atas
Operator Pipes (%>%
)
Sebelum kita mulai, kita akan membahas terlebih dahulu sebuah operator yang sangat berguna dan banyak digunakan oleh pengguna R yang menggunakan tidyverse
. Operator in adalah Pipes (%>%
). Perhatikan contoh di bawah ini.
mean(iris$Sepal.Length)
[1] 5.843333
atau
iris$Sepal.Length %>% mean()
[1] 5.843333
Kedua fungsi tersebut melakukan hal yang sama dan menhasilkan nilai yang sama.
output <- fun_n(...(fun3(fun2(fun1(dataframe, arg1), arg2), arg3), ...), arg_n)
Jika Anda diminta untuk mempelajari script seperti ini saya cukup yakin bahwa Anda akan merasa kesulitan untuk mengetahui proses yang akan dilakukan oleh script tersebut. Script di atas masih sederhana, hanya ada tiga fungsi. Bayangkan jika banyak fungsi yang digunakan secara berurutan, bentuk di atas akan menjadi:
Dengan konsep tidyverse
, kita dapat menggunakan operator Pipes %>%
agar lebih mudah dalam memahami script karena script tersebut menunjukkan urutan. Perhatikan contoh di bawah ini.
Penjelasan Operator %>%
Saya akan coba menjelaskan lebih dalam untuk lebih memahami oprator %>%
.
Misalkan f(a, x)
adalah sebuah fungsi di R dengan argumen a
dan x
. kemudian fungsi g(b, z)
adalah fungsi lain di R dengan argumen b
dan z
. Dengan menggunakan operator %>%
kita dapat menuliskannya sebagai berikut.
# fungsi f(a, x)
f(a, x) # atau
a %>% f(x)
# fungsi g(b, z)
g(b, z) # atau
b %>% g(z)
Dari kedua contoh di atas, dapat dilihat bahwa a
adalah argumen pertama untuk fungsi f()
dan b
adalah argumen pertama untuk fungsi g()
. Operator %>%
“menyampaikan” objek a
sebagai nilai untuk mengisi argumen pertama pada fungsi f()
. Perhatikan ilustrasi di bawah ini.
Ilustrasi Pipes 1
Misalkan objek a
menjadi argumen pertama fungsi f()
dengan a %>% f(x)
. Kemudia hasil dari a %>% f(x)
dijadikan argumen pertama dari fungsi g()
. Dengan kata lain b <- a %>% f(x)
sehingga b %>% g(z)
. Hal ini dapat dilakukan secara berurutan dengan operator %>%
sebagai berikut.
a %>%
f(x) %>%
g(z)
Ilustrasi Pipes 2
“Fungsi f()
diterapkan terhadap objek a
sebagai argumen pertama dan x
sebagai argumen kedua dari fungsi f()
yang kemudian hasilnya digunakan sebagai argumen pertama pada fungsi g()
dengan z
sebagai argumen kedua.”
output <- fun_n(...(fun3(fun2(fun1(dataframe, arg1), arg2), arg3), ...), arg_n)
Jika script di atas dituliskan dengan menggunakan operator %>%
akan seperti berikut ini.
output <- dataframe %>%
fun1(arg1) %>%
fun2(arg2) %>%
fun3(arg3) %>%
... %>%
fun_n(arg_n)
——————- Semoga Bermanfaat ————————-
Contact me: Aep Hidayatuloh
Email: aephidayatuloh.mail@gmail.com GitHub: https://github.com/aephidayatuloh
---
title: "Operator Pipes `%>%`"
author: "Aep Hidayatuloh"
date: "Update Terakhir: 2019-05-19"
output: 
  html_notebook:
    number_sections: yes
    theme: spacelab
    df_print: paged
    toc: yes
    toc_depth: 4
    toc_float: true
  html_document:
    number_sections: yes
    theme: spacelab
    df_print: paged
    toc: yes
    toc_depth: '4'
    toc_float: true
---

<style type="text/css">

body{ /* Normal  */
      font-size: 12px;
  }
td {  /* Table  */
  font-size: 12px;
}
h1.title {
  font-size: 38px;
  color: lightblue;
  font-weight: bold;
}
h1 { /* Header 1 */
  font-size: 24px;
  color: DarkBlue;
}
h2 { /* Header 2 */
  font-size: 20px;
  color: DarkBlue;
}
h3 { /* Header 3 */
  font-size: 16px;
#  font-family: "Times New Roman", Times, serif;
  color: DarkBlue;
}
h4 { /* Header 4 */
  font-size: 14px;
  color: DarkBlue;
}
code.r{ /* Code block */
    font-size: 12px;
}
pre { /* Code block - determines code spacing between lines */
    font-size: 12px;
}
</style>


```{r setup, include=FALSE}
#knitr::opts_chunk$set(echo = TRUE)
knitr::opts_chunk$set(echo=TRUE, fig.height=3.5, fig.width=9.2, results='hold', warning=FALSE, fig.show='hold', message=FALSE) 
options(scipen = 99)
```

# Objektif

Ini adalah catatan untuk memandu secara singkat dalam melakukan visualisasi data untuk kebutuhan eksplorasi data atau publikasi menggunakan R dan beberapa package yang menjadi bagian dari package `tidyverse`. Tujuan dari tutorial ini adalah untuk membantu Anda memahami operator `%>%`. 

# Cakupan Materi
Materi yang akan dibahas:

* Operator `%>%`

# Prasyarat

Untuk dapat mengikuti tutorial ini dengan baik, ada beberapa hal yang perlu dipersiapkan oleh peserta. Yaitu:

1. Koneksi internet yang baik

2. Menginstall software

    a. R program <https://cran.r-project.org/>

    b. RStudio <https://www.rstudio.com/products/rstudio/download/>

3. Data & Script yang dapat diperoleh dari [repository ini](https://github.com/aephidayatuloh/eksplorasi-data) dan pada database yang disediakan pembicara.

4. Package R yang dibutuhkan: `tidyr`, `dplyr`, `ggplot2` (atau `tidyverse`)

# Install dan Load Packages

Jalankan perintah di bawah ini untuk install package (**jika Anda belum pernah install**) yang akan digunakan untuk dapat mengikuti tutorial ini sampai selesai.

```{r eval=FALSE}
install.packages(c("tidyr", "dplyr", "ggplot2"))
# atau                                                                         
install.packages(c("tidyverse"))                         
```

Panggil package yang sudah Anda install dengan fungsi `library()`.

```{r loadpkg}
# Panggil package yang sudah terisntall
library(tidyr)
library(dplyr)
library(ggplot2)

# atau cukup memanggil
# library(tidyverse)
# untuk memanggil package di atas
```

# Operator Pipes (`%>%`)

Sebelum kita mulai, kita akan membahas terlebih dahulu sebuah operator yang sangat berguna dan banyak digunakan oleh pengguna R yang menggunakan `tidyverse`. Operator in adalah **Pipes** (`%>%`). Perhatikan contoh di bawah ini.

```{r pipes1}
mean(iris$Sepal.Length)
```
atau
```{r pipes2}
iris$Sepal.Length %>% mean()
```
Kedua fungsi tersebut melakukan hal yang sama dan menhasilkan nilai yang sama.

```{r eval=FALSE}
output <- fun_n(...(fun3(fun2(fun1(dataframe, arg1), arg2), arg3), ...), arg_n)
```

Jika Anda diminta untuk mempelajari script seperti ini saya cukup yakin bahwa Anda akan merasa kesulitan untuk mengetahui proses yang akan dilakukan oleh script tersebut. Script di atas masih sederhana, hanya ada tiga fungsi. Bayangkan jika banyak fungsi yang digunakan secara berurutan, bentuk di atas akan menjadi:

Dengan konsep `tidyverse`, kita dapat menggunakan operator Pipes `%>%` agar lebih mudah dalam memahami script karena script tersebut menunjukkan urutan. Perhatikan contoh di bawah ini.

## Penjelasan Operator `%>%`

Saya akan coba menjelaskan lebih dalam untuk lebih memahami oprator `%>%`.

Misalkan `f(a, x)` adalah sebuah fungsi di R dengan argumen `a` dan `x`. kemudian fungsi `g(b, z)` adalah fungsi lain di R dengan argumen `b` dan `z`. Dengan menggunakan operator `%>%` kita dapat menuliskannya sebagai berikut.

```{r eval=FALSE}
# fungsi f(a, x)
f(a, x) # atau
a %>% f(x)

# fungsi g(b, z)
g(b, z) # atau
b %>% g(z)
```

Dari kedua contoh di atas, dapat dilihat bahwa `a` adalah argumen pertama untuk fungsi `f()` dan `b` adalah argumen pertama untuk fungsi `g()`. Operator `%>%` "menyampaikan" objek `a` sebagai nilai untuk mengisi argumen pertama pada fungsi `f()`. Perhatikan ilustrasi di bawah ini.

<p align="center">
    <img src="D:/aephidayatuloh/R/learning/Rdb/pipes.png" height="148" width="148" alt="Ilustrasi Pipes 1">
    <br/>
    <br/>
    <em>Ilustrasi Pipes 1</em>
</p>

Misalkan objek `a` menjadi argumen pertama fungsi `f()` dengan `a %>% f(x)`. Kemudia hasil dari `a %>% f(x)` dijadikan argumen pertama dari fungsi `g()`. Dengan kata lain `b <- a %>% f(x)` sehingga `b %>% g(z)`. Hal ini dapat dilakukan secara berurutan dengan operator `%>%` sebagai berikut.

```{r eval=FALSE}
a %>%
    f(x) %>%
    g(z)
```

<p align="center">
    <img src="D:/aephidayatuloh/R/learning/Rdb/pipes2.png" height="148" width="248" alt="Ilustrasi Pipes 2">
    <br/>
    <br/>
    <em>Ilustrasi Pipes 2</em>
</p>

> "Fungsi `f()` diterapkan terhadap objek `a` sebagai argumen pertama dan `x` sebagai argumen kedua dari fungsi `f()` yang kemudian hasilnya digunakan sebagai argumen pertama pada fungsi `g()` dengan `z` sebagai argumen kedua."

```{r eval=FALSE}
output <- fun_n(...(fun3(fun2(fun1(dataframe, arg1), arg2), arg3), ...), arg_n)
```

Jika script di atas dituliskan dengan menggunakan operator `%>%` akan seperti berikut ini.

```{r eval=FALSE}
output <- dataframe %>% 
  fun1(arg1) %>% 
  fun2(arg2) %>% 
  fun3(arg3) %>% 
  ... %>% 
  fun_n(arg_n)
```


<p align="center">
<strong>------------------- Semoga Bermanfaat -------------------------</strong>
</p>


**Contact me:**
**Aep** Hidayatuloh

Email: <aephidayatuloh.mail@gmail.com>
GitHub: <https://github.com/aephidayatuloh>
