Install packages tidyverse

Untuk dapat mengisntal packages tidyverse , dilakukan menggunakan script R install.packages(“tidyverse”)

kemudian, aktifkan packages yang telah diinstal agar dapat digunakan, caranya dengan library(packages)

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.4     v dplyr   1.0.7
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   2.0.1     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Mengaktifkan packages datasets

pada praktikum ini, akan memanfaatkan data yang disediakan oleh package datasets, sehingga perlu terlebih dahulu mengaktifkan package datasets dengan library(datasets):

library(datasets)

untuk melihat data apa saja yang disediakan oleh datasets, dapat menggunakan data():

data() #kemudian saya akan menggunakan dataset cars

Misal, kita akan menggunakan datasets berupa cars, sehingga script R

data(cars)
cars #menampilkan data seluruhnya
##    speed dist
## 1      4    2
## 2      4   10
## 3      7    4
## 4      7   22
## 5      8   16
## 6      9   10
## 7     10   18
## 8     10   26
## 9     10   34
## 10    11   17
## 11    11   28
## 12    12   14
## 13    12   20
## 14    12   24
## 15    12   28
## 16    13   26
## 17    13   34
## 18    13   34
## 19    13   46
## 20    14   26
## 21    14   36
## 22    14   60
## 23    14   80
## 24    15   20
## 25    15   26
## 26    15   54
## 27    16   32
## 28    16   40
## 29    17   32
## 30    17   40
## 31    17   50
## 32    18   42
## 33    18   56
## 34    18   76
## 35    18   84
## 36    19   36
## 37    19   46
## 38    19   68
## 39    20   32
## 40    20   48
## 41    20   52
## 42    20   56
## 43    20   64
## 44    22   66
## 45    23   54
## 46    24   70
## 47    24   92
## 48    24   93
## 49    24  120
## 50    25   85

untuk melihat 6 data cars teratas, dapat menggunakan head() :

head(cars)
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
## 4     7   22
## 5     8   16
## 6     9   10

atau dapat menggunakan _script- R:

cars %>% head()
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
## 4     7   22
## 5     8   16
## 6     9   10

untuk melihat 6 data terakhir di dalam datasets dapat menggunakan tail():

tail(cars)
##    speed dist
## 45    23   54
## 46    24   70
## 47    24   92
## 48    24   93
## 49    24  120
## 50    25   85

atau menggunakan script R:

cars %>% tail()
##    speed dist
## 45    23   54
## 46    24   70
## 47    24   92
## 48    24   93
## 49    24  120
## 50    25   85

Untuk menghitung rata-rata speed dapat menggunakan script R sebagai berikut:

mean.speed <- mean(cars$speed)
mean.speed
## [1] 15.4

atau menggunakan script R seperti ini

cars$speed %>% mean()
## [1] 15.4

Untuk menghitung rata-rata dist dapat menuliskan script R:

mean(cars$dist)
## [1] 42.98

atau menggunakan script R

cars$dist %>% mean()
## [1] 42.98

Fungsi summarise

Fungsi summarise digunakan untuk meringkas data

#misalnya menghitung rata-rata dist yang dikelompokkan berdasarkan speed
cars %>% group_by(speed) %>% summarise(mean.dist = mean(cars$dist), .groups = 'drop')
## # A tibble: 19 x 2
##    speed mean.dist
##    <dbl>     <dbl>
##  1     4      43.0
##  2     7      43.0
##  3     8      43.0
##  4     9      43.0
##  5    10      43.0
##  6    11      43.0
##  7    12      43.0
##  8    13      43.0
##  9    14      43.0
## 10    15      43.0
## 11    16      43.0
## 12    17      43.0
## 13    18      43.0
## 14    19      43.0
## 15    20      43.0
## 16    22      43.0
## 17    23      43.0
## 18    24      43.0
## 19    25      43.0

Fungsi arrange

Fungsi arrange digunakan untuk mengurutkan data

arrange.cars <- cars %>% arrange(speed, ascending = F)
#menampilkan 6 data teratas setelah diurutkan berdasar speed
head(arrange.cars)
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
## 4     7   22
## 5     8   16
## 6     9   10
#menampilkan 6 data terakhir setelah diurutkan berdasar speed
tail(arrange.cars)
##    speed dist
## 45    23   54
## 46    24   70
## 47    24   92
## 48    24   93
## 49    24  120
## 50    25   85

Fungsi Filter

Filter digunakan untuk memilih sebagian data yang dibutuhkan berdasarkan nilai terntentu

cars %>% filter(speed == 8)
##   speed dist
## 1     8   16

Fungsi select

Fungsi select dapat digunakan untuk memilih subset data berdasarkan peubah tertentu.

#kebetulan datasets cars hanya ada dua kolom sehingga
cars %>% select(speed) # jika memilih speed
##    speed
## 1      4
## 2      4
## 3      7
## 4      7
## 5      8
## 6      9
## 7     10
## 8     10
## 9     10
## 10    11
## 11    11
## 12    12
## 13    12
## 14    12
## 15    12
## 16    13
## 17    13
## 18    13
## 19    13
## 20    14
## 21    14
## 22    14
## 23    14
## 24    15
## 25    15
## 26    15
## 27    16
## 28    16
## 29    17
## 30    17
## 31    17
## 32    18
## 33    18
## 34    18
## 35    18
## 36    19
## 37    19
## 38    19
## 39    20
## 40    20
## 41    20
## 42    20
## 43    20
## 44    22
## 45    23
## 46    24
## 47    24
## 48    24
## 49    24
## 50    25
cars %>% select(dist) # jika memilih dist
##    dist
## 1     2
## 2    10
## 3     4
## 4    22
## 5    16
## 6    10
## 7    18
## 8    26
## 9    34
## 10   17
## 11   28
## 12   14
## 13   20
## 14   24
## 15   28
## 16   26
## 17   34
## 18   34
## 19   46
## 20   26
## 21   36
## 22   60
## 23   80
## 24   20
## 25   26
## 26   54
## 27   32
## 28   40
## 29   32
## 30   40
## 31   50
## 32   42
## 33   56
## 34   76
## 35   84
## 36   36
## 37   46
## 38   68
## 39   32
## 40   48
## 41   52
## 42   56
## 43   64
## 44   66
## 45   54
## 46   70
## 47   92
## 48   93
## 49  120
## 50   85

Fungsi Mutate

Menggunakan fungsi mutate untuk menambahkan peubah baru pada data

mutate.cars <- cars %>% mutate(comb = speed+dist)
mutate.cars%>%head()
##   speed dist comb
## 1     4    2    6
## 2     4   10   14
## 3     7    4   11
## 4     7   22   29
## 5     8   16   24
## 6     9   10   19

Penggunaan fungsi bersamaan

#misalnya akan men
cars %>% group_by(speed) %>% summarise(mean.mutate = mean(mutate.cars$comb))
## # A tibble: 19 x 2
##    speed mean.mutate
##    <dbl>       <dbl>
##  1     4        58.4
##  2     7        58.4
##  3     8        58.4
##  4     9        58.4
##  5    10        58.4
##  6    11        58.4
##  7    12        58.4
##  8    13        58.4
##  9    14        58.4
## 10    15        58.4
## 11    16        58.4
## 12    17        58.4
## 13    18        58.4
## 14    19        58.4
## 15    20        58.4
## 16    22        58.4
## 17    23        58.4
## 18    24        58.4
## 19    25        58.4