Untuk dapat mengisntal packages tidyverse , dilakukan menggunakan script R install.packages(“tidyverse”)
kemudian, aktifkan packages yang telah diinstal agar dapat digunakan, caranya dengan library(packages)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.7
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 2.0.1 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
pada praktikum ini, akan memanfaatkan data yang disediakan oleh package datasets, sehingga perlu terlebih dahulu mengaktifkan package datasets dengan library(datasets):
library(datasets)
untuk melihat data apa saja yang disediakan oleh datasets, dapat menggunakan data():
data() #kemudian saya akan menggunakan dataset cars
Misal, kita akan menggunakan datasets berupa cars, sehingga script R
data(cars)
cars #menampilkan data seluruhnya
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
## 7 10 18
## 8 10 26
## 9 10 34
## 10 11 17
## 11 11 28
## 12 12 14
## 13 12 20
## 14 12 24
## 15 12 28
## 16 13 26
## 17 13 34
## 18 13 34
## 19 13 46
## 20 14 26
## 21 14 36
## 22 14 60
## 23 14 80
## 24 15 20
## 25 15 26
## 26 15 54
## 27 16 32
## 28 16 40
## 29 17 32
## 30 17 40
## 31 17 50
## 32 18 42
## 33 18 56
## 34 18 76
## 35 18 84
## 36 19 36
## 37 19 46
## 38 19 68
## 39 20 32
## 40 20 48
## 41 20 52
## 42 20 56
## 43 20 64
## 44 22 66
## 45 23 54
## 46 24 70
## 47 24 92
## 48 24 93
## 49 24 120
## 50 25 85
untuk melihat 6 data cars teratas, dapat menggunakan head() :
head(cars)
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
atau dapat menggunakan _script- R:
cars %>% head()
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
untuk melihat 6 data terakhir di dalam datasets dapat menggunakan tail():
tail(cars)
## speed dist
## 45 23 54
## 46 24 70
## 47 24 92
## 48 24 93
## 49 24 120
## 50 25 85
atau menggunakan script R:
cars %>% tail()
## speed dist
## 45 23 54
## 46 24 70
## 47 24 92
## 48 24 93
## 49 24 120
## 50 25 85
Untuk menghitung rata-rata speed dapat menggunakan script R sebagai berikut:
mean.speed <- mean(cars$speed)
mean.speed
## [1] 15.4
atau menggunakan script R seperti ini
cars$speed %>% mean()
## [1] 15.4
Untuk menghitung rata-rata dist dapat menuliskan script R:
mean(cars$dist)
## [1] 42.98
atau menggunakan script R
cars$dist %>% mean()
## [1] 42.98
Fungsi summarise digunakan untuk meringkas data
#misalnya menghitung rata-rata dist yang dikelompokkan berdasarkan speed
cars %>% group_by(speed) %>% summarise(mean.dist = mean(cars$dist), .groups = 'drop')
## # A tibble: 19 x 2
## speed mean.dist
## <dbl> <dbl>
## 1 4 43.0
## 2 7 43.0
## 3 8 43.0
## 4 9 43.0
## 5 10 43.0
## 6 11 43.0
## 7 12 43.0
## 8 13 43.0
## 9 14 43.0
## 10 15 43.0
## 11 16 43.0
## 12 17 43.0
## 13 18 43.0
## 14 19 43.0
## 15 20 43.0
## 16 22 43.0
## 17 23 43.0
## 18 24 43.0
## 19 25 43.0
Fungsi arrange digunakan untuk mengurutkan data
arrange.cars <- cars %>% arrange(speed, ascending = F)
#menampilkan 6 data teratas setelah diurutkan berdasar speed
head(arrange.cars)
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
#menampilkan 6 data terakhir setelah diurutkan berdasar speed
tail(arrange.cars)
## speed dist
## 45 23 54
## 46 24 70
## 47 24 92
## 48 24 93
## 49 24 120
## 50 25 85
Filter digunakan untuk memilih sebagian data yang dibutuhkan berdasarkan nilai terntentu
cars %>% filter(speed == 8)
## speed dist
## 1 8 16
Fungsi select dapat digunakan untuk memilih subset data berdasarkan peubah tertentu.
#kebetulan datasets cars hanya ada dua kolom sehingga
cars %>% select(speed) # jika memilih speed
## speed
## 1 4
## 2 4
## 3 7
## 4 7
## 5 8
## 6 9
## 7 10
## 8 10
## 9 10
## 10 11
## 11 11
## 12 12
## 13 12
## 14 12
## 15 12
## 16 13
## 17 13
## 18 13
## 19 13
## 20 14
## 21 14
## 22 14
## 23 14
## 24 15
## 25 15
## 26 15
## 27 16
## 28 16
## 29 17
## 30 17
## 31 17
## 32 18
## 33 18
## 34 18
## 35 18
## 36 19
## 37 19
## 38 19
## 39 20
## 40 20
## 41 20
## 42 20
## 43 20
## 44 22
## 45 23
## 46 24
## 47 24
## 48 24
## 49 24
## 50 25
cars %>% select(dist) # jika memilih dist
## dist
## 1 2
## 2 10
## 3 4
## 4 22
## 5 16
## 6 10
## 7 18
## 8 26
## 9 34
## 10 17
## 11 28
## 12 14
## 13 20
## 14 24
## 15 28
## 16 26
## 17 34
## 18 34
## 19 46
## 20 26
## 21 36
## 22 60
## 23 80
## 24 20
## 25 26
## 26 54
## 27 32
## 28 40
## 29 32
## 30 40
## 31 50
## 32 42
## 33 56
## 34 76
## 35 84
## 36 36
## 37 46
## 38 68
## 39 32
## 40 48
## 41 52
## 42 56
## 43 64
## 44 66
## 45 54
## 46 70
## 47 92
## 48 93
## 49 120
## 50 85
Menggunakan fungsi mutate untuk menambahkan peubah baru pada data
mutate.cars <- cars %>% mutate(comb = speed+dist)
mutate.cars%>%head()
## speed dist comb
## 1 4 2 6
## 2 4 10 14
## 3 7 4 11
## 4 7 22 29
## 5 8 16 24
## 6 9 10 19
#misalnya akan men
cars %>% group_by(speed) %>% summarise(mean.mutate = mean(mutate.cars$comb))
## # A tibble: 19 x 2
## speed mean.mutate
## <dbl> <dbl>
## 1 4 58.4
## 2 7 58.4
## 3 8 58.4
## 4 9 58.4
## 5 10 58.4
## 6 11 58.4
## 7 12 58.4
## 8 13 58.4
## 9 14 58.4
## 10 15 58.4
## 11 16 58.4
## 12 17 58.4
## 13 18 58.4
## 14 19 58.4
## 15 20 58.4
## 16 22 58.4
## 17 23 58.4
## 18 24 58.4
## 19 25 58.4