https://rpubs.com/febriliaac/tugas1

Tugas 1 Praktikum Sains Data untuk mempraktekkan beberapa fungsi dasar dengan menggunakan data yang diambil di packages dataset

## -- Attaching packages ---------------------------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.3     v dplyr   1.0.2
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.0
## -- Conflicts ------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Import Data Cars

data yang digunakan adalah data cars dengan 2 variabel dan 50 obseravsi

data(cars)
cars<-tibble::as_tibble(cars)
cars
## # A tibble: 50 x 2
##    speed  dist
##    <dbl> <dbl>
##  1     4     2
##  2     4    10
##  3     7     4
##  4     7    22
##  5     8    16
##  6     9    10
##  7    10    18
##  8    10    26
##  9    10    34
## 10    11    17
## # ... with 40 more rows

Menggunakan Fungsi Summarise()

memperoleh data rata-rata dengan mengelompokkan berdasarkan kecepatan mobil

cars %>% group_by(speed) %>% summarise(mean=mean(dist))
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 19 x 2
##    speed  mean
##    <dbl> <dbl>
##  1     4   6  
##  2     7  13  
##  3     8  16  
##  4     9  10  
##  5    10  26  
##  6    11  22.5
##  7    12  21.5
##  8    13  35  
##  9    14  50.5
## 10    15  33.3
## 11    16  36  
## 12    17  40.7
## 13    18  64.5
## 14    19  50  
## 15    20  50.4
## 16    22  66  
## 17    23  54  
## 18    24  93.8
## 19    25  85

Menggunakan Fungsi Arrange()

Mengurutkan data berdasarkan jarak terkecil

cars %>% arrange(dist)
## # A tibble: 50 x 2
##    speed  dist
##    <dbl> <dbl>
##  1     4     2
##  2     7     4
##  3     4    10
##  4     9    10
##  5    12    14
##  6     8    16
##  7    11    17
##  8    10    18
##  9    12    20
## 10    15    20
## # ... with 40 more rows

Mengurutkan data berdasarkan jarak terbesar

cars %>% arrange(desc(dist))
## # A tibble: 50 x 2
##    speed  dist
##    <dbl> <dbl>
##  1    24   120
##  2    24    93
##  3    24    92
##  4    25    85
##  5    18    84
##  6    14    80
##  7    18    76
##  8    24    70
##  9    19    68
## 10    22    66
## # ... with 40 more rows

Menggunakan Fungsi Filter()

Memfilter data dengan kecepatan=18

cars %>% filter(speed==18)
## # A tibble: 4 x 2
##   speed  dist
##   <dbl> <dbl>
## 1    18    42
## 2    18    56
## 3    18    76
## 4    18    84

Menggunakan Fungsi select()

Memilih data kecepatan dari data cars

cars %>% select(speed)
## # A tibble: 50 x 1
##    speed
##    <dbl>
##  1     4
##  2     4
##  3     7
##  4     7
##  5     8
##  6     9
##  7    10
##  8    10
##  9    10
## 10    11
## # ... with 40 more rows

Menggunakan fungsi mutate()

Membuat kolom waktu dengan membagi jarak dengan dengan kecepatan

cars<-cars %>% mutate(waktu=dist/speed)
cars
## # A tibble: 50 x 3
##    speed  dist waktu
##    <dbl> <dbl> <dbl>
##  1     4     2 0.5  
##  2     4    10 2.5  
##  3     7     4 0.571
##  4     7    22 3.14 
##  5     8    16 2    
##  6     9    10 1.11 
##  7    10    18 1.8  
##  8    10    26 2.6  
##  9    10    34 3.4  
## 10    11    17 1.55 
## # ... with 40 more rows

Menggabungkan fungsi mutate () dan summarise()

membuat kolom simpangan dengan mengurangi waktu dengan rata-rata waktu

cars<-cars %>% mutate(simpangan=waktu-mean(waktu))
cars
## # A tibble: 50 x 4
##    speed  dist waktu simpangan
##    <dbl> <dbl> <dbl>     <dbl>
##  1     4     2 0.5     -2.13  
##  2     4    10 2.5     -0.132 
##  3     7     4 0.571   -2.06  
##  4     7    22 3.14     0.510 
##  5     8    16 2       -0.632 
##  6     9    10 1.11    -1.52  
##  7    10    18 1.8     -0.832 
##  8    10    26 2.6     -0.0325
##  9    10    34 3.4      0.768 
## 10    11    17 1.55    -1.09  
## # ... with 40 more rows

menggabungkan fungsi arrange() dan filter()

mengurutkan data dari terbesar berdasarkan jarak dan filter mobil dengan kecepatan 18

cars %>% arrange(desc(dist))%>% filter(speed==18)
## # A tibble: 4 x 4
##   speed  dist waktu simpangan
##   <dbl> <dbl> <dbl>     <dbl>
## 1    18    84  4.67     2.03 
## 2    18    76  4.22     1.59 
## 3    18    56  3.11     0.479
## 4    18    42  2.33    -0.299