https://rpubs.com/febriliaac/tugas1
Tugas 1 Praktikum Sains Data untuk mempraktekkan beberapa fungsi dasar dengan menggunakan data yang diambil di packages dataset
## -- Attaching packages ---------------------------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2 v purrr 0.3.4
## v tibble 3.0.3 v dplyr 1.0.2
## v tidyr 1.1.2 v stringr 1.4.0
## v readr 1.4.0 v forcats 0.5.0
## -- Conflicts ------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
data yang digunakan adalah data cars dengan 2 variabel dan 50 obseravsi
data(cars)
cars<-tibble::as_tibble(cars)
cars
## # A tibble: 50 x 2
## speed dist
## <dbl> <dbl>
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
## 7 10 18
## 8 10 26
## 9 10 34
## 10 11 17
## # ... with 40 more rows
memperoleh data rata-rata dengan mengelompokkan berdasarkan kecepatan mobil
cars %>% group_by(speed) %>% summarise(mean=mean(dist))
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 19 x 2
## speed mean
## <dbl> <dbl>
## 1 4 6
## 2 7 13
## 3 8 16
## 4 9 10
## 5 10 26
## 6 11 22.5
## 7 12 21.5
## 8 13 35
## 9 14 50.5
## 10 15 33.3
## 11 16 36
## 12 17 40.7
## 13 18 64.5
## 14 19 50
## 15 20 50.4
## 16 22 66
## 17 23 54
## 18 24 93.8
## 19 25 85
Mengurutkan data berdasarkan jarak terkecil
cars %>% arrange(dist)
## # A tibble: 50 x 2
## speed dist
## <dbl> <dbl>
## 1 4 2
## 2 7 4
## 3 4 10
## 4 9 10
## 5 12 14
## 6 8 16
## 7 11 17
## 8 10 18
## 9 12 20
## 10 15 20
## # ... with 40 more rows
Mengurutkan data berdasarkan jarak terbesar
cars %>% arrange(desc(dist))
## # A tibble: 50 x 2
## speed dist
## <dbl> <dbl>
## 1 24 120
## 2 24 93
## 3 24 92
## 4 25 85
## 5 18 84
## 6 14 80
## 7 18 76
## 8 24 70
## 9 19 68
## 10 22 66
## # ... with 40 more rows
Memfilter data dengan kecepatan=18
cars %>% filter(speed==18)
## # A tibble: 4 x 2
## speed dist
## <dbl> <dbl>
## 1 18 42
## 2 18 56
## 3 18 76
## 4 18 84
Memilih data kecepatan dari data cars
cars %>% select(speed)
## # A tibble: 50 x 1
## speed
## <dbl>
## 1 4
## 2 4
## 3 7
## 4 7
## 5 8
## 6 9
## 7 10
## 8 10
## 9 10
## 10 11
## # ... with 40 more rows
Membuat kolom waktu dengan membagi jarak dengan dengan kecepatan
cars<-cars %>% mutate(waktu=dist/speed)
cars
## # A tibble: 50 x 3
## speed dist waktu
## <dbl> <dbl> <dbl>
## 1 4 2 0.5
## 2 4 10 2.5
## 3 7 4 0.571
## 4 7 22 3.14
## 5 8 16 2
## 6 9 10 1.11
## 7 10 18 1.8
## 8 10 26 2.6
## 9 10 34 3.4
## 10 11 17 1.55
## # ... with 40 more rows
membuat kolom simpangan dengan mengurangi waktu dengan rata-rata waktu
cars<-cars %>% mutate(simpangan=waktu-mean(waktu))
cars
## # A tibble: 50 x 4
## speed dist waktu simpangan
## <dbl> <dbl> <dbl> <dbl>
## 1 4 2 0.5 -2.13
## 2 4 10 2.5 -0.132
## 3 7 4 0.571 -2.06
## 4 7 22 3.14 0.510
## 5 8 16 2 -0.632
## 6 9 10 1.11 -1.52
## 7 10 18 1.8 -0.832
## 8 10 26 2.6 -0.0325
## 9 10 34 3.4 0.768
## 10 11 17 1.55 -1.09
## # ... with 40 more rows
mengurutkan data dari terbesar berdasarkan jarak dan filter mobil dengan kecepatan 18
cars %>% arrange(desc(dist))%>% filter(speed==18)
## # A tibble: 4 x 4
## speed dist waktu simpangan
## <dbl> <dbl> <dbl> <dbl>
## 1 18 84 4.67 2.03
## 2 18 76 4.22 1.59
## 3 18 56 3.11 0.479
## 4 18 42 2.33 -0.299