Soal

  • Cari Datasets selain iris dan Teams. Anda hanya boleh menggunakan data di package datasets maupun datasets di package R lainnya.

  • Pada datasets yang Anda pilih, Praktikkan penggunaan fungsi summarise(), arrange(), filter(),mutate(), select() minimal 1 kali secara terpisah.

  • Praktikan penggunaan fungsi tersebut secara bersama-sama.(jumlahnya bebas)

Library

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.3     v dplyr   1.0.7
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   2.0.1     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(DT)

Soal 1

Datasets yang digunakan adalah datasets Aid2

data(Aids2)
datatable(Aids2)

Soal 2

Untuk Melihat Ringkasan dari data dapat menggunakan fungsi summerise yang dapat berupa modus, mean, quartil dan lainya

Sumarise

sum <- Aids2 %>% summarise(mean=mean(deaths))
sum
##       mean
## 1 2056.625

Arrange

Fungsi arrange dapat digunakan dalam pengurutan suatu nilai variable

arr <- Aids2 %>% arrange(T.categ)
head(arr)
##   state sex  diag death status T.categ age
## 1   NSW   M 10905 11081      D      hs  35
## 2   NSW   M 11029 11096      D      hs  53
## 3   NSW   M  9551  9983      D      hs  42
## 4   NSW   M 10015 10290      D      hs  39
## 5   NSW   M  9971 10344      D      hs  36
## 6   NSW   M 10042 11069      D      hs  31

Filter

Fungsi filter digunakan untuk memisahkan atau menemukan suatu nilai varible berdasarkan variable tertentu. contohnya kita ingin data penderita aids yang perempuan dalam variable Sex maka:

fil <-Aids2 %>% filter(sex=="F")
head(fil)
##   state sex  diag death status T.categ age
## 1   NSW   F 10961 11504      A      id  30
## 2   NSW   F  9014  9152      D   blood  44
## 3   NSW   F  9258  9259      D   blood  25
## 4   NSW   F  9349  9392      D   blood  55
## 5   NSW   F  9385  9600      D   blood  70
## 6   NSW   F  9265  9525      D   blood  17

Select

Untuk membuat suatu data baru dengan beberapa variable penyusun merupakan variable Aids2 maka dapan digunakan fungsi select

sel <- Aids2 %>% dplyr::select(age)

Soal 3

untuk menambahkan suatu variable baru fungsi yang digunakan adalah mutate dengan contoh kita ingin menambahkan variable yang berisikan penderita Aids yang kurang dari 30 tahun

mut <- Aids2 %>% mutate(avage = age <= 30)
head(mut)
##   state sex  diag death status T.categ age avage
## 1   NSW   M 10905 11081      D      hs  35 FALSE
## 2   NSW   M 11029 11096      D      hs  53 FALSE
## 3   NSW   M  9551  9983      D      hs  42 FALSE
## 4   NSW   M  9577  9654      D    haem  44 FALSE
## 5   NSW   M 10015 10290      D      hs  39 FALSE
## 6   NSW   M  9971 10344      D      hs  36 FALSE

fungsi diatas dapat diimplementasikan secara bersamaan

al = Aids2 %>% mutate(Avage = age >= 20) %>% arrange(death) %>% filter(sex=="M")
tail(al)
##      state sex  diag death status T.categ age Avage
## 2749 Other   M 11385 11504      A      hs  37  TRUE
## 2750 Other   M 11359 11504      A      hs  27  TRUE
## 2751 Other   M 11475 11504      A     het  46  TRUE
## 2752 Other   M 11496 11504      A    haem  49  TRUE
## 2753 Other   M 11460 11504      A      hs  55  TRUE
## 2754 Other   M 11448 11504      A      hs  37  TRUE