Memanfaatkan Fungsi yang ada di Rstudio

Karena dibuat untuk memudahkan analisis data, R mempunyai banyak fungsi yang tersedia untuk melakukan analisis statistik. Untuk mendapatkan nilai rata-rata dari sebuah vector numeric Anda dapat langsung gunakan fungsi mean(). Untuk mendapatkan milai minimum atau maksimum tersedia fungsi min() dan max(). Fungsi sd() dapat digunakan untuk mendapatkan nilai standard deviasi atau fungsi var() untuk mendapatkan nilai ragam (varians). Perhatikan contoh berikut ini.

x <- seq(1, 100, by = 4)

# Rata-rata vector x
mean(x)
## [1] 49
# Minimum dari vector x
min(x)
## [1] 1
# Maksimum dari vector x
max(x)
## [1] 97

Jika Anda ingin mencari nilai minimum dan maksimum sekaligus, Anda dapat gunakan fungsi range(). Output dari fungsi ini adalah vector numeric dengan dua elemen berisi nilai minimum dan maksimum.

range(x)
## [1]  1 97

Jika Anda ingin mencari nilai statistik lima serangkai (minimum, Q1, Q2 atau median, Q3, maksimum), Anda dapat gunakan fungsi summary().

summary(x)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       1      25      49      49      73      97

Gambar 1: Aktifkan Package pada Tab Packages

Jika fungsi atau data yang akan Anda gunakan berasal dari sebuah package, maka Anda dapat gunakan fungsi library()require() atau klik beri tanda checklist pada tab Packages seperti pada Gambar 1 untuk mengaktifkan package tersebut pada session yang sedang Anda gunakan. Tentunya package tersebut harus sudah Anda install sebelumnya. Misalnya Anda ingin menggunakan data flights dari package nycflights13. Hal pertama Anda harus pastikan package tersebut sudah terinstall dengan baik di R Anda. Jika Anda belum install package tersebut Anda dapat menginstallnya dengan perintah berikut.

install.packages("nycflights13")

Kaetika Anda akan install sebuah package, nama package tersebut harus berupa string. Anda hanya perlu melakukan satu kali install saja, tidak perlu install ketika setiap kali akan Anda gunakan. Sekarang Anda coba untuk memanggil data flights dari package nycflights13 tanpa mengaktifkan package terlebih dahulu. Maka akan muncul sebuah error yang menyatakan bahwa objek flights tidak ditemukan.

flights
## Error: object 'flights' not found

Karena data flights ada di dalam package nycflights13 maka Anda perlu aktifkan terlebih dahulu package tersebut. Anda dapat mengaktifkannya dengan perintah berikut ini.

library(nycflights13)
## Warning: package 'nycflights13' was built under R version 4.2.3

Kemudian panggil data flights. Kita gunakan fungsi head() untuk menampilkan beberapa baris pertama saja dari data. Secara default fungsi head() akan menampilkan 6 baris pertama saja dari data yang kita sebutkan pada argumen pertamanya.

head(flights)
## # A tibble: 6 × 19
##    year month   day dep_time sched_dep…¹ dep_d…² arr_t…³ sched…⁴ arr_d…⁵ carrier
##   <int> <int> <int>    <int>       <int>   <dbl>   <int>   <int>   <dbl> <chr>  
## 1  2013     1     1      517         515       2     830     819      11 UA     
## 2  2013     1     1      533         529       4     850     830      20 UA     
## 3  2013     1     1      542         540       2     923     850      33 AA     
## 4  2013     1     1      544         545      -1    1004    1022     -18 B6     
## 5  2013     1     1      554         600      -6     812     837     -25 DL     
## 6  2013     1     1      554         558      -4     740     728      12 UA     
## # … with 9 more variables: flight <int>, tailnum <chr>, origin <chr>,
## #   dest <chr>, air_time <dbl>, distance <dbl>, hour <dbl>, minute <dbl>,
## #   time_hour <dttm>, and abbreviated variable names ¹​sched_dep_time,
## #   ²​dep_delay, ³​arr_time, ⁴​sched_arr_time, ⁵​arr_delay

Karena package nycflights13 sudah Anda aktifkan sebelumnya maka ketika data flights dipanggil tidak akan muncul error.