Karena dibuat untuk memudahkan analisis data, R mempunyai banyak
fungsi yang tersedia untuk melakukan analisis statistik. Untuk
mendapatkan nilai rata-rata dari sebuah vector numeric Anda dapat
langsung gunakan fungsi mean(). Untuk mendapatkan milai
minimum atau maksimum tersedia
fungsi min() dan max().
Fungsi sd() dapat digunakan untuk mendapatkan nilai
standard deviasi atau fungsi var() untuk mendapatkan nilai
ragam (varians). Perhatikan contoh berikut ini.
x <- seq(1, 100, by = 4)
# Rata-rata vector x
mean(x)
## [1] 49
# Minimum dari vector x
min(x)
## [1] 1
# Maksimum dari vector x
max(x)
## [1] 97
Jika Anda ingin mencari nilai minimum dan maksimum sekaligus, Anda
dapat gunakan fungsi range(). Output dari fungsi ini adalah
vector numeric dengan dua elemen berisi nilai minimum dan maksimum.
range(x)
## [1] 1 97
Jika Anda ingin mencari nilai statistik lima serangkai (minimum, Q1,
Q2 atau median, Q3, maksimum), Anda dapat gunakan
fungsi summary().
summary(x)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1 25 49 49 73 97
Gambar 1: Aktifkan Package pada Tab Packages
Jika fungsi atau data yang akan Anda gunakan berasal dari sebuah
package, maka Anda dapat gunakan
fungsi library(), require() atau klik beri
tanda checklist pada tab Packages seperti pada
Gambar 1 untuk mengaktifkan package tersebut pada session yang
sedang Anda gunakan. Tentunya package tersebut harus sudah Anda install
sebelumnya. Misalnya Anda ingin menggunakan
data flights dari package nycflights13. Hal
pertama Anda harus pastikan package tersebut sudah terinstall dengan
baik di R Anda. Jika Anda belum install package tersebut Anda dapat
menginstallnya dengan perintah berikut.
install.packages("nycflights13")
Kaetika Anda akan install sebuah package, nama package tersebut harus
berupa string. Anda hanya perlu melakukan satu kali install
saja, tidak perlu install ketika setiap kali akan Anda gunakan. Sekarang
Anda coba untuk memanggil data flights dari
package nycflights13 tanpa mengaktifkan package terlebih
dahulu. Maka akan muncul sebuah error yang menyatakan bahwa
objek flights tidak ditemukan.
flights
## Error: object 'flights' not found
Karena data flights ada di dalam
package nycflights13 maka Anda perlu aktifkan terlebih
dahulu package tersebut. Anda dapat mengaktifkannya dengan perintah
berikut ini.
library(nycflights13)
## Warning: package 'nycflights13' was built under R version 4.2.3
Kemudian panggil data flights. Kita gunakan
fungsi head() untuk menampilkan beberapa baris pertama saja
dari data. Secara default fungsi head() akan menampilkan 6
baris pertama saja dari data yang kita sebutkan pada argumen
pertamanya.
head(flights)
## # A tibble: 6 × 19
## year month day dep_time sched_dep…¹ dep_d…² arr_t…³ sched…⁴ arr_d…⁵ carrier
## <int> <int> <int> <int> <int> <dbl> <int> <int> <dbl> <chr>
## 1 2013 1 1 517 515 2 830 819 11 UA
## 2 2013 1 1 533 529 4 850 830 20 UA
## 3 2013 1 1 542 540 2 923 850 33 AA
## 4 2013 1 1 544 545 -1 1004 1022 -18 B6
## 5 2013 1 1 554 600 -6 812 837 -25 DL
## 6 2013 1 1 554 558 -4 740 728 12 UA
## # … with 9 more variables: flight <int>, tailnum <chr>, origin <chr>,
## # dest <chr>, air_time <dbl>, distance <dbl>, hour <dbl>, minute <dbl>,
## # time_hour <dttm>, and abbreviated variable names ¹sched_dep_time,
## # ²dep_delay, ³arr_time, ⁴sched_arr_time, ⁵arr_delay
Karena package nycflights13 sudah Anda aktifkan
sebelumnya maka ketika data flights dipanggil tidak akan
muncul error.