Dalam pemrograman R, library dplyr sangat populer untuk melakukan manipulasi dan transformasi data frame dengan mudah. dplyr menyediakan sejumlah fungsi yang efisien dan intuitif untuk melakukan operasi seperti mengubah kolom, melakukan filtering, mengurutkan data, mengelompokkan data, dan melakukan operasi agregasi. Dengan dplyr, kita dapat melakukan transformasi data frame dengan lebih efisien dan mudah dibaca.
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Membentuk data frame
data <- data.frame(
nama = c("John", "Jane", "Alice", "Bob"),
usia = c(25, 30, 28, 35),
kota = c("Jakarta", "Bandung", "Surabaya", "Medan"),
gaji = c(5000, 6000, 5500, 7000)
)
# Operasi Kolom
data <- data %>% mutate(gaji_tahunan = gaji * 12)
# Filtering
data_filtered <- data %>% filter(usia >= 30)
# Sorting
data_sorted <- data %>% arrange(nama)
# Grouping dan Operasi Agregasi
data_grouped <- data %>%
group_by(kota) %>%
summarise(rata_gaji = mean(gaji), max_usia = max(usia))
# Menampilkan data frame hasil
print(data)
## nama usia kota gaji gaji_tahunan
## 1 John 25 Jakarta 5000 60000
## 2 Jane 30 Bandung 6000 72000
## 3 Alice 28 Surabaya 5500 66000
## 4 Bob 35 Medan 7000 84000
print(data_filtered)
## nama usia kota gaji gaji_tahunan
## 1 Jane 30 Bandung 6000 72000
## 2 Bob 35 Medan 7000 84000
print(data_sorted)
## nama usia kota gaji gaji_tahunan
## 1 Alice 28 Surabaya 5500 66000
## 2 Bob 35 Medan 7000 84000
## 3 Jane 30 Bandung 6000 72000
## 4 John 25 Jakarta 5000 60000
print(data_grouped)
## # A tibble: 4 × 3
## kota rata_gaji max_usia
## <chr> <dbl> <dbl>
## 1 Bandung 6000 30
## 2 Jakarta 5000 25
## 3 Medan 7000 35
## 4 Surabaya 5500 28
Pada contoh di atas, kita mengimpor library dplyr untuk melakukan operasi pada data frame. Kemudian, kita membentuk data frame dengan beberapa kolom seperti nama, usia, kota, dan gaji. Selanjutnya, kita menggunakan fungsi-fungsi dari dplyr untuk melakukan operasi kolom, filtering, sorting, grouping, dan operasi agregasi pada data frame.
Setelah melakukan operasi tersebut, kita mencetak data frame hasil menggunakan fungsi print().