Pendahuluan
Dalam pemrograman R, efisiensi dan keterbacaan kode seringkali
menjadi kunci dalam pengolahan data yang kompleks. Untuk mencapai hal
tersebut, R menyediakan sekumpulan fungsi yang dikenal sebagai keluarga
apply(), yaitu apply(), lapply(), sapply(), dan tapply(). Fungsi-fungsi
ini mendukung prinsip vectorization dan functional programming, yang
memudahkan pemrosesan elemen data tanpa perlu menggunakan for loop
secara eksplisit.
- apply() digunakan untuk menerapkan fungsi ke seluruh baris atau
kolom matriks atau array.
- lapply() digunakan untuk menerapkan fungsi ke setiap elemen dalam
list dan mengembalikan list hasilnya.
- sapply() mencoba menyederhanakan hasil lapply() menjadi vektor atau
matriks, jika memungkinkan.
- tapply() ideal untuk agregasi data berdasarkan kelompok/faktor
tertentu.
Penggunaan fungsi-fungsi ini tidak hanya mempercepat eksekusi, tetapi
juga memperjelas alur logika pemrograman. Mereka juga merupakan
perwujudan dari strategi split–apply–combine, yaitu pendekatan di mana
data dibagi menjadi kelompok, fungsi diterapkan pada tiap kelompok, dan
hasilnya digabungkan kembali.
Keunggulan
Fungsi apply dan keluarganya
Mengganti Loop Tradisional
Daripada menggunakan perulangan for, keluarga apply
memungkinkan untuk menulis kode deklaratif yang lebih mudah
dibaca.
Efisiensi Kinerja
Fungsi apply umumnya lebih cepat daripada for loop karena
optimalisasi internal oleh interpreter R.
Fleksibilitas Tinggi
Dapat digunakan untuk berbagai struktur data: vektor, matriks, list,
array, dan bahkan kombinasi antar-objek.
Output yang Konsisten dan Dapat
Disesuaikan
Beberapa fungsi seperti vapply() memungkinkan kamu
mengontrol tipe dan panjang hasil output, menambah keamanan dalam
pemrosesan data besar.
Sintaks yang ringkas — cukup satu baris kode
dibandingkan blok loop yang panjang :contentReferenceoaicite:1.
Kinerja lebih baik, terutama pada dataset besar,
karena pemrosesan yang lebih cepat dibanding dengan iterasi manual
:contentReferenceoaicite:2.
Fungsi
apply dan Keluarganya
Fungsi
apply().
Fungsi apply() adalah fungsi di R yang digunakan untuk
menerapkan suatu fungsi tertentu, seperti penjumlahan, rata-rata, atau
nilai maksimum, ke seluruh baris atau kolom dari data yang berbentuk
matriks, array, atau data frame. Dengan menggunakan apply(), kita bisa
melakukan perhitungan secara efisien tanpa harus mengulang perintah
untuk tiap baris atau kolom secara manual.
Struktur
Umum
apply(X, MARGIN, FUN, …)
Keterangan:
- X: Objek yang akan diiterasi, seperti matriks atau array.
- MARGIN: Angka yang menunjukkan dimensi yang akan diterapkan fungsi.
1 untuk baris, 2 untuk kolom, dan c(1, 2) untuk seluruh elemen.
- FUN: Fungsi yang akan diterapkan pada setiap baris atau kolom.
- …: Argumen tambahan yang akan diteruskan ke fungsi FUN.
Contoh
Penggunaan
# Membuat matrix nilai siswa
nilai <- matrix(
c(80, 70, 95, # Matematika
85, 65, 90, # Fisika
90, 75, 85, # Kimia
75, 60, 80), # Biologi
nrow = 3,
byrow = FALSE
)
# Tambahkan nama baris dan kolom
rownames(nilai) <- c("Siswa1", "Siswa2", "Siswa3")
colnames(nilai) <- c("Matematika", "Fisika", "Kimia", "Biologi")
# Tampilkan matrix
nilai
## Matematika Fisika Kimia Biologi
## Siswa1 80 85 90 75
## Siswa2 70 65 75 60
## Siswa3 95 90 85 80
# Menampilkan hasil apply
apply(nilai, 1, sum) # total nilai per siswa
## Siswa1 Siswa2 Siswa3
## 330 270 350
apply(nilai, 1, mean) # rata-rata nilai per siswa
## Siswa1 Siswa2 Siswa3
## 82.5 67.5 87.5
apply(nilai, 2, mean) # rata-rata per mata pelajaran
## Matematika Fisika Kimia Biologi
## 81.66667 80.00000 83.33333 71.66667
apply(nilai, 1, max) # nilai tertinggi tiap siswa
## Siswa1 Siswa2 Siswa3
## 90 75 95
apply(nilai, 1, sort) # urutkan nilai tiap siswa
## Siswa1 Siswa2 Siswa3
## [1,] 75 60 80
## [2,] 80 65 85
## [3,] 85 70 90
## [4,] 90 75 95
Fungsi
lapply().
Fungsi lapply() di R digunakan untuk menjalankan suatu
fungsi pada setiap elemen dari sebuah list, vektor, atau data frame,
lalu hasilnya akan dikembalikan dalam bentuk list juga, dengan jumlah
elemen yang sama seperti inputnya. Karena lapply() langsung
bekerja pada setiap elemen dalam list, kita tidak perlu menentukan baris
atau kolom (tidak perlu pakai MARGIN).
Struktur
Umum
lapply(X, FUN, …)
Keterangan:
- X: Objek yang akan diiterasi, seperti list atau vektor.
- FUN: Fungsi yang akan diterapkan pada setiap elemen dari
X.
- …: Argumen tambahan yang akan diteruskan ke fungsi
FUN.
Contoh
Penggunaan
# List berisi nilai dari beberapa siswa
nilai_siswa <- list(
Siswa1 = c(80, 85, 90),
Siswa2 = c(75, 70, 80),
Siswa3 = c(90, 95, 85)
)
# Hitung rata-rata nilai setiap siswa
lapply(nilai_siswa, mean)
## $Siswa1
## [1] 85
##
## $Siswa2
## [1] 75
##
## $Siswa3
## [1] 90
Fungsi
sapply().
Fungsi sapply() adalah salah satu fungsi dari keluarga
apply di R yang digunakan untuk menerapkan suatu fungsi ke setiap elemen
dari list, vector, atau data frame. Fungsi ini bekerja mirip seperti
lapply(), tetapi sapply() secara
otomatis mencoba menyederhanakan hasilnya menjadi bentuk yang lebih
sederhana, yaitu berupa vector,
matrix, atau array, jika memungkinkan.
Fungsi sapply() sangat berguna untuk menghindari hasil
berupa list jika hasil yang lebih sederhana dapat dibuat.
Struktur
umum
sapply(X, FUN, …)
Keterangan:
- X = list, vector, atau data frame yang akan diproses
- FUN = fungsi yang akan diterapkan pada setiap elemen
- … = argumen tambahan untuk fungsi tersebut
Contoh
Penggunaan
#Kuadrat angka 1 sampai 5
hasil_kuadrat <- sapply(1:5, function(x) x^2)
hasil_kuadrat
## [1] 1 4 9 16 25
## Contoh data jumlah soal
jumlah_soal <- c(5, 6, 7, 8, 9)
#Hitung soal genap dalam satu sapply
hasil_sapply <- sapply(jumlah_soal, function(n) {
soal <- 1:n # Buat urutan 1 sampai n
sum(soal %% 2 == 0) # Hitung berapa yang genap
})
hasil_sapply
## [1] 2 3 3 4 4
Fungsi
tapply().
Fungsi tapply() merupakan salah satu fungsi penting di R
yang digunakan untuk membuat ringkasan data dalam bentuk tabel. Fungsi
ini bekerja dengan cara menerapkan suatu fungsi tertentu (seperti mean
atau variance) pada kelompok data berdasarkan kategori tertentu
(faktor).
Struktur
umum
tapply(X, INDEX, FUN, …)
Keterangan:
- X = vektor yang berisi data numerik atau karakter
- INDEX = faktor (atau list faktor) yang mendefinisikan kelompok
- FUN = fungsi yang akan diterapkan ke masing-masing kelompok
- … = argumen tambahan untuk fungsi
Contoh
Penggunaan
# Data nilai siswa
nilai <- c(80, 75, 90, 85, 70, 95, 88, 77)
# Data jenis kelamin (L = laki-laki, P = perempuan)
gender <- c("L", "P", "L", "P", "P", "L", "L", "P")
# Tampilkan sebagai data frame
data.frame(Nilai = nilai, Gender = gender)
## Nilai Gender
## 1 80 L
## 2 75 P
## 3 90 L
## 4 85 P
## 5 70 P
## 6 95 L
## 7 88 L
## 8 77 P
tapply(nilai, gender, mean)
## L P
## 88.25 76.75
tapply(nilai, gender, length)
## L P
## 4 4
Kesimpulan
Keluarga fungsi apply di R menyediakan cara yang efisien
dan idiomatik untuk menerapkan fungsi pada elemen-elemen dari struktur
data seperti vektor, matriks, list, dan data frame. Dengan menggunakan
fungsi-fungsi seperti apply(), lapply(),
sapply(), tapply(), vapply(),
mapply(), dan rapply(), pengguna dapat
menghindari penggunaan perulangan eksplisit, membuat kode lebih ringkas,
dan meningkatkan kinerja pemrosesan data.
Tabel
perbandingan
apply() |
Matriks/Array |
Vektor |
Menghitung rata-rata per kolom |
lapply() |
List/Vektor |
List |
Menghitung panjang setiap elemen |
sapply() |
List/Vektor |
Vektor/Matrix |
Menghitung kuadrat setiap elemen |
tapply() |
Vektor |
Array |
Menghitung rata-rata berdasarkan grup |
