1 Pendahuluan

Dalam pemrograman R, efisiensi dan keterbacaan kode seringkali menjadi kunci dalam pengolahan data yang kompleks. Untuk mencapai hal tersebut, R menyediakan sekumpulan fungsi yang dikenal sebagai keluarga apply(), yaitu apply(), lapply(), sapply(), dan tapply(). Fungsi-fungsi ini mendukung prinsip vectorization dan functional programming, yang memudahkan pemrosesan elemen data tanpa perlu menggunakan for loop secara eksplisit.

  • apply() digunakan untuk menerapkan fungsi ke seluruh baris atau kolom matriks atau array.
  • lapply() digunakan untuk menerapkan fungsi ke setiap elemen dalam list dan mengembalikan list hasilnya.
  • sapply() mencoba menyederhanakan hasil lapply() menjadi vektor atau matriks, jika memungkinkan.
  • tapply() ideal untuk agregasi data berdasarkan kelompok/faktor tertentu.

Penggunaan fungsi-fungsi ini tidak hanya mempercepat eksekusi, tetapi juga memperjelas alur logika pemrograman. Mereka juga merupakan perwujudan dari strategi split–apply–combine, yaitu pendekatan di mana data dibagi menjadi kelompok, fungsi diterapkan pada tiap kelompok, dan hasilnya digabungkan kembali.


1.1 Keunggulan Fungsi apply dan keluarganya

  1. Mengganti Loop Tradisional
    Daripada menggunakan perulangan for, keluarga apply memungkinkan untuk menulis kode deklaratif yang lebih mudah dibaca.

  2. Efisiensi Kinerja
    Fungsi apply umumnya lebih cepat daripada for loop karena optimalisasi internal oleh interpreter R.

  3. Fleksibilitas Tinggi
    Dapat digunakan untuk berbagai struktur data: vektor, matriks, list, array, dan bahkan kombinasi antar-objek.

  4. Output yang Konsisten dan Dapat Disesuaikan
    Beberapa fungsi seperti vapply() memungkinkan kamu mengontrol tipe dan panjang hasil output, menambah keamanan dalam pemrosesan data besar.

  5. Sintaks yang ringkas — cukup satu baris kode dibandingkan blok loop yang panjang :contentReferenceoaicite:1.

  6. Kinerja lebih baik, terutama pada dataset besar, karena pemrosesan yang lebih cepat dibanding dengan iterasi manual :contentReferenceoaicite:2.


2 Fungsi apply dan Keluarganya

2.1 Fungsi apply().

Fungsi apply() adalah fungsi di R yang digunakan untuk menerapkan suatu fungsi tertentu, seperti penjumlahan, rata-rata, atau nilai maksimum, ke seluruh baris atau kolom dari data yang berbentuk matriks, array, atau data frame. Dengan menggunakan apply(), kita bisa melakukan perhitungan secara efisien tanpa harus mengulang perintah untuk tiap baris atau kolom secara manual.

2.1.1 Struktur Umum

apply(X, MARGIN, FUN, …)

Keterangan:

  • X: Objek yang akan diiterasi, seperti matriks atau array.
  • MARGIN: Angka yang menunjukkan dimensi yang akan diterapkan fungsi. 1 untuk baris, 2 untuk kolom, dan c(1, 2) untuk seluruh elemen.
  • FUN: Fungsi yang akan diterapkan pada setiap baris atau kolom.
  • …: Argumen tambahan yang akan diteruskan ke fungsi FUN.

2.1.2 Contoh Penggunaan

# Membuat matrix nilai siswa
nilai <- matrix(
  c(80, 70, 95,   # Matematika
    85, 65, 90,   # Fisika
    90, 75, 85,   # Kimia
    75, 60, 80),  # Biologi
  nrow = 3,
  byrow = FALSE
)

# Tambahkan nama baris dan kolom
rownames(nilai) <- c("Siswa1", "Siswa2", "Siswa3")
colnames(nilai) <- c("Matematika", "Fisika", "Kimia", "Biologi")

# Tampilkan matrix
nilai
##        Matematika Fisika Kimia Biologi
## Siswa1         80     85    90      75
## Siswa2         70     65    75      60
## Siswa3         95     90    85      80
# Menampilkan hasil apply
apply(nilai, 1, sum)     # total nilai per siswa
## Siswa1 Siswa2 Siswa3 
##    330    270    350
apply(nilai, 1, mean)    # rata-rata nilai per siswa
## Siswa1 Siswa2 Siswa3 
##   82.5   67.5   87.5
apply(nilai, 2, mean)    # rata-rata per mata pelajaran
## Matematika     Fisika      Kimia    Biologi 
##   81.66667   80.00000   83.33333   71.66667
apply(nilai, 1, max)     # nilai tertinggi tiap siswa
## Siswa1 Siswa2 Siswa3 
##     90     75     95
apply(nilai, 1, sort)    # urutkan nilai tiap siswa
##      Siswa1 Siswa2 Siswa3
## [1,]     75     60     80
## [2,]     80     65     85
## [3,]     85     70     90
## [4,]     90     75     95

2.2 Fungsi lapply().

Fungsi lapply() di R digunakan untuk menjalankan suatu fungsi pada setiap elemen dari sebuah list, vektor, atau data frame, lalu hasilnya akan dikembalikan dalam bentuk list juga, dengan jumlah elemen yang sama seperti inputnya. Karena lapply() langsung bekerja pada setiap elemen dalam list, kita tidak perlu menentukan baris atau kolom (tidak perlu pakai MARGIN).

2.2.1 Struktur Umum

lapply(X, FUN, …)

Keterangan:

  • X: Objek yang akan diiterasi, seperti list atau vektor.
  • FUN: Fungsi yang akan diterapkan pada setiap elemen dari X.
  • …: Argumen tambahan yang akan diteruskan ke fungsi FUN.

2.2.2 Contoh Penggunaan

# List berisi nilai dari beberapa siswa
nilai_siswa <- list(
  Siswa1 = c(80, 85, 90),
  Siswa2 = c(75, 70, 80),
  Siswa3 = c(90, 95, 85)
)

# Hitung rata-rata nilai setiap siswa
lapply(nilai_siswa, mean)
## $Siswa1
## [1] 85
## 
## $Siswa2
## [1] 75
## 
## $Siswa3
## [1] 90

2.3 Fungsi sapply().

Fungsi sapply() adalah salah satu fungsi dari keluarga apply di R yang digunakan untuk menerapkan suatu fungsi ke setiap elemen dari list, vector, atau data frame. Fungsi ini bekerja mirip seperti lapply(), tetapi sapply() secara otomatis mencoba menyederhanakan hasilnya menjadi bentuk yang lebih sederhana, yaitu berupa vector, matrix, atau array, jika memungkinkan. Fungsi sapply() sangat berguna untuk menghindari hasil berupa list jika hasil yang lebih sederhana dapat dibuat.

2.3.1 Struktur umum

sapply(X, FUN, …)

Keterangan:

  • X = list, vector, atau data frame yang akan diproses
  • FUN = fungsi yang akan diterapkan pada setiap elemen
  • … = argumen tambahan untuk fungsi tersebut

2.3.2 Contoh Penggunaan

#Kuadrat angka 1 sampai 5
hasil_kuadrat <- sapply(1:5, function(x) x^2)
hasil_kuadrat
## [1]  1  4  9 16 25
## Contoh data jumlah soal
jumlah_soal <- c(5, 6, 7, 8, 9)

#Hitung soal genap dalam satu sapply
hasil_sapply <- sapply(jumlah_soal, function(n) {
  soal <- 1:n         # Buat urutan 1 sampai n
  sum(soal %% 2 == 0) # Hitung berapa yang genap
})

hasil_sapply
## [1] 2 3 3 4 4

2.4 Fungsi tapply().

Fungsi tapply() merupakan salah satu fungsi penting di R yang digunakan untuk membuat ringkasan data dalam bentuk tabel. Fungsi ini bekerja dengan cara menerapkan suatu fungsi tertentu (seperti mean atau variance) pada kelompok data berdasarkan kategori tertentu (faktor).

2.4.1 Struktur umum

tapply(X, INDEX, FUN, …)

Keterangan:

  • X = vektor yang berisi data numerik atau karakter
  • INDEX = faktor (atau list faktor) yang mendefinisikan kelompok
  • FUN = fungsi yang akan diterapkan ke masing-masing kelompok
  • … = argumen tambahan untuk fungsi

2.4.2 Contoh Penggunaan

# Data nilai siswa
nilai <- c(80, 75, 90, 85, 70, 95, 88, 77)

# Data jenis kelamin (L = laki-laki, P = perempuan)
gender <- c("L", "P", "L", "P", "P", "L", "L", "P")

# Tampilkan sebagai data frame
data.frame(Nilai = nilai, Gender = gender)
##   Nilai Gender
## 1    80      L
## 2    75      P
## 3    90      L
## 4    85      P
## 5    70      P
## 6    95      L
## 7    88      L
## 8    77      P
tapply(nilai, gender, mean)
##     L     P 
## 88.25 76.75
tapply(nilai, gender, length)
## L P 
## 4 4

3 Kesimpulan

Keluarga fungsi apply di R menyediakan cara yang efisien dan idiomatik untuk menerapkan fungsi pada elemen-elemen dari struktur data seperti vektor, matriks, list, dan data frame. Dengan menggunakan fungsi-fungsi seperti apply(), lapply(), sapply(), tapply(), vapply(), mapply(), dan rapply(), pengguna dapat menghindari penggunaan perulangan eksplisit, membuat kode lebih ringkas, dan meningkatkan kinerja pemrosesan data.

4 Tabel perbandingan

Fungsi Input Output Contoh Penggunaan
apply() Matriks/Array Vektor Menghitung rata-rata per kolom
lapply() List/Vektor List Menghitung panjang setiap elemen
sapply() List/Vektor Vektor/Matrix Menghitung kuadrat setiap elemen
tapply() Vektor Array Menghitung rata-rata berdasarkan grup

5 Referensi

