Menambah, Menghapus, dan Menggabungkan Data

Dalam contoh program di bawah ini, kita akan menjelajahi beberapa operasi dasar yang dapat dilakukan dengan dplyr dalam pemrograman R. Khususnya, kita akan fokus pada tiga operasi penting, yaitu menambahkan kolom baru, menghapus kolom, dan menggabungkan data frame.

Berikut Percobaan yang Dilakukan :

Pertama panggil library(dplyr).

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Menambah Kolom Baru dengan mutate():

Dalam pemrograman R, kita dapat menambahkan kolom baru ke dalam data frame menggunakan fungsi mutate() dari library dplyr. Fungsi ini memungkinkan kita untuk melakukan perhitungan atau transformasi pada kolom yang ada, dan menambahkan hasilnya sebagai kolom baru ke dalam data frame.

# Membuat data frame contoh
data <- data.frame(
  nama = c("John", "Jane", "Alice"),
  usia = c(25, 30, 28),
  nilai_matematika = c(80, 90, 85)
)

# Menambahkan kolom baru dengan perhitungan
data_new <- data %>%
  mutate(nilai_rata = (nilai_matematika + 90) / 2)

# Menampilkan data frame hasil
print(data_new)
##    nama usia nilai_matematika nilai_rata
## 1  John   25               80       85.0
## 2  Jane   30               90       90.0
## 3 Alice   28               85       87.5

Pada contoh di atas, kita memiliki data frame data yang terdiri dari kolom nama, usia, dan nilai_matematika. Kita menggunakan fungsi mutate() untuk menambahkan kolom baru dengan nama nilai_rata. Dalam contoh ini, kita melakukan perhitungan rata-rata dengan menambahkan 90 ke nilai_matematika dan membaginya dengan 2. Hasil perhitungan tersebut disimpan dalam kolom baru nilai_rata.

Menghapus Kolom dengan select():

Untuk menghapus kolom tertentu dari data frame menggunakan dplyr, kita dapat menggunakan fungsi select() dengan argumen negatif. Dengan menentukan kolom-kolom yang ingin dihapus dengan tanda negatif (-), kolom-kolom tersebut akan dihapus dari data frame.

# Membuat data frame contoh
data <- data.frame(
  nama = c("John", "Jane", "Alice"),
  usia = c(25, 30, 28),
  nilai_matematika = c(80, 90, 85)
)

# Menghapus kolom tertentu
data_new <- data %>%
  select(-usia)

# Menampilkan data frame hasil
print(data_new)
##    nama nilai_matematika
## 1  John               80
## 2  Jane               90
## 3 Alice               85

Pada contoh di atas, kita menggunakan fungsi select() dengan argumen negatif (-usia) untuk menghapus kolom usia dari data frame. Hasilnya, data frame data_new hanya akan memiliki kolom nama dan nilai_matematika.

Menggabungkan Data dengan join():

Untuk menggabungkan dua atau lebih data frame berdasarkan kolom-kolom tertentu, kita dapat menggunakan fungsi-fungsi join seperti left_join(), inner_join(), full_join(), dan lainnya. Fungsi-fungsi ini memungkinkan kita untuk menggabungkan data frame berdasarkan kesamaan pada kolom-kolom tertentu.

# Membuat data frame contoh
data1 <- data.frame(
  nama = c("John", "Jane", "Alice"),
  nilai = c(80, 90, 85)
)

data2 <- data.frame(
  nama = c("John", "Jane", "Bob"),
  usia = c(25, 30, 32)
)

# Menggabungkan data frame berdasarkan kolom "nama"
data_new <- left_join(data1, data2, by = "nama")

# Menampilkan data frame hasil
print(data_new)
##    nama nilai usia
## 1  John    80   25
## 2  Jane    90   30
## 3 Alice    85   NA

Pada contoh di atas, kita memiliki dua data frame, yaitu data1 dan data2, yang memiliki kolom yang sama yaitu nama. Kita menggunakan fungsi left_join() untuk menggabungkan kedua data frame berdasarkan kolom nama. Hasilnya, data frame data_new akan berisi kolom nama, nilai, dan usia dengan data yang sesuai dari kedua data frame.

Perlu diperhatikan bahwa ada beberapa jenis join yang tersedia dalam dplyr seperti left_join(), inner_join(), full_join(), right_join(), dan sebagainya. Pemilihan jenis join yang sesuai tergantung pada kebutuhan analisis data yang ingin dilakukan.