nama_vector <- c(5, FALSE, "True", "8.3", "Statistika")
nama_vector
## [1] "5"          "FALSE"      "True"       "8.3"        "Statistika"
Perintah di atas digunakan untuk membuat sebuah vector yang terdiri dari beberapa tipe data. Namun, karena vector di R hanya dapat menyimpan satu tipe data, seluruh elemen secara otomatis diubah menjadi bertipe character. Hal ini terjadi karena adanya elemen berupa teks sehingga R melakukan konversi tipe data (coercion) agar semua elemen memiliki tipe yang sama.
contoh_list <- list(5, FALSE, "True", "8.3", "Statistika")
contoh_list
## [[1]]
## [1] 5
## 
## [[2]]
## [1] FALSE
## 
## [[3]]
## [1] "True"
## 
## [[4]]
## [1] "8.3"
## 
## [[5]]
## [1] "Statistika"
Pada list, setiap elemen tetap mempertahankan tipe datanya masing-masing sehingga tidak terjadi konversi seperti pada vector. Dengan demikian, list dapat menyimpan data dengan tipe yang berbeda dalam satu objek, sedangkan vector mengharuskan seluruh elemennya memiliki tipe data yang seragam.
kelompok_kkn <- data.frame(
  nama = c("Hilmi", "Zulfa", "Wahyu", "Anisa", "Fatma", "Nur", "Fidelia", "Mustafa", "Gita", "Erine"),
  nim = c(240401,240402,240403,240404,240405,
          240406,240407,240408,240409,240410),
  prodi = c("Statistika","PGSD","Akutansi","Fisika","Olahraga",
            "Kesehatan","Elektro","Matematika","Biologi","Kimia")
)
kelompok_kkn
##       nama    nim      prodi
## 1    Hilmi 240401 Statistika
## 2    Zulfa 240402       PGSD
## 3    Wahyu 240403   Akutansi
## 4    Anisa 240404     Fisika
## 5    Fatma 240405   Olahraga
## 6      Nur 240406  Kesehatan
## 7  Fidelia 240407    Elektro
## 8  Mustafa 240408 Matematika
## 9     Gita 240409    Biologi
## 10   Erine 240410      Kimia
Data frame yang dibuat berisi tiga kolom, yaitu nama, nim, dan prodi.
kelompok_kkn[1,]
##    nama    nim      prodi
## 1 Hilmi 240401 Statistika
kelompok_kkn[2,]
##    nama    nim prodi
## 2 Zulfa 240402  PGSD
Pemanggilan data dapat dilakukan dengan menentukan nomor baris dan kolom menggunakan format “dataframe[baris, kolom]”. Jika hanya ingin mengambil beberapa baris, dapat menggunakan tanda “:” untuk menentukan rentang baris, misalnya “6:20”. Cara ini memudahkan pengguna dalam mengambil data sesuai kebutuhan, baik sebagian maupun keseluruhan isi tabel.
data_na <- data.frame(
  Nama = c("Hilmi","Fidelia","Zulfa",NA,"Nur"),
  Nilai = c(86, 81, 90, 75, NA)
)
data_na
##      Nama Nilai
## 1   Hilmi    86
## 2 Fidelia    81
## 3   Zulfa    90
## 4    <NA>    75
## 5     Nur    NA
is.na(data_na)
##       Nama Nilai
## [1,] FALSE FALSE
## [2,] FALSE FALSE
## [3,] FALSE FALSE
## [4,]  TRUE FALSE
## [5,] FALSE  TRUE
which(is.na(data_na), arr.ind = TRUE)
##      row col
## [1,]   4   1
## [2,]   5   2
sum(is.na(data_na))
## [1] 2
Data frame di atas memiliki beberapa nilai NA yang menunjukkan adanya data yang belum terisi. Fungsi is.na() digunakan untuk mengidentifikasi letak nilai tersebut, di mana hasil TRUE menandakan adanya missing value. Untuk mengetahui posisi tepat dari missing value, digunakan fungsi which(…, arr.ind = TRUE) sehingga diperoleh indeks baris dan kolom tempat NA berada. Selanjutnya, fungsi sum(is.na()) digunakan untuk menghitung jumlah keseluruhan nilai NA, dan dari hasil yang diperoleh terdapat 2 missing value dalam data frame tersebut.