Bertujuan untuk memahami penggunaan dasar bahasa pemrograman R dalampengolahan dan manipulasi data statistika.
nama_vector <- c(5, FALSE, “true”, “8.3”, “Statistika”)
nama_vector
Dari perintah tersebut diperoleh sebuah vector yang seluruh elemennya bertipe character. Dibuktikan dengan tanda kutip pada setiap nilai pada output. Artinya, semuanya dianggap teks (character). Hal ini terjadi karena dalam satu vector terdapat data dengan tipe yang berbeda, sehingga R mengubah semua elemen menjadi teks agar seragam.
contoh_list <- list(5, FALSE, “true”, “8.3”, “Statistika”)
contoh_list
List dengan nama contoh_list berhasil dibuat menggunakan elemen yang sama seperti pada Latihan nomor 1. Berbeda dengan vector, list di R dapat menyimpan elemen dengan tipe data yang berbeda tanpa melakukan konversi tipe data. Oleh karena itu, setiap elemen dalam list tetap mempertahankan tipe data aslinya, seperti numeric, logical, dan character.
vector: Satu tipe data
List: bisa bebas campur tipe data
kelompok_kkn <- data.frame(
nama = c(“Aim”,“Kia”,“Naya”,“Kirana”,“Wina”,“Priska”,“Vina”,“Amel”,“Nabila”,“Nadhifa”),
nim = c(“21001”,“21002”,“21003”,“21004”,“21005”, “21006”,“21007”,“21008”,“21009”,“21010”),
prodi = c(“Statistika”,“Statistika”,“Matematika”,“Statistika”,“Informatika”, “Statistika”,“Matematika”,“Informatika”,“Statistika”,“Statistika”) )
kelompok_kkn
kelompok_kkn[1, ]
kelompok_kkn[3:5, ]
kelompok_kkn$nama
kelompok_kkn$prodi
kelompok_kkn[2, 1]
kelompok_kkn[4, “prodi”]
Pada data frame, pemanggilan data dapat dilakukan dengan menggunakan indeks baris dan kolom maupun nama kolom. Pemanggilan baris digunakan untuk mengambil seluruh kolom pada baris tertentu, pemanggilan kolom digunakan untuk mengambil seluruh baris pada kolom tertentu, sedangkan pemanggilan elemen digunakan untuk mengambil satu nilai spesifik berdasarkan posisi baris dan kolom.
data_na <- data.frame(
nama = c(“Ari”, “Disa”, “Abel”, “Dhona”, “Mahda”),
nilai = c(80, NA, 75, NA, 90),
hadir = c(TRUE, TRUE, NA, FALSE, TRUE)
)
data_na
is.na(data_na)
which(is.na(data_na), arr.ind = TRUE)
Data frame data_na dibuat dengan beberapa nilai yang berupa missing value (NA). Untuk mengetahui keberadaan data yang hilang, digunakan fungsi is.na() yang menghasilkan nilai TRUE pada data yang bernilai NA dan FALSE pada data yang tidak bernilai NA. Selanjutnya, fungsi which() digunakan untuk mengetahui posisi baris dan kolom dari data yang bernilai NA tersebut.
Secara keseluruhan, penggunaan bahasa R mempermudah proses pengolahan dan eksplorasi data melalui berbagai struktur data yang fleksibel dan sistematis.