Lembaga : UIN Maulana Malik Ibrahim Malang, Teknik Informatika.

Visualisasi Data

Visualisasi data merupakan bagian yang sangat penting untuk mengkomunikasikan hasil analisa yang telah kita lakukan. Selain itu, komunikasi juga membantu kita untuk memperoleh gambaran terkait data selama proses analisa data sehingga membantu kita dalam memutuskan metode analisa apa yang dapat kita terapkan pada data tersebut.

R memiliki library visualisasi yang sangat beragam, baik yang merupakan fungsi dasar pada R maupun dari sumber lain seperti ggplot dan lattice. Seluruh library visualisasi tersebut memiliki kelebihan dan kekurangannya masing-masing.

1. Visualisasi Data Menggunakan Fungsi plot()

Fungsi plot() merupakan fungsi umum yang digunakan untuk membuat plot pada R. Format dasarnya adalah sebagai berikut:

plot(x, y, type="p")

Catatan:

  • x dan y: titik koordinat plot Berupa variabel dengan panjang atau jumlah observasi yang sama.

  • type: jenis grafik yang hendak dibuat. Nilai yang dapat dimasukkan antara lain:

    type=“p” : membuat plot titik atau scatterplot. Nilai ini merupakan default pada fungsi plot().

    type=“l” : membuat plot garis.

    type=“b” : membuat plot titik yang terhubung dengan garis.

    type=“o” : membuat plot titik yang ditimpa oleh garis.

    type=“h” : membuat plot garis vertikal dari titik ke garis y=0.

    type=“s” : membuat fungsi tangga.

    type=“n” : tidak membuat grafik plot sama sekali, kecuali plot dari axis. Dapat digunakan untuk mengatur tampilan suatu plot utama yang diikuti oleh sekelompok plot tambahan.

Fungsi lain yang dapat digunakan untuk membuat kurva suatu persamaan matematis adalah fungsi curve(). Berbeda dengan fungsi plot() yang perlu menspesifikasi objek pada sumbu x dan y, fungsi curve() hanya perlu menspesifikasi objek sumbu x saja. Format fungsi curve() adalah sebagai berikut:

curve(expr, from = NULL, to = NULL, add = FALSE)

Catatan:

expr: persamaan matematika

from dan to: nilai awal dan akhir (maksimum atau minimum)

add: nilai logik yang menentukan apakah kurva perlu ditambahkan kedalam kurva sebelumnya.

2. Visualisasi Lainnya

2.1 Bar Plot

Barplot pada R dapat dibuat menggunakan fungsi barplot(). Untuk lebih memahaminya berikut disajikan contoh barplot menggunakan dataset VADeaths. Untuk memuatnya jalankan sintaks berikut:

VADeaths
##       Rural Male Rural Female Urban Male Urban Female
## 50-54       11.7          8.7       15.4          8.4
## 55-59       18.1         11.7       24.3         13.6
## 60-64       26.9         20.3       37.0         19.3
## 65-69       41.0         30.9       54.6         35.1
## 70-74       66.0         54.3       71.1         50.0 

Kita dapat mengubah warna pada masing-masing bar, baik outline bar maupun box pada bar. Selain itu kita juga dapat mengubah nama grup yang telah dihasilkan sebelumnya. Berikut sintaks untuk melakukannya dan output yang dihasilkan pada Gambar 3.5:

barplot(VADeaths[, "Rural Male"],
        # ubah warna ouline menjadi steelblue
        border="steelblue",
        # ubah wana box
        col= c("grey", "yellow", "steelblue", "green", "orange"),
        # ubah nama grup dari A sampai E
        names.arg = LETTERS[1:5],
        # ubah orientasi menajadi horizontal
        horiz=TRUE)

Untuk bar plot dengan multiple group, tersedia dua pengaturan posisi yaitu stacked bar plot(menunjukkan proporsi penyusun pada masing-masing grup) dan grouped bar plot(melihat perbedaan individual pada masing-masing grup). Pada Gambar 3.6 dan Gambar 3.7 , disajikan kedua jenis bar plot tersebut.

# staked
barplot(VADeaths,
        col = c("lightblue", "mistyrose", "lightcyan", 
                "lavender", "cornsilk"),
        legend = rownames(VADeaths))
        

# grouped
barplot(VADeaths,
        col = c("lightblue", "mistyrose", "lightcyan", 
                 "lavender", "cornsilk"),
        legend = rownames(VADeaths), beside = TRUE)

Referensi

https://bookdown.org/moh_rosidi2610/Metode_Numerik/dataviz.html#plotfunc