Dosen Pengampu : Prof. Dr. Suhartono, M.Kom

Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang

Jurusan : Teknik Informatika

Pengertian Visualisasi Data

Visualisasi Data adalah komunikasi visual data atau konversi data mentah menjadi wawasan yang dapat dengan mudah ditafsirkan oleh pembaca Anda. Visualisasi data merupakan bagian yang sangat penting untuk mengkomunikasikan hasil analisis yang kita lakukan. Selain itu, komunikasi juga membantu untuk mendapatkan gambaran umum tentang data selama proses analisis data sehingga dapat memutuskan metode analisis mana yang akan diterapkan pada data tersebut. Salah satu fungsi yang dimiliki R untuk visualisasi data adalah fungsi boxplot().

Visualisasi Data Menggunakan Fungsi boxplot()

Fungsi barplot() adalah fungsi umum untuk membuat diagram kotak pada R. Untuk pemahaman yang lebih baik, berikut adalah contoh diagram kotak dengan variabel Sepal.Lenght pada dataset iris . Untuk menjalankannya, jalankan sintaks berikut :

boxplot(iris$Sepal.Length)

barplot juga dapat membuat diagram kotak berdasarkan variabel faktor. Hal ini berguna untuk melihat perbedaan distribusi data antar kelompok. Untuk pemahaman yang lebih baik, berikut adalah contoh diagram kotak dibuat berdasarkan variabel Spesies.

boxplot(iris$Sepal.Length~iris$Species)

Selain itu kita juga dapat merubah warna bilah garis maupun bilah kotak pada boxplot. Dibawah ini merupakan sintaks untuk menjalankan perintah tersebut :

boxplot(iris$Sepal.Length~iris$Species,
        # ubah warna outline menjadi black
        
        border = "black",
        
        # ubah warna box berdasarkan grup
        
        col= c("mistyrose", "lightcyan", "lavender"))

Kemudian kita juga dapat membuat boxplot pada multiple group. Berikut adalah contoh boxplot dengan multiple group dibuat berdasarkan dataset ToothGrowth yang dapat dijalankan melalui sintaks berikut :

# ubah variable dose menjadi factor

ToothGrowth$dose <- as.factor(ToothGrowth$dose)

# print

head(ToothGrowth)
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5

Terapkan hasil output diatas kedalam boxplot multiple group melalui sintaks berikut :

boxplot(len ~ supp*dose, data = ToothGrowth,
        col = c("cornsilk", "lightblue"))

Refrensi

https://bookdown.org/moh_rosidi2610/Metode_Numerik/dataviz.html#customise