NIM : 220605110107

Universitas : Universitas Islam Negeri Maulana Malik Ibrahim Malang

Jurusan : Teknik Informatika

Definisi visualisasi data Visualisasi data adalah komunikasi visual informasi, atau konversi data mentah menjadi wawasan yang dapat ditafsirkan dengan mudah oleh pembaca Anda. Visualisasi data adalah bagian yang sangat penting dalam mengomunikasikan hasil analisis kami. Selain itu, komunikasi juga membantu untuk mendapatkan gambaran umum data selama proses analisis data, sehingga Anda dapat memutuskan metode analisis apa yang akan diterapkan pada data tersebut. Salah satu fungsi R untuk visualisasi data adalah fungsi boxplot().

Visualisasi data dengan fungsi boxplot(). Fungsi barplot() adalah fungsi umum untuk membuat plot kotak di R. Untuk pemahaman yang lebih baik, berikut adalah contoh plot kotak dengan variabel Sepal.Length di dataset Iris. Untuk menjalankan, jalankan sintaks berikut:

boxplot(iris$Sepal.Length)

barplot juga dapat membuat diagram kotak berdasarkan variabel faktor. Hal ini berguna untuk melihat perbedaan distribusi data antar kelompok. Untuk pemahaman yang lebih baik, berikut adalah contoh diagram kotak dibuat berdasarkan variabel Spesies.

boxplot(iris$Sepal.Length~iris$Species)

Selain itu kita juga dapat merubah warna bilah garis maupun bilah kotak pada boxplot. Dibawah ini merupakan sintaks untuk menjalankan perintah tersebut :

boxplot(iris$Sepal.Length~iris$Species,
        # ubah warna outline menjadi black
        
        border = "black",
        
        # ubah warna box berdasarkan grup
        
        col= c("mistyrose", "lightcyan", "lavender"))

Kemudian kita juga dapat membuat boxplot pada multiple group. Berikut adalah contoh boxplot dengan multiple group dibuat berdasarkan dataset ToothGrowth yang dapat dijalankan melalui sintaks berikut :

ubah variable dose menjadi factor

ToothGrowth$dose <- as.factor(ToothGrowth$dose)

print

head(ToothGrowth)
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5

Terapkan hasil output diatas kedalam boxplot multiple group melalui sintaks berikut :

boxplot(len ~ supp*dose, data = ToothGrowth,
        col = c("cornsilk", "lightblue"))