Visualisasi dengan boxplot
Pengertian Boxplot Boxplot merupakan ringkasan distribusi sampel yang disajikan secara grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan. Terdapat 5 ukuran statistik yang bisa kita baca dari boxplot, yaitu: Nilai minimum: nilai observasi terkecil.
Implementasi Boxplot Box plot pada R dapat dibuat menggunakan fungsi boxplot(). Berikut adalah sintaks untuk membuat boxplot variabel Sepal.Lenght pada dataset iris
boxplot(iris$Sepal.Length)
Boxplot juga dapat dibuat berdasarkan variabel factor. Hal ini berguna untuk melihat perbedaan ditribusi data pada masing-masing grup. Pada sintaks berikut dibuat boxplot berdasarkan variabel Species.
boxplot(iris$Sepal.Length~iris$Species)
Kita juga dapat mengubah warna outline dan box pada boxplot,dengan menggunakan col
boxplot(iris$Sepal.Length~iris$Species,
# ubah warna outline menjadi steelblue
border = "black",
# ubah warna box berdasarkan grup
col= c("red", "green", "#56B4E9"))
Kita juga dapat membuat boxplot pada multiple group. Data yang digunakan untuk contoh tersebut adalah dataset ToothGrowth. Berikut adalah sintaks untuk memuat dataset tersebut:
# ubah variable dose menjadi factor
ToothGrowth$dose <- as.factor(ToothGrowth$dose)
# print
head(ToothGrowth)
## len supp dose
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5
Contoh sintaks dan output boxplot multiple group
boxplot(len ~ supp*dose, data = ToothGrowth,
col = c("white", "steelblue"))