Dosen Pengempu : Prof. Dr. Suhartono, M.Kom

UIN Maulana Malik Ibrahim Malang - Teknik Informatika

Visualisasi Data Lainnya

Visualisasi dengan Bar Plot

Barplot pada R dapat dibuat menggunakan fungsi barplot(). Untuk lebih memahaminya berikut contoh barplot menggunakan data set VADeaths. Untuk memuatnya jalankan sintaks berikut :

Rural Male Rural Female Urban Male Urban Female

50-54 11.7 8.7 15.4 8.4

55-59 18.1 11.7 24.3 13.6

60-64 26.9 20.3 37.0 19.3

65-69 41.0 30.9 54.6 35.1

70-74 66.0 54.3 71.1 50.0

Contoh bar plot untuk variabel Rural Male disajikan pada Gambar dibawah :

par(mfrow=c(1,2))
barplot(VADeaths[, "Rural Male"], main="a")
barplot(VADeaths[, "Rural Male"], main="b", horiz=TRUE)

par(mfrow=c(1,1))

Kita dapat mengubah warna pada masing-masing bar, baik outline bar maupun box pada bar. Selain itu kita juga dapat mengubah nama grup yang telah dihasilkan sebelumnya. Berikut sintaks untuk melakukannya dan output yang dihasilkan ada pada Gambar dibawah ini :

barplot(VADeaths[, "Rural Male"],
        # ubah warna ouline menjadi steelblue
        border="steelblue",
        # ubah wana box
        col= c("grey", "yellow", "steelblue", "green", "orange"),
        # ubah nama grup dari A sampai E
        names.arg = LETTERS[1:5],
        # ubah orientasi menajadi horizontal
        horiz=TRUE)

Untuk bar plot dengan multiple group, tersedia dua pengaturan posisi yaitu stacked bar plot (menunjukkan proporsi penyusun pada masing-masing grup) dan grouped bar plot (melihat perbedaan individual pada masing-masing grup). Pada kedua gambar dibawah ini, disajikan kedua jenis bar plot tersebut.

# grouped
barplot(VADeaths,
         col = c("lightblue", "mistyrose", "lightcyan", 
                 "lavender", "cornsilk"),
        legend = rownames(VADeaths), beside = TRUE)

Visualisasi dengan Histogram dan Density Plot

Fungsi hist() dapat digunakan untuk membuat histogram pada R. Secara sederhana fungsi tersebut didefinisikan sebagai berikut :

hist(trees$Height)

Catatan:

  • x : vektor numerik

  • breaks : breakpoints antar sel histogram

Pada dataset trees akan dibuat histogram variabel Height. Untuk melakukannya jalankan sintaks berikut :

Density plot pada R dapat dibuat menggunakan fungsi density(). Berbeda dengan fungsi hist(), fungsi ini tidak langsung menghasilkan grafik densitas. Fungsi density() hanya menghitung kernel densitas pada data. Densitas yang telah dihitung selanjutnya diplotkan menggunakan fungsi plot(). Berikut adalah sintaks dan output yang dihasilkan ada pada Gambar dibawah :

# menghitung kernel density
dens <- density(trees$Height)
# plot densitas dengan outline merah
plot(dens,col="red")

Kita juga dapat menambahkan grafik densitas pada histogram sehingga mempermudah pembacaan pada histogram. Untuk melakukannya kita perlu mengubah kernel histogram dari frekuensi menjadi density dengan menambahkan argumen freq = FALSE pada fungsi hist(). Selanjutnya tambahkan fungsi polygon() untuk memplotkan grafik densitas. Berikut adalah sintak dan output yang dihasilkan ada pada Gambar dibawah :

# menghitung kernel density
dens <- density(trees$Height)
# histogram
hist(trees$Height, freq=FALSE, col="steelblue")
# tambahkan density plot
polygon(dens, border="red")

Visualisasi dengan Box Plot

Box plot pada R dapat dibuat menggunakan fungsi boxplot(). Berikut adalah sintaks untuk membuat boxplot variabel Sepal.Lenght pada dataset iris dan output yang dihasilkan ada pada Gambar dibawah ini :

boxplot(iris$Sepal.Length)

Boxplot juga dapat dibuat berdasarkan variabel factor. Hal ini berguna untuk melihat perbedaan ditribusi data pada masing-masing grup. Pada sintaks berikut dibuat boxplot berdasarkan variabel Species. Output yang dihasilkan ada pada Gambar dibawah :

boxplot(iris$Sepal.Length~iris$Species)

Kita juga dapat mengubah warna outline dan box pada boxplot. Berikut adalah contoh sintaks yang digunakan untuk melakukannya dan output yang dihasilkan ada pada Gambar dibawah :

boxplot(iris$Sepal.Length~iris$Species,
        # ubah warna outline menjadi steelblue
        border = "steelblue",
        # ubah warna box berdasarkan grup
        col= c("#999999", "#E69F00", "#56B4E9"))

Kita juga dapat membuat boxplot pada multiple group. Data yang digunakan untuk contoh tersebut adalah dataset ToothGrowth. Dibawah ini adalah sintaks untuk memuat dataset tersebut :

# ubah variable dose menjadi factor
ToothGrowth$dose <- as.factor(ToothGrowth$dose)

# print
head(ToothGrowth)
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5

Contoh sintaks dan output boxplot multiple group ada pada Gambar dibawah ini :

boxplot(len ~ supp*dose, data = ToothGrowth,
        col = c("white", "steelblue"))


Referensi