Lembaga :Universitas Islam Negeri Maulana Malik Ibrahim Malang

Prodi :Teknik Informatika

Histogram dan Density Plot

Fungsi hist() dapat digunakan untuk membuat histogram pada R. Secara sederhana fungsi tersebut didefinisikan sebagai berikut:

hisy(x, breaks="Sturges")

Catatan:

● x: vektor numerik

● breaks: breakpoints antar sel histogram.

Pada dataset trees akan dibuat histogram variabel Height. Untuk melakukannya jalankan sintaks berikut:

Output yang dihasilkan disajikan pada gambar 3.8

hist(trees$Height)

              Gambar 3.8: Histogram

Density plot pada R dapat dibuat menggunakan fungsi density(). Berbeda dengan fungsi hist(), fungsi ini tidak langsung menghasilkan grafik densitas. Fungsi density() hanya menghitung kernel densitas pada data. Densitas yang telah dihitung selanjutnya diplotkan menggunakan fungsi plot(). Berikut adalah sintaks dan output yang dihasilkan pada Gambar 3.9:

# menghitung kernel density 
dens <- density(trees$Height)

# plot densitas dengan outline merah 
plot(dens,col="red")

           Gambar 3.9: Density Plot

Kita juga dapat menambahkan grafik densitas pada histogram sehingga mempermudah pembacaan pada histogram. Untuk melakukannya kita perlu mengubah kernel histigram dari frekuensi menjadi density dengan menambahkan argumen freq=FALSE pada fungsi hist(). Selanjutnya tambahkan fungsi polygon() untuk memplotkan grafik densitas. Berikut adalah sintak dan output yang dihasilkan pada Gambar 3.10:

# menghitung kernel density
dens <- density(trees$Height)

# histogram 
hist(trees$Height, freq=FALSE, col="steelblue")

# tambahkan density plot 
polygon(dens, border="red")

Gambar 3.10: Density Plot Dan Histogram

Box plot

Box plot pada R dapat dibuat menggunakan fungsi boxplot().

Berikut adalah sintaks untuk membuat boxplot variabel

Sepal.Lenght pada dataset iris dan output yang dihasilkan pada

Gambar 3.11:

boxplot(iris$Sepal.Length)           

        Gambar 3.11: Boxplot Variabel Sepal.Length
        
        

Boxplot juga dapat dibuat berdasarkan variabel factor. Hal ini berguna untuk melihat perbedaan ditribusi data pada masing-masing grup. Pada sintaks berikut dibuat boxplot berdasarkan variabel Species. Output yang dihasilkan disajikan pada Gambar 3.12:

boxplot(iris$Sepal.Length~iris$Species)

   Gambar 3.12: Boxplot Berdasarkan Variabel Species
   

Kita juga dapat mengubah warna outline dan box pada boxplot. Berikut adalah contoh sintaks yang digunakan untuk melakukannya dan output yang dihasilkan disajikan pada gambar 3.13:

boxplot(iris$Sepal.Length~iris$Species, 
        # ubah warna outline menjadi steelblue 
        border = "steelblue", 
        # ubah warna box berdasarkan grup 
        col= c("#999999", "#E69F00", "#56B4E9"))

Gambar 3.13: Boxplot dengan Warna Berdasarkan Species

Kita juga dapat membuat boxplot pada multiple group. Data yang digunakan untuk contoh tersebut adalah dataset ToothGrowth. Berikut adalah sintaks untuk memuat dataset tersebut:

# ubah variable dose menjadi factor 
ToothGrowth$dose <- as.factor(ToothGrowth$dose)

# print 
head(ToothGrowth)
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5
## len supp dose 
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5 
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5

Contoh sintaks dan output boxplot multiple group disajikan pada Gambar 3.14:

boxplot(len ~ supp*dose, data = ToothGrowth,
        col = c("white", "steelblue"))

        Gambar 3.14: Boxplot multiple group

REFERENSI

http://bookdown.org/moh_rosidi2610/Metode_Numerik/dataviz.html