Histogram dan density plot merupakan cara Visualisasi data variabel numerik untuk melihat bentuk Distribusi datanya. Dengan menggunakan histogram atau density plot kita dapat melihat apakah Distribusi dari suatu data bersifat simetris atau tidak. Hal ini terkait dengan asumsi yang digunakan untuk analisa statistik yang akan digunakan pada data.
Fungsi hist() dapat digunakan untuk membuat histogram
pada R. Secara sederhana fungsi tersebut didefinisikan
sebagai berikut:
hist(2, breaks="Sturges")
Catatan:
x: vektor numerik
breaks: breakpoints antar sel histogram.
Pada dataset trees akan dibuat histogram variabel
Height. Untuk melakukannya jalankan sintaks berikut:
hist(trees$Height,
col = "green")
Density plot pada R dapat dibuat menggunakan fungsi
density(). Berbeda dengan fungsi hist(),
fungsi ini tidak langsung menghasilkan grafik densitas. Fungsi
density() hanya menghitung kernel densitas pada data.
Densitas yang telah dihitung selanjutnya diplotkan menggunakan fungsi
plot().
# menghitung kernel density
dens <- density(trees$Height)
# plot densitas dengan outline merah
plot(dens,col="blue")
Kita juga dapat menambahkan grafik densitas pada histogram sehingga
mempermudah pembacaan pada histogram. Untuk melakukannya kita perlu
mengubah kernel histigram dari frekuensi menjadi density dengan
menambahkan argumen freq=FALSE pada fungsi
hist(). Selanjutnya tambahkan fungsi polygon()
untuk memplotkan grafik densitas.
# menghitung kernel density
dens <- density(trees$Height)
# histogram
hist(trees$Height, freq=FALSE, col="cyan")
# tambahkan density plot
polygon(dens, border="red")