Visualisasi Data adalah komunikasi visual data atau konversi data mentah menjadi wawasan yang dapat dengan mudah ditafsirkan oleh pembaca Anda. Visualisasi data merupakan bagian yang sangat penting untuk mengkomunikasikan hasil analisis yang kita lakukan. Selain itu, komunikasi juga membantu untuk mendapatkan gambaran umum tentang data selama proses analisis data sehingga dapat memutuskan metode analisis mana yang akan diterapkan pada data tersebut. Salah satu fungsi yang dimiliki R untuk visualisasi data adalah fungsi Hist() dan density().
Untuk menerapkan visualisasi data pada hsitogram, kita dapat menggunakan fungsi Hist() pada RStudio dimana bentuk sintaks dari fungsi ini adalah :
hist(x, breaks="Sturges")
Notes :
x : vektor numerik
breaks : breakpoints antar sel histogram.
Dibawah ini contoh membuat histogram dengan variabel heigth pada dataset trees.
hist(trees$Height)
Density plot dalam bahasa pemrogramab R dapat dibuat menggunakan fungsi density(). Berbeda dengan fungsi hist() , fungsi ini tidak menghasilkan grafik kepadatan secara langsung. Fungsi density() hanya menghitung kernel densitas data. Kemudian kepadatan yang dihitung diplot menggunakan fungsi plot(). Di bawah ini merupakan penerapan fungsi density :
# menghitung kernel density
dens <- density(trees$Height)
# plot densitas dengan outline hiajau
plot(dens,col="green")
Kita juga dapat menambahkan grafik kepadatan ke histogram agar lebih mudah dibaca. Untuk melakukan ini, kita perlu mengubah histogram kernel dari frekuensi ke kepadatan dengan menambahkan argumen req=FALSE pada fungsi hist(). Selanjutnya, tambahkan fungsi polygon() untuk menggambar grafik densitas.Dibawah ini contoh penerapan :
# menghitung kernel density
dens <- density(trees$Height)
# histogram
hist(trees$Height, freq=FALSE, col="lavender")
# tambahkan density plot
polygon(dens, border="orange")