Fungsi hist()
dapat digunakan untuk membuat histogram pada R
. Secara sederhana fungsi tersebut didefinisikan sebagai berikut:
hist(x, breaks="Sturges")
Catatan:
x: vektor numerik
breaks: breakpoints antar sel histogram.
Pada dataset trees
akan dibuat histogram variabel Height
. Untuk melakukannya jalankan sintaks berikut:
hist(trees$Height)
Output yang dihasilkan disajikan pada Gambar 3.8:
Histogram
Gambar 3.8: Histogram
Density plot pada R
dapat dibuat menggunakan fungsi density()
. Berbeda dengan fungsi hist()
, fungsi ini tidak langsung menghasilkan grafik densitas. Fungsi density()
hanya menghitung kernel densitas pada data. Densitas yang telah dihitung selanjutnya diplotkan menggunakan fungsi plot()
. Berikut adalah sintaks dan output yang dihasilkan pada Gambar 3.9:
# menghitung kernel density
dens <- density(trees$Height)
# plot densitas dengan outline merah
plot(dens,col="red")
Density plot
Gambar 3.9: Density plot
Kita juga dapat menambahkan grafik densitas pada histogram sehingga mempermudah pembacaan pada histogram. Untuk melakukannya kita perlu mengubah kernel histigram dari frekuensi menjadi density dengan menambahkan argumen freq=FALSE
pada fungsi hist()
. Selanjutnya tambahkan fungsi polygon()
untuk memplotkan grafik densitas. Berikut adalah sintak dan output yang dihasilkan pada Gambar 3.10:
# menghitung kernel density
dens <- density(trees$Height)
# histogram
hist(trees$Height, freq=FALSE, col="steelblue")
# tambahkan density plot
polygon(dens, border="red")
Density plot dan histogram
Gambar 3.10: Density plot dan histogram
Box plot pada R
dapat dibuat menggunakan fungsi boxplot()
. Berikut adalah sintaks untuk membuat boxplot variabel Sepal.Lenght
pada dataset iris
dan output yang dihasilkan pada Gambar 3.11:
boxplot(iris$Sepal.Length)
Boxplot variabel Sepal.Length
Gambar 3.11: Boxplot variabel Sepal.Length
Boxplot juga dapat dibuat berdasarkan variabel factor. Hal ini berguna untuk melihat perbedaan ditribusi data pada masing-masing grup. Pada sintaks berikut dibuat boxplot berdasarkan variabel Species
. Output yang dihasilkan disajikan pada Gambar 3.12:
boxplot(iris$Sepal.Length~iris$Species)
Boxplot berdasarkan variabel species
Gambar 3.12: Boxplot berdasarkan variabel species
Kita juga dapat mengubah warna outline dan box pada boxplot. Berikut adalah contoh sintaks yang digunakan untuk melakukannya dan output yang dihasilkan disajikan pada Gambar 3.13:
boxplot(iris$Sepal.Length~iris$Species,
# ubah warna outline menjadi steelblue
border = "steelblue",
# ubah warna box berdasarkan grup
col= c("#999999", "#E69F00", "#56B4E9"))
Boxplot dengan warna berdasarkan spesies
Gambar 3.13: Boxplot dengan warna berdasarkan spesies
Kita juga dapat membuat boxplot pada multiple group. Data yang digunakan untuk contoh tersebut adalah dataset ToothGrowth
. Berikut adalah sintaks untuk memuat dataset tersebut:
# ubah variable dose menjadi factor
ToothGrowth$dose <- as.factor(ToothGrowth$dose)
# print
head(ToothGrowth)
## len supp dose
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5
Contoh sintaks dan output boxplot multiple group disajikan pada Gambar 3.14:
boxplot(len ~ supp*dose, data = ToothGrowth,
col = c("white", "steelblue"))
Boxplot multiple group
Gambar 3.14: Boxplot multiple group
REFERENSI
https://bookdown.org/moh_rosidi2610/Metode_Numerik/dataviz.html
_________________________________________________________________________________________________________
Kunjungi Rpubs saya untuk melihat penjelasan yang lain https://rpubs.com/henyrimadana
_________________________________________________________________________________________________________