NIM : 210605110007
Lembaga: “Universitas Islam Negeri Maulana Malik Ibrahim Malang”
Fakultas: “Sains dan Teknologi”
Jurusan: “Teknik Informatika”
Visualisasi lainnya yang sering digunakan antara lain: histogram, density plot, bar plot, dan box plot.
Sebuah bar chart atau grafik batang adalah bagan atau grafik yang menyajikan data kategorikal dengan persegi panjang bar dengan ketinggian atau panjang sebanding dengan nilai-nilai yang mereka wakili. Batang dapat diplot secara vertikal atau horizontal. Bagan batang vertikal kadang-kadang disebut bagan kolom .
Grafik batang menunjukkan perbandingan di antara kategori diskrit . Satu sumbu bagan menunjukkan kategori tertentu yang dibandingkan, dan sumbu lainnya mewakili nilai yang diukur. Beberapa grafik batang menampilkan batang yang dikelompokkan dalam kelompok lebih dari satu, menunjukkan nilai lebih dari satu variabel terukur.
Barplot pada R dapat dibuat menggunakan fungsi barplot(). Untuk lebih memahaminya berikut disajikan contoh barplot menggunakan dataset VADeaths. Untuk memuatnya jalankan sintaks berikut:
VADeaths
## Rural Male Rural Female Urban Male Urban Female
## 50-54 11.7 8.7 15.4 8.4
## 55-59 18.1 11.7 24.3 13.6
## 60-64 26.9 20.3 37.0 19.3
## 65-69 41.0 30.9 54.6 35.1
## 70-74 66.0 54.3 71.1 50.0
Contoh bar plot untuk variabel Rural Male disajikan pada Gambar
par(mfrow=c(1,2))
barplot(VADeaths[, "Rural Male"], main="a")
barplot(VADeaths[, "Rural Male"], main="b", horiz=TRUE)
par(mfrow=c(1,1))
Kita dapat mengubah warna pada masing-masing bar, baik outline bar maupun box pada bar. Selain itu kita juga dapat mengubah nama grup yang telah dihasilkan sebelumnya. Berikut sintaks untuk melakukannya dan output yang dihasilkan pada Gambar
barplot(VADeaths[, "Rural Male"],
# ubah warna ouline menjadi steelblue
border="steelblue",
# ubah wana box
col= c("grey", "yellow", "steelblue", "green", "orange"),
# ubah nama grup dari A sampai E
names.arg = LETTERS[1:5],
# ubah orientasi menajadi horizontal
horiz=TRUE)
Untuk bar plot dengan multiple group, tersedia dua pengaturan posisi yaitu stacked bar plot(menunjukkan proporsi penyusun pada masing-masing grup) dan grouped bar plot(melihat perbedaan individual pada masing-masing grup).
# staked
barplot(VADeaths,
col = c("lightblue", "mistyrose", "lightcyan",
"lavender", "cornsilk"),
legend = rownames(VADeaths))
# grouped
barplot(VADeaths,
col = c("lightblue", "mistyrose", "lightcyan",
"lavender", "cornsilk"),
legend = rownames(VADeaths), beside = TRUE)
Dalam probabilitas dan statistik , estimasi densitas adalah konstruksi perkiraan , berdasarkan data yang diamati , dari fungsi densitas probabilitas yang mendasari yang tidak dapat diamati . Fungsi kepadatan yang tidak dapat diamati dianggap sebagai kepadatan yang dengannya populasi besar didistribusikan; data biasanya dianggap sebagai sampel acak dari populasi itu.
Berbagai pendekatan untuk estimasi kepadatan digunakan, termasuk jendela Parzen dan berbagai teknik pengelompokan data , termasuk kuantisasi vektor . Bentuk paling dasar dari estimasi densitas adalah histogram yang diskalakan ulang .
Fungsi hist() dapat digunakan untuk membuat histogram pada R. Secara sederhana fungsi tersebut didefinisikan sebagai berikut:
hist(x, breaks="Sturges")
Catatan:
x: vektor numerik breaks: breakpoints antar sel histogram.
Pada dataset trees akan dibuat histogram variabel Height. Untuk melakukannya jalankan sintaks berikut:
hist(trees$Height)
Density plot pada R dapat dibuat menggunakan fungsi density(). Berbeda dengan fungsi hist(), fungsi ini tidak langsung menghasilkan grafik densitas. Fungsi density() hanya menghitung kernel densitas pada data. Densitas yang telah dihitung selanjutnya diplotkan menggunakan fungsi plot().
# menghitung kernel density
dens <- density(trees$Height)
# plot densitas dengan outline merah
plot(dens,col="red")
Kita juga dapat menambahkan grafik densitas pada histogram sehingga mempermudah pembacaan pada histogram. Untuk melakukannya kita perlu mengubah kernel histigram dari frekuensi menjadi density dengan menambahkan argumen freq=FALSE pada fungsi hist(). Selanjutnya tambahkan fungsi polygon() untuk memplotkan grafik densitas.
# menghitung kernel density
dens <- density(trees$Height)
# histogram
hist(trees$Height, freq=FALSE, col="steelblue")
# tambahkan density plot
polygon(dens, border="red")
Dalam statistika deskriptif, diagram kotak garis atau boxplot adalah metode grafis untuk menggambarkan kumpulan data numerik berdasarkan nilai kuartilnya.[1] Diagram kotak garis bersifat nonparametrik, artinya diagram ini menampilkan variasi sampel populasi statistik tanpa membuat asumsi apa pun tentang distribusi statistik yang mendasarinya. Jarak antara bagian-bagian kotak yang berbeda menunjukkan derajat dispersi (sebaran), kemiringan, dan pencilan dari data tersebut. Diagram kotak garis dapat digambarkan secara horizontal maupun vertikal.
Box plot pada R dapat dibuat menggunakan fungsi boxplot(). Berikut adalah sintaks untuk membuat boxplot variabel Sepal.Lenght pada dataset iris
boxplot(iris$Sepal.Length)
Boxplot juga dapat dibuat berdasarkan variabel factor. Hal ini berguna untuk melihat perbedaan ditribusi data pada masing-masing grup. Pada sintaks berikut dibuat boxplot berdasarkan variabel Species.
``{r} boxplot(iris\(Sepal.Length~iris\)Species)
Kita juga dapat mengubah warna outline dan box pada boxplot
```r
boxplot(iris$Sepal.Length~iris$Species,
# ubah warna outline menjadi steelblue
border = "steelblue",
# ubah warna box berdasarkan grup
col= c("#999999", "#E69F00", "#56B4E9"))
Kita juga dapat membuat boxplot pada multiple group. Data yang digunakan untuk contoh tersebut adalah dataset ToothGrowth
# ubah variable dose menjadi factor
ToothGrowth$dose <- as.factor(ToothGrowth$dose)
# print
head(ToothGrowth)
## len supp dose
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5
Berikut contoh sintaks dan output boxplot multiple group
boxplot(len ~ supp*dose, data = ToothGrowth,
col = c("white", "steelblue"))