#Pendahuluan
Visualisasi data merupakan metode paling pentng dalam statistika untuk menyajikan informasi secara singkat dan mudah dipahami. Pada tugas ini digunakan dataset diamonds yang tersedia dalam package ggplot2. Visualisasi bertujuan untuk menggambarkan distribusi serta hubungan antar variabel kategorik sehingga pola dalam data dapat dianalis secara visual
#Deskripsi Dataset
Dataset diamons berisi data karakteristik berlian yang mencakup variabel numerik dan kategorik. Fokus analisis diberikan pada variabel kategorik, yaitu :
-cut : kualitas potongan berlian
-color : Tingkat warna berlian (D - J)
#Persiapan Data
library(ggplot2)
library(dplyr)
head(diamonds)
#Bar Chart Frekuensi
ggplot(diamonds, aes(x=color))+
geom_bar(fill = "steelblue")+
labs(
title="Jumlah Carat Berdasarkan Color",
x = "Color Diamond",
y = "Jumlah Carat",
)+
theme_minimal()
#Interpretasi
Grafik menunjukkan bahwa total carat paling besar terdapat pada color G, diikuti oleh color E dan F. Setelah color G, jumlah carat cenderung menurun seiring dengan menurunnya kualitas color, terutama pada color H, I, dan J. Warna J memiliki jumlah carat paling sedikit, sedangkan warna D juga relatif lebih rendah dibanding warna menengah.
#Grouped Bar Chart Berdasarkan Color
ggplot(diamonds, aes(x=color, fill=cut))+
geom_bar(position = "dodge")+
labs(
title = "Distribusi Cut pada Setiap Color",
x = "Color Diamond",
y = "Jumlah Carat"
)+
theme_minimal()
#Interpretasi
Grafik menunjukkan bahwa pada semua Color Diamond (D–J), Cut Ideal selalu memiliki jumlah terbanyak, diikuti oleh Premium dan Very Good. Color G dan E tampak paling tinggi jumlahnya dibanding Color lain, sedangkan Color J memiliki jumlah paling sedikit untuk semua kategori cut.
#Proportion Bar Chart Cut Terhadap Color
ggplot(diamonds, aes(x = color, fill = cut))+
geom_bar(position = "fill")+
scale_y_continuous(labels = scales::percent)+
labs(
title = "Distribusi Cut Pada Setiap Color",
x = "Color Diamon",
y = "Jumlah Carat",
fill = "Cut"
)+
theme_minimal()
#Interpretasi
Grafik ini menunjukkan perbandingan proporsi jenis cut berlian pada setiap color (D–J). Pada semua color, cut Ideal merupakan yang paling banyak.Meskipun ada beberapa yang turun.Sementara itu, cut Premium dan Very Good memiliki proporsi yang relatif stabil di hampir semua color, dan pada color J terlihat sedikit lebih besar dibanding warna lainnya. Cut Good dan Fair selalu menjadi yang paling sedikit pada setiap warna berlian.