#Pendahuluan Visualisasi data merupakan bagian penting dalam proses analisis, terutama pada tahap eksplorasi awal. Melalui visualisasi, pola distribusi, perbandingan antar kategori, serta kecenderungan tertentu dalam data dapat dipahami secara lebih jelas dibandingkan hanya melihat angka dalam bentuk tabel. Grafik membantu menyederhanakan informasi sehingga lebih mudah diinterpretasikan, baik oleh pembaca teknis maupun non-teknis.
#Visualisasi 1 HISTOGRAM
ggplot(diamonds, aes(x = price)) +
geom_histogram(
binwidth = 2000,
fill = "pink",
color = "white"
) +
labs(
title = "Distribusi Harga Berlian",
x = "Harga (US Dollar)",
y = "Jumlah Berlian",
caption = "Sumber: Dataset diamonds"
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold")
)
Dari histogram terlihat bahwa sebagian besar berlian berada pada rentang
harga rendah hingga menengah. Semakin tinggi harga, jumlah berlian
semakin sedikit. Artinya, pasar lebih didominasi oleh berlian yang
relatif terjangkau. Pola ini menunjukkan distribusi yang miring ke
kanan, di mana hanya sebagian kecil berlian yang memiliki harga sangat
tinggi.
#Visualisasi 2 DENSITY PLOT
ggplot(diamonds, aes(x = carat)) +
geom_density(
fill = "cyan",
alpha = 0.6,
color = "blue",
linewidth = 1
) +
labs(
title = "Distribusi Berat Berlian (Carat)",
x = "Berat (Carat)",
y = "Kepadatan",
caption = "Sumber: Dataset diamonds"
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold")
)
Visualisasi data merupakan bagian penting dalam proses analisis, terutama pada tahap eksplorasi awal. Melalui visualisasi, pola distribusi, perbandingan antar kategori, serta kecenderungan tertentu dalam data dapat dipahami secara lebih jelas dibandingkan hanya melihat angka dalam bentuk tabel. Grafik membantu menyederhanakan informasi sehingga lebih mudah diinterpretasikan, baik oleh pembaca teknis maupun non-teknis.
#Visualisasi 3 BOXPLOT
ggplot(diamonds, aes(y = price)) +
geom_boxplot(fill = "brown") +
labs(
title = "Boxplot Harga Berlian",
y = "Harga (US Dollar)",
caption = "Sumber: Dataset diamonds"
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold")
)
Dari boxplot terlihat bahwa median harga berada pada kisaran harga menengah. Namun terdapat banyak titik pencilan (outlier) di bagian atas, yang menunjukkan adanya berlian dengan harga sangat tinggi dibandingkan mayoritas data. Sebaliknya, bagian bawah relatif lebih rapat. Ini memperkuat bahwa distribusi harga tidak simetris dan cenderung miring ke kanan.
#Kesimpulan Secara keseluruhan, dataset ini menunjukkan bahwa pasar berlian didominasi oleh produk dengan harga dan berat yang relatif rendah. Berlian dengan harga dan berat tinggi memang ada, tetapi jumlahnya jauh lebih sedikit. Pola distribusi yang miring ke kanan pada variabel harga dan carat menunjukkan bahwa segmen premium bersifat eksklusif dan tidak mendominasi pasar.