Berlian sering kali dipandang sebagai simbol kemewahan dan sesuatu yang memiliki nilai tinggi. Namun jika kita melihat lebih dalam, kualitas berlian tidak hanya ditentukan oleh mahal atau tidaknya harga, tetapi juga oleh beberapa faktor penting seperti warna dan kualitas potongan. Warna memengaruhi seberapa jernih dan bersih tampilan berlian ketika dilihat, sedangkan kualitas potongan sangat menentukan bagaimana cahaya masuk dan dipantulkan sehingga berlian terlihat berkilau. Dengan menggunakan visualisasi data, kita dapat memahami kondisi ini dengan lebih mudah dibandingkan hanya membaca angka-angka dalam tabel. Grafik membantu kita melihat pola secara perlahan, sehingga orang yang tidak memiliki latar belakang teknis pun tetap bisa memahami gambaran umumnya.
cut_count <- diamonds %>%
count(cut)
ggplot(cut_count, aes(x = cut, y = n)) +
geom_bar(stat = "identity", fill = "#f3dcd4", color = "#b08968", width = 0.7) +
geom_text(aes(label = n), vjust = -0.5, size = 5) +
labs(
title = "Jumlah Berlian Berdasarkan Kualitas Potongan",
x = "Kualitas Potongan",
y = "Jumlah Berlian"
) +
theme_minimal(base_size = 15)Grafik ini menunjukkan jumlah berlian berdasarkan kualitas potongannya, lengkap dengan angka di atas setiap batang agar lebih mudah dibaca. Terlihat dengan jelas bahwa kategori Ideal memiliki jumlah paling banyak dibandingkan kategori lainnya. Hal ini menunjukkan bahwa sebagian besar berlian dalam dataset ini sudah memiliki kualitas potongan yang sangat baik. Potongan yang baik membuat cahaya dapat dipantulkan dengan maksimal sehingga berlian terlihat lebih hidup dan berkilau. Kategori Premium dan Very Good juga memiliki jumlah yang cukup besar, yang berarti kualitas yang baik memang mendominasi data ini. Sementara itu, kategori Fair memiliki jumlah paling sedikit, sehingga dapat dikatakan bahwa berlian dengan kualitas potongan rendah relatif jarang ditemukan dalam kumpulan data ini.
ggplot(diamonds, aes(x = cut, fill = color)) +
geom_bar(position = "dodge", color = "#a1887f") +
labs(
title = "Kualitas Potongan Jika Dilihat Dari Warna",
x = "Kualitas Potongan",
y = "Jumlah Berlian",
fill = "Warna"
) +
scale_fill_brewer(palette = "Pastel1") +
theme_minimal(base_size = 15)Pada grafik ini kita dapat melihat bagaimana kualitas potongan tersebar pada setiap warna berlian. Warna pada grafik dibuat lebih lembut agar nyaman dilihat, namun tetap dapat dibedakan dengan jelas. Terlihat bahwa kategori Ideal tetap mendominasi hampir di semua warna berlian. Artinya, kualitas potongan yang baik tidak hanya terdapat pada satu warna tertentu saja. Dengan kata lain, seseorang tetap dapat memilih warna sesuai dengan selera pribadi tanpa harus terlalu khawatir mengenai kualitas potongannya. Data ini menunjukkan bahwa secara umum standar kualitas potongan dalam dataset ini tergolong tinggi dan cukup merata pada berbagai variasi warna.
ggplot(diamonds, aes(x = color, fill = cut)) +
geom_bar(position = "fill", color = "#bcaaa4") +
labs(
title = "Perbandingan Persentase Potongan di Setiap Warna",
x = "Warna Berlian",
y = "Persentase",
fill = "Kualitas Potongan"
) +
scale_fill_brewer(palette = "Pastel2") +
theme_minimal(base_size = 15)Grafik ini menampilkan perbandingan dalam bentuk persentase sehingga kita dapat melihat proporsi masing-masing kategori potongan pada setiap warna. Terlihat bahwa kategori Ideal tetap memiliki bagian terbesar hampir di seluruh warna. Hal ini memperkuat temuan sebelumnya bahwa kualitas potongan yang baik memang mendominasi data ini. Dengan melihat grafik ini, kita dapat memahami bahwa secara keseluruhan kualitas potongan berlian dalam dataset ini cukup konsisten dan berada pada tingkat yang baik hingga sangat baik.
ggplot(diamonds, aes(x = price)) +
geom_histogram(fill = "#d7b899", color = "black", bins = 40) +
labs(
title = "Sebaran Harga Berlian",
x = "Harga",
y = "Jumlah"
) +
theme_minimal(base_size = 15)Histogram ini menunjukkan bagaimana harga berlian tersebar dalam dataset. Terlihat bahwa sebagian besar berlian berada pada kisaran harga yang lebih rendah hingga menengah, sementara berlian dengan harga sangat tinggi jumlahnya relatif lebih sedikit. Hal ini menunjukkan bahwa meskipun berlian sering dianggap sangat mahal, kenyataannya tidak semua berlian berada pada kategori harga ekstrem. Mayoritas berlian dalam dataset ini masih berada pada rentang harga yang lebih umum dan lebih sering ditemukan di pasaran.
ggplot(diamonds, aes(x = price)) +
geom_density(fill = "#c9a27e", alpha = 0.85) +
labs(
title = "Pola Kepadatan Harga Berlian",
x = "Harga",
y = "Kepadatan"
) +
theme_minimal(base_size = 15)Density plot membantu kita melihat dengan lebih halus di kisaran harga mana berlian paling banyak terkumpul. Bagian kurva yang paling tinggi menunjukkan harga yang paling sering muncul dalam dataset. Semakin bergerak ke arah harga yang sangat tinggi, kurva semakin menurun, yang berarti jumlahnya semakin sedikit. Grafik ini memperjelas bahwa berlian dengan harga sangat mahal memang ada, tetapi jumlahnya tidak sebanyak berlian dengan harga menengah.
ggplot(diamonds, aes(y = price)) +
geom_boxplot(fill = "#b08968", color = "black") +
labs(
title = "Ringkasan Umum Harga Berlian",
y = "Harga"
) +
theme_minimal(base_size = 15)Boxplot ini memberikan gambaran ringkas mengenai distribusi harga berlian. Garis di tengah kotak menunjukkan harga tengah atau median. Terlihat pula adanya beberapa titik di bagian atas yang menunjukkan berlian dengan harga sangat tinggi dibandingkan yang lain. Namun secara keseluruhan, sebagian besar harga masih berada dalam kisaran yang lebih moderat. Grafik ini membantu kita memahami bahwa walaupun ada harga yang sangat tinggi, mayoritas berlian tetap berada pada rentang harga yang lebih umum.
Berdasarkan seluruh visualisasi yang telah ditampilkan, dapat disimpulkan bahwa kualitas potongan berlian dalam dataset ini didominasi oleh kategori Ideal, Premium, dan Very Good, yang berarti sebagian besar berlian memiliki standar kualitas yang baik hingga sangat baik. Dari sisi warna, kualitas potongan yang baik tersebar cukup merata sehingga tidak terbatas pada warna tertentu saja. Sementara itu, dari sisi harga, mayoritas berlian berada pada kisaran harga menengah, meskipun terdapat beberapa berlian dengan harga yang sangat tinggi. Secara keseluruhan, data ini menunjukkan bahwa berlian dalam dataset ini umumnya memiliki kualitas yang baik dengan variasi harga yang cukup luas, namun tetap didominasi oleh rentang harga yang lebih umum dan lebih sering dijumpai di pasaran.