Dataset diamonds dari paket ggplot2 berisi 53.940 data berlian dengan berbagai karakteristik numerik seperti harga (price) dan berat dalam carat (carat). Analisis ini bertujuan untuk memahami pola distribusi dua variabel kontinu tersebut melalui pendekatan visualisasi statistik. Dengan menggunakan histogram, density plot, dan boxplot, kita dapat melihat bentuk distribusi, tingkat penyebaran data, serta keberadaan nilai ekstrem.
Interpretasi: Secara umum, grafik tersebut menunjukkan bahwa kebanyakan berlian memiliki harga yang relatif rendah hingga menengah, terutama di kisaran sekitar 500 sampai 2.000 Dollar AS. Pada rentang harga ini jumlah berliannya paling banyak dibandingkan rentang harga lain, sehingga dapat dikatakan bahwa berlian dengan harga yang lebih terjangkau lebih sering ditemukan. Ketika harga berlian mulai meningkat, jumlahnya semakin berkurang. Berlian dengan harga di atas 5.000 Dollar AS terlihat jauh lebih sedikit, dan yang harganya sangat mahal, seperti di atas 10.000 hingga mendekati 20.000 Dollar AS, hanya muncul dalam jumlah yang sangat kecil. Hal ini menunjukkan bahwa berlian mahal cenderung lebih langka. Selain itu, bentuk grafik yang memanjang ke sisi kanan menandakan bahwa sebagian besar berlian memang berada pada harga rendah, tetapi ada sedikit berlian dengan harga sangat tinggi. Kehadiran beberapa harga yang sangat tinggi ini membuat rata-rata harga menjadi lebih besar dibandingkan nilai tengahnya. Secara sederhana, dapat dipahami bahwa pasar berlian didominasi oleh berlian dengan harga terjangkau, sedangkan berlian yang sangat mahal hanya sebagian kecil saja.
Interpretasi: Grafik density tersebut memperlihatkan bagaimana berat berlian tersebar dalam data. Sumbu mendatar menunjukkan berat berlian dalam satuan carat, sedangkan sumbu tegak menunjukkan seberapa banyak berlian yang berada pada rentang berat tertentu. Dari bentuk kurvanya terlihat bahwa bagian paling tinggi berada pada berat yang kecil, terutama di bawah sekitar 1 carat. Ini berarti sebagian besar berlian yang ada berukuran kecil. Setelah melewati 1 carat, jumlah berlian perlahan semakin berkurang, sehingga berlian yang lebih besar jumlahnya tidak sebanyak berlian kecil. Di beberapa bagian tampak tonjolan kecil pada kurva, yang menandakan ada ukuran tertentu—misalnya sekitar 1 sampai mendekati 2 carat yang cukup sering muncul. Namun secara keseluruhan, berlian dengan berat di atas 2 carat sangat jarang ditemukan, terlihat dari kurva yang semakin menurun hingga hampir mendatar. Bentuk kurva yang memanjang ke kanan menunjukkan bahwa kebanyakan berlian berukuran kecil, sementara berlian berukuran besar hanya sedikit. Dengan kata lain, pasar berlian lebih didominasi oleh berlian kecil hingga sedang, sedangkan berlian besar merupakan bagian yang jauh lebih sedikit.
Interpretasi: Boxplot tersebut menunjukkan ringkasan statistik dari harga berlian dalam satu tampilan sederhana. Garis tebal di dalam kotak menunjukkan median (nilai tengah) harga berlian, yang berada di kisaran sekitar 2.000–3.000 Dollar AS. Artinya, setengah dari berlian memiliki harga di bawah nilai tersebut dan setengahnya lagi di atasnya. Bagian kotak (box) menunjukkan rentang kuartil bawah (Q1) hingga kuartil atas (Q3), yaitu 50% data berada di dalam kotak tersebut. Dari grafik terlihat bahwa sebagian besar harga berlian terkonsentrasi pada kisaran harga rendah hingga menengah. Ini menunjukkan bahwa mayoritas berlian tidak berada pada harga yang sangat tinggi. Garis yang memanjang ke atas (whisker) serta banyaknya titik di bagian atas menunjukkan adanya outlier, yaitu berlian dengan harga yang jauh lebih tinggi dibandingkan kebanyakan data. Titik-titik ini berada hingga mendekati 20.000 Dollar AS. Sementara itu, bagian bawah tidak menunjukkan banyak outlier ekstrem. Secara keseluruhan, boxplot ini memperlihatkan bahwa distribusi harga berlian miring ke kanan (positively skewed). Mayoritas berlian memiliki harga relatif rendah hingga menengah, tetapi terdapat sejumlah kecil berlian dengan harga sangat tinggi yang menyebabkan penyebaran data lebih panjang di bagian atas.
Sebagian besar berlian yang tersedia di pasar memiliki harga relatif rendah hingga menengah, sehingga jenis berlian ini merupakan yang paling umum ditemukan dan kemungkinan paling banyak dibeli. Sementara itu, berlian dengan harga sangat tinggi jumlahnya jauh lebih sedikit, menandakan bahwa berlian mahal bersifat lebih langka dan biasanya memiliki kualitas, ukuran, atau karakteristik khusus yang meningkatkan nilainya. Secara umum, struktur harga ini mencerminkan bahwa pasar berlian didominasi oleh produk yang lebih terjangkau, sedangkan berlian bernilai tinggi hanya menempati porsi kecil dari keseluruhan.