Pada halaman ini, saya menyajikan hasil visualisasi data menggunakan dataset diamonds di R, dengan fokus pada dua variabel numerik utama, yaitu price (harga) dan carat (berat berlian).

Kedua variabel ini dipilih karena memiliki peran penting dalam menentukan nilai sebuah berlian. Dengan memahami pola sebaran harga dan berat, analisis ini diharapkan dapat memberikan gambaran umum mengenai karakteristik pasar berlian berdasarkan data.

✨ Tujuan Visualisasi

Visualisasi ini dibuat untuk membantu memahami bagaimana sebaran harga (price) dan berat berlian (carat) dalam dataset diamonds. Melalui grafik histogram, density, dan boxplot, kita bisa melihat pola umum data, seperti kisaran harga dan berat yang paling sering muncul, apakah sebagian besar berlian berada di kategori rendah, sedang, atau tinggi, serta apakah terdapat nilai yang sangat jauh berbeda dari data lainnya. Dengan menampilkan data dalam bentuk visual, informasi menjadi lebih mudah dipahami, sehingga dapat menangkap gambaran kondisi pasar berlian secara cepat tanpa harus membaca banyak angka.

✨ Distribusi Harga Berlian (Price)

Visualisasi terhadap variabel price dilakukan menggunakan histogram, density plot, dan boxplot. Ketiga grafik ini digunakan untuk saling melengkapi dalam menggambarkan sebaran data harga.

1. Histogram Price

Grafik histogram menunjukkan bahwa sebagian besar berlian dalam dataset memiliki harga pada rentang rendah hingga menengah. Hal ini terlihat dari batang yang paling tinggi di bagian kiri grafik. Jumlah berlian dengan harga murah jauh lebih banyak dibandingkan berlian dengan harga mahal. Semakin ke arah kanan, jumlah data semakin berkurang, yang berarti berlian dengan harga tinggi relatif jarang. Visualisasi ini memberi gambaran awal bahwa dataset diamonds didominasi oleh berlian dengan harga yang lebih terjangkau.

2. Density Plot Price

Hasil dari histogram kemudian diperkuat oleh grafik density. Pada grafik ini terlihat bahwa kepadatan tertinggi berada pada harga rendah hingga menengah, yang ditandai dengan puncak grafik di bagian kiri. Seiring meningkatnya harga, kepadatan grafik menurun secara bertahap dan membentuk ekor panjang di sebelah kanan. Hal ini menunjukkan bahwa hanya sedikit berlian yang memiliki harga sangat tinggi. Dengan demikian, grafik density menegaskan bahwa mayoritas berlian berada pada kelompok harga rendah, sementara berlian mahal jumlahnya terbatas.

3. Boxplot Price

Pada boxplot harga berlian, terlihat bahwa sebagian besar data berada pada bagian bawah rentang harga. Median harga juga cenderung berada di bawah, yang menunjukkan bahwa harga “rata-rata tengah” masih termasuk kategori menengah ke bawah. Selain itu, terdapat banyak titik pencilan (outlier) di bagian atas boxplot. Titik-titik ini menunjukkan adanya beberapa berlian dengan harga sangat mahal dibandingkan mayoritas data lainnya. Hal ini sesuai dengan hasil histogram dan density sebelumnya, yaitu bahwa berlian mahal memang ada, tetapi jumlahnya sedikit.

✨Distribusi Berat Berlian (Carat)

Selanjutnya, visualisasi dilakukan pada variabel carat untuk melihat sebaran ukuran berlian.

1. Histogram Carat

Histogram carat menunjukkan bahwa sebagian besar berlian memiliki berat kecil hingga sedang. Batang tertinggi berada pada nilai carat rendah, yang berarti kebanyakan berlian dalam dataset berukuran kecil. Semakin besar ukuran carat, jumlah berlian semakin menurun. Berlian dengan ukuran besar hanya muncul dalam jumlah terbatas. Grafik ini menunjukkan bahwa dataset lebih banyak berisi berlian berukuran kecil dibandingkan berlian besar.

2. Density Plot (Carat)

Grafik density carat memperjelas pola dari histogram sebelumnya. Kepadatan tertinggi berada pada carat rendah, yang menunjukkan bahwa sebagian besar berlian memiliki ukuran kecil. Kurva kemudian menurun ke arah kanan, menandakan bahwa berlian dengan ukuran besar semakin jarang. Bentuk grafik ini juga menunjukkan adanya sebaran yang condong ke kanan. Dengan demikian, mayoritas berlian dalam dataset memiliki berat yang relatif kecil

3. Boxplot (Carat)

Pada boxplot carat, terlihat bahwa sebagian besar data berada pada nilai carat rendah. Median juga berada di bagian bawah, yang menunjukkan bahwa ukuran berlian yang umum dalam dataset adalah kecil. Selain itu, terdapat beberapa outlier di bagian atas, yang menandakan adanya berlian dengan ukuran sangat besar, meskipun jumlahnya tidak banyak. Hal ini kembali menguatkan hasil visualisasi sebelumnya bahwa berlian berukuran besar hanya merupakan sebagian kecil dari keseluruhan data.

✨ Hubungan Price dan Carat

Jika seluruh visualisasi dilihat secara bersama-sama, dapat disimpulkan bahwa:

  1. Grafik histogram memberikan gambaran awal tentang sebaran data.
  2. Grafik density memperhalus dan memperjelas pola sebaran tersebut.
  3. Boxplot menunjukkan posisi median dan keberadaan nilai ekstrem.

Untuk variabel harga, ketiga grafik menunjukkan bahwa mayoritas berlian memiliki harga rendah hingga menengah, dengan sedikit berlian yang sangat mahal. Untuk variabel carat, ketiga grafik juga menunjukkan bahwa sebagian besar berlian berukuran kecil, dan hanya sedikit yang berukuran besar. Dengan demikian, seluruh visualisasi saling mendukung dan memperkuat satu sama lain dalam menjelaskan karakteristik data.

✨Kesimpulan

Berdasarkan seluruh visualisasi yang dibuat, dapat disimpulkan bahwa dataset diamonds didominasi oleh berlian dengan ukuran kecil dan harga yang relatif terjangkau. Berlian dengan ukuran besar dan harga tinggi memang ada, tetapi jumlahnya sangat terbatas. Hal ini menunjukkan bahwa pasar berlian dalam dataset ini lebih banyak berisi produk untuk segmen menengah dibandingkan segmen premium. Visualisasi ini membantu memahami pola data secara lebih mudah dan intuitif, terutama bagi audiens non-teknis.