Dalam industri berlian, penentuan harga tidak hanya dipengaruhi oleh satu faktor, melainkan oleh kombinasi berbagai karakteristik fisik dan kualitas. Permasalahan yang sering muncul adalah sulitnya memahami faktor mana yang paling berpengaruh terhadap harga serta bagaimana pola hubungan antar variabel tersebut, terutama ketika jumlah data sangat besar. Visualisasi sederhana seperti scatter plot seringkali kurang efektif karena terjadi penumpukan data (overplotting) sehingga pola yang sebenarnya sulit terlihat.
Sebagai solusi, penelitian ini menggunakan beberapa teknik visualisasi data bivariat yang lebih informatif, seperti hexbin plot untuk mengatasi kepadatan data yang tinggi, boxplot untuk membandingkan distribusi harga antar kategori, bubble plot untuk menambahkan informasi variabel ketiga, serta 2D density plot untuk melihat pola konsentrasi data. Pendekatan ini diharapkan mampu memberikan pemahaman yang lebih jelas dan komprehensif mengenai hubungan antar variabel, sehingga dapat membantu dalam mengidentifikasi faktor utama yang berkaitan dengan variasi harga berlian.
Analisis ini bertujuan untuk mengeksplorasi hubungan antara karakteristik fisik berlian dengan harga menggunakan pendekatan visualisasi data bivariat. Secara khusus, analisis dilakukan untuk mengidentifikasi pola hubungan antara carat dan price melalui hexbin plot, membandingkan distribusi harga pada setiap kategori kualitas potongan (cut) menggunakan boxplot, serta melihat pengaruh tambahan variabel depth terhadap hubungan carat dan price melalui bubble plot. Selain itu, analisis juga bertujuan untuk memahami pola kepadatan proporsi fisik berlian melalui visualisasi 2D density antara depth dan table.
Melalui keempat visualisasi tersebut, diharapkan dapat diperoleh gambaran menyeluruh mengenai faktor-faktor yang berhubungan dengan variasi harga berlian, baik dari aspek ukuran, kualitas potongan, maupun proporsi fisiknya.
Dataset ini memiliki jumlah observasi yang besar (53.940 data), sehingga diperlukan teknik visualisasi yang tepat untuk menghindari penumpukan titik (overplotting) dan agar pola data dapat terlihat dengan jelas. Pada analisis ini akan melanjutkan studi analisis kontinu univariate yang sebelumnya.
Hexbin plot menunjukkan pola hubungan antara berat berlian (carat) dan harga dengan mempertimbangkan kepadatan data. Terlihat adanya pola yang jelas bahwa semakin besar nilai carat, harga berlian cenderung meningkat. Area dengan kepadatan tertinggi berada pada kisaran carat kecil hingga menengah (sekitar 0,3-1,5 carat), yang menunjukkan bahwa sebagian besar transaksi berlian berada pada ukuran tersebut dengan harga yang relatif lebih terjangkau.
Selain itu, pada nilai carat yang lebih besar, jumlah data semakin sedikit tetapi harga meningkat secara signifikan. Pola ini mengindikasikan bahwa ukuran berlian merupakan faktor utama dalam menentukan harga. Penggunaan hexbin juga membantu mengatasi masalah penumpukan data, sehingga pola hubungan positif antara carat dan price dapat terlihat dengan lebih jelas dibandingkan scatter plot biasa.
Boxplot memperlihatkan distribusi harga berlian pada setiap kategori kualitas potongan (cut). Secara umum, kategori dengan kualitas potongan yang lebih baik seperti Premium dan Very Good memiliki median harga yang cenderung lebih tinggi dibandingkan kategori lainnya. Hal ini menunjukkan bahwa kualitas potongan memberikan nilai tambah terhadap harga berlian.
Namun demikian, rentang harga pada setiap kategori terlihat sangat lebar dan saling tumpang tindih. Banyak outlier dengan harga tinggi muncul di hampir semua kategori. Kondisi ini menunjukkan bahwa meskipun cut berpengaruh terhadap harga, pengaruhnya tidak dominan dan kemungkinan besar dipengaruhi oleh faktor lain, terutama ukuran berlian (carat).
Bubble plot menampilkan hubungan antara carat dan price dengan tambahan informasi depth melalui ukuran dan warna gelembung. Pola utama yang terlihat tetap konsisten dengan hasil sebelumnya, yaitu harga meningkat seiring dengan bertambahnya carat. Hal ini kembali menegaskan bahwa ukuran berlian merupakan faktor yang paling berpengaruh terhadap harga.
Sementara itu, variasi ukuran dan warna gelembung tidak menunjukkan pola tertentu terhadap price. Depth terlihat menyebar pada berbagai tingkat harga dan ukuran carat. Ini mengindikasikan bahwa depth bukan faktor utama yang menentukan harga, melainkan hanya memberikan variasi tambahan yang pengaruhnya relatif kecil dibandingkan carat.
Plot 2D density antara depth dan table menunjukkan bahwa sebagian besar berlian terkonsentrasi pada kisaran depth sekitar 60-62% dan table sekitar 55-57%. Area dengan kepadatan tertinggi menandakan bahwa kombinasi nilai tersebut merupakan proporsi yang paling umum dalam dataset. Hal ini menunjukkan bahwa mayoritas berlian diproduksi dengan ukuran dan proporsi yang relatif seragam serta berada pada rentang yang dianggap optimal dalam proses pemotongan.
Selain itu, pola kepadatan tidak menunjukkan hubungan linier yang kuat antara depth dan table. Penyebaran yang cukup melebar mengindikasikan bahwa perubahan nilai depth tidak selalu diikuti oleh perubahan nilai table secara konsisten. Dengan demikian, kedua variabel lebih mencerminkan variasi proporsi fisik yang masih berada dalam batas standar kualitas, daripada menunjukkan hubungan yang saling memengaruhi secara kuat.
Dari keempat visualisasi, dapat disimpulkan bahwa carat merupakan faktor paling dominan dalam memengaruhi harga berlian. Variabel lain seperti cut memberikan pengaruh tambahan, namun tidak sekuat ukuran berlian. Sementara itu, karakteristik fisik seperti depth dan table cenderung berada pada rentang standar dan tidak menunjukkan pengaruh yang signifikan terhadap variasi harga. Secara keseluruhan, analisis ini menunjukkan bahwa ukuran berlian menjadi pertimbangan utama dalam menentukan nilai ekonomisnya, sedangkan faktor kualitas dan proporsi fisik berperan sebagai faktor pendukung.