Dataset yang digunakan dalam analisis ini adalah dataset diamonds, yang tersedia dalam package ggplot2 di R. Dataset ini berisi informasi mengenai lebih dari 50.000 berlian, termasuk karakteristik fisik dan kualitasnya, seperti berat (carat), harga (price), kedalaman (depth), ukuran meja (table), serta dimensi fisik berlian (x, y, z).

Dataset ini sering digunakan dalam analisis eksploratif karena memiliki kombinasi variabel numerik dan kategorik yang memungkinkan analisis distribusi maupun hubungan antarvariabel.

Pada tahap awal analisis, kita mulai dengan pertanyaan:

Untuk menjawab pertanyaan tersebut digunakan visualisasi univariate kontinu, yaitu visualisasi yang berfokus pada satu variabel numerik dalam satu waktu. Visualisasi ini membantu kita memahami bentuk distribusi, tingkat variasi, serta pola penyebaran data sebelum masuk ke analisis lebih lanjut.

Statistik Deskriptif Variabel Price

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     326     950    2401    3933    5324   18823

Statistik Deskriptif Variabel Carat

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2000  0.4000  0.7000  0.7979  1.0400  5.0100

Histogram

Histogram menunjukkan bahwa sebagian besar berlian berada pada rentang harga rendah hingga menengah. Distribusi harga tidak simetris dan terlihat memanjang ke sisi kanan (right-skewed).

Artinya:

Hal ini mengindikasikan bahwa pasar berlian bersifat tidak merata, di mana produk kelas menengah mendominasi jumlah observasi.

Density Plot

Density plot memperhalus bentuk distribusi yang terlihat pada histogram. Terlihat satu puncak utama pada harga rendah–menengah, kemudian kurva menurun secara bertahap menuju harga tinggi.

Distribusi yang tidak simetris ini menunjukkan bahwa harga berlian tidak mengikuti distribusi normal. Sebaliknya, harga dipengaruhi oleh faktor kualitas dan ukuran yang menyebabkan sebagian kecil berlian memiliki nilai jauh lebih tinggi dibanding rata-rata.

Boxplot

Boxplot menunjukkan bahwa:

Hal ini menunjukkan bahwa berlian berukuran besar lebih jarang dibandingkan berlian kecil–menengah. Keberadaan outlier ini mencerminkan adanya berlian premium dengan ukuran yang jauh di atas rata-rata.

Violin Plot

Violin plot menunjukkan bahwa kepadatan tertinggi berada pada carat kecil. Bagian violin yang melebar di area bawah menunjukkan bahwa mayoritas berlian memiliki berat rendah.

Bagian atas yang meruncing menunjukkan bahwa semakin besar carat, semakin sedikit jumlah berlian tersebut. Visualisasi ini memperkuat hasil boxplot bahwa distribusi berat berlian tidak merata dan cenderung terkonsentrasi pada ukuran kecil–menengah.

Kesimpulan

Berdasarkan hasil visualisasi univariate menggunakan histogram, density plot, boxplot, dan violin plot terhadap variabel numerik dalam dataset diamonds, dapat disimpulkan bahwa distribusi harga berlian menunjukkan pola yang tidak simetris dan cenderung miring ke kanan (right-skewed). Sebagian besar berlian berada pada kisaran harga rendah hingga menengah, sedangkan hanya sebagian kecil yang memiliki harga sangat tinggi. Hal ini mengindikasikan bahwa pasar berlian didominasi oleh produk dengan harga yang relatif terjangkau, sementara berlian premium bersifat lebih jarang dan berada pada segmen khusus.

Selain itu, distribusi berat berlian (carat) juga menunjukkan bahwa mayoritas berlian memiliki ukuran kecil hingga menengah. Keberadaan beberapa nilai ekstrem pada carat yang tinggi memperlihatkan adanya berlian berukuran besar, namun jumlahnya relatif sedikit dibandingkan keseluruhan data. Pola ini konsisten pada boxplot maupun violin plot yang menunjukkan kepadatan terbesar berada pada carat rendah, dengan distribusi yang semakin menipis pada ukuran yang lebih besar.

Secara keseluruhan, visualisasi ini menunjukkan bahwa baik dari sisi harga maupun berat, berlian dalam dataset memiliki variasi yang cukup signifikan, tetapi tetap terkonsentrasi pada kisaran nilai tertentu. Informasi ini penting sebagai dasar pemahaman awal terhadap karakteristik pasar berlian, sebelum dilakukan analisis lebih lanjut mengenai hubungan antarvariabel seperti pengaruh berat terhadap harga atau peran kualitas dalam menentukan nilai berlian.