Pendahuluan

Bivariat merupakan analisis yang digunakan untuk melihat hubungan antara dua variabel dalam suatu data. Melalui analisis ini, kita dapat mengetahui apakah terdapat pola, kecenderungan, atau keterkaitan tertentu antara satu variabel dengan variabel lainnya. Pendekatan bivariat sering digunakan dalam eksplorasi data karena mampu memberikan gambaran awal yang jelas sebelum dilakukan analisis yang lebih mendalam.

Pada dataset diamonds, terdapat berbagai karakteristik berlian seperti berat (carat), harga (price), kedalaman (depth), dan ukuran fisik lainnya yang dapat dianalisis hubungannya. Dengan menggunakan visualisasi grafik, hubungan antar karakteristik tersebut dapat diamati secara lebih mudah dan informatif. Melalui analisis ini, diharapkan dapat diperoleh pemahaman yang lebih baik mengenai pola keterkaitan antar atribut berlian serta faktor-faktor yang berperan dalam menentukan nilainya.

## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48

Scatter Plot

ggplot(diamonds, aes(x = carat, y = price)) +
  geom_point(color = "pink2", alpha = 0.3) +
  labs(
    title = "Hubungan Carat dan Price",
    x = "Carat",
    y = "Price"
  ) +
  theme_minimal()

Grafik scatter tersebut menunjukkan hubungan yang sangat jelas antara ukuran berlian (carat) dan harga. Terlihat bahwa peningkatan nilai carat diikuti oleh kenaikan harga yang cukup signifikan. Pola titik yang membentuk tren naik ini mengindikasikan bahwa carat merupakan faktor paling dominan dalam menentukan nilai jual berlian. Meskipun terdapat variasi harga pada carat yang sama, kecenderungan umum tetap menunjukkan bahwa semakin besar ukuran berlian, semakin tinggi pula harga yang diberikan.

Boxplot

ggplot(diamonds, aes(x = cut, y = price, fill = cut)) +
  geom_boxplot(fill = "pink2") +
  labs(
    title = "Perbandingan Price Berdasarkan Cut",
    x = "Cut",
    y = "Price"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

Boxplot yang disajikan menampilkan perbandingan harga berlian berdasarkan kualitas potongannya. Secara umum, kategori potongan seperti Premium dan Very Good menunjukkan median harga yang lebih tinggi dibandingkan kategori Fair dan Good. Namun demikian, rentang harga pada masing-masing kategori tergolong luas, sehingga harga berlian dengan cut yang sama masih dapat berbeda secara substansial. Hal ini mengindikasikan bahwa kualitas potongan memang mempengaruhi harga, tetapi tidak sekuat pengaruh ukuran carat.

Hexbin Plot

ggplot(diamonds, aes(x = table, y = price)) +
  geom_hex() +
  labs(
    title = "Hexbin Plot Hubungan Table dan Price",
    x = "Table",
    y = "Price"
  ) +
  theme_minimal()

Grafik hexbin memperlihatkan distribusi berlian berdasarkan nilai table dan harga. Sebagian besar berlian berada pada nilai table sekitar 55–60%. Namun, tidak terlihat pola hubungan yang jelas antara table dan harga, karena penyebaran data tidak menunjukkan tren meningkat atau menurun yang konsisten. Dengan demikian, karakteristik table tidak dapat dianggap sebagai faktor utama dalam menentukan harga berlian.

Kesimpulan

Berdasarkan ketiga grafik, dapat disimpulkan bahwa faktor yang paling berpengaruh terhadap harga berlian adalah ukuran carat, yang menunjukkan hubungan positif dan kuat dengan harga. Kualitas potongan berlian juga berkontribusi terhadap variasi harga, namun pengaruhnya lebih terbatas dibandingkan carat. Sementara itu, nilai table hanya menunjukkan pengaruh yang minimal dan tidak memiliki pola yang konsisten terhadap harga. Secara keseluruhan, penentuan harga berlian lebih banyak ditentukan oleh ukuran fisik dan sebagian oleh kualitas potongan, sementara karakteristik lainnya memiliki peran yang relatif kecil.