Bivariat merupakan analisis yang digunakan untuk melihat hubungan antara dua variabel dalam suatu data. Melalui analisis ini, kita dapat mengetahui apakah terdapat pola, kecenderungan, atau keterkaitan tertentu antara satu variabel dengan variabel lainnya. Pendekatan bivariat sering digunakan dalam eksplorasi data karena mampu memberikan gambaran awal yang jelas sebelum dilakukan analisis yang lebih mendalam.
Pada dataset diamonds, terdapat berbagai karakteristik
berlian seperti berat (carat), harga (price), kedalaman (depth), dan
ukuran fisik lainnya yang dapat dianalisis hubungannya. Dengan
menggunakan visualisasi grafik, hubungan antar karakteristik tersebut
dapat diamati secara lebih mudah dan informatif. Melalui analisis ini,
diharapkan dapat diperoleh pemahaman yang lebih baik mengenai pola
keterkaitan antar atribut berlian serta faktor-faktor yang berperan
dalam menentukan nilainya.
## # A tibble: 6 × 10
## carat cut color clarity depth table price x y z
## <dbl> <ord> <ord> <ord> <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
## 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31
## 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31
## 4 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63
## 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75
## 6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48
ggplot(diamonds, aes(x = carat, y = price)) +
geom_point(color = "pink2", alpha = 0.3) +
labs(
title = "Hubungan Carat dan Price",
x = "Carat",
y = "Price"
) +
theme_minimal()
Grafik scatter tersebut menunjukkan hubungan yang sangat jelas antara ukuran berlian (carat) dan harga. Terlihat bahwa peningkatan nilai carat diikuti oleh kenaikan harga yang cukup signifikan. Pola titik yang membentuk tren naik ini mengindikasikan bahwa carat merupakan faktor paling dominan dalam menentukan nilai jual berlian. Meskipun terdapat variasi harga pada carat yang sama, kecenderungan umum tetap menunjukkan bahwa semakin besar ukuran berlian, semakin tinggi pula harga yang diberikan.
ggplot(diamonds, aes(x = cut, y = price, fill = cut)) +
geom_boxplot(fill = "pink2") +
labs(
title = "Perbandingan Price Berdasarkan Cut",
x = "Cut",
y = "Price"
) +
theme_minimal() +
theme(legend.position = "none")
Boxplot yang disajikan menampilkan perbandingan harga berlian berdasarkan kualitas potongannya. Secara umum, kategori potongan seperti Premium dan Very Good menunjukkan median harga yang lebih tinggi dibandingkan kategori Fair dan Good. Namun demikian, rentang harga pada masing-masing kategori tergolong luas, sehingga harga berlian dengan cut yang sama masih dapat berbeda secara substansial. Hal ini mengindikasikan bahwa kualitas potongan memang mempengaruhi harga, tetapi tidak sekuat pengaruh ukuran carat.
ggplot(diamonds, aes(x = table, y = price)) +
geom_hex() +
labs(
title = "Hexbin Plot Hubungan Table dan Price",
x = "Table",
y = "Price"
) +
theme_minimal()
Grafik hexbin memperlihatkan distribusi berlian berdasarkan nilai table dan harga. Sebagian besar berlian berada pada nilai table sekitar 55–60%. Namun, tidak terlihat pola hubungan yang jelas antara table dan harga, karena penyebaran data tidak menunjukkan tren meningkat atau menurun yang konsisten. Dengan demikian, karakteristik table tidak dapat dianggap sebagai faktor utama dalam menentukan harga berlian.
Berdasarkan ketiga grafik, dapat disimpulkan bahwa faktor yang paling berpengaruh terhadap harga berlian adalah ukuran carat, yang menunjukkan hubungan positif dan kuat dengan harga. Kualitas potongan berlian juga berkontribusi terhadap variasi harga, namun pengaruhnya lebih terbatas dibandingkan carat. Sementara itu, nilai table hanya menunjukkan pengaruh yang minimal dan tidak memiliki pola yang konsisten terhadap harga. Secara keseluruhan, penentuan harga berlian lebih banyak ditentukan oleh ukuran fisik dan sebagian oleh kualitas potongan, sementara karakteristik lainnya memiliki peran yang relatif kecil.