Analisis data bivariat bertujuan untuk memahami hubungan antara dua variabel serta mengidentifikasi pola keterkaitan yang mungkin memiliki implikasi ekonomi atau bisnis. Dalam praktik profesional, visualisasi tidak hanya berfungsi sebagai alat presentasi, tetapi juga sebagai instrumen eksplorasi untuk menemukan insight yang tidak langsung terlihat dari tabel angka.
Dataset yang digunakan dalam analisis ini adalah diamonds yang tersedia dalam package ggplot2 pada lingkungan R. Dataset ini berisi lebih dari 50.000 observasi berlian dengan karakteristik fisik seperti berat (carat), kedalaman (depth), dimensi (x, y, z), serta harga (price). Data ini relevan untuk mengeksplorasi bagaimana atribut fisik suatu produk memengaruhi nilai jualnya di pasar.
Setelah memahami struktur dan konteks data, tahap selanjutnya adalah mengevaluasi bagaimana variabel numerik dalam dataset berhubungan satu sama lain, khususnya dalam menjelaskan variasi harga berlian. Melalui visualisasi bivariat, analisis ini bertujuan untuk mengidentifikasi kekuatan hubungan, arah kecenderungan (positif atau negatif), serta pola non-linear yang mungkin muncul dalam data. Hasil eksplorasi ini diharapkan dapat memberikan gambaran yang lebih komprehensif mengenai faktor-faktor yang paling berpengaruh terhadap nilai ekonomis berlian.
library(ggplot2)
library(dplyr)
data(diamonds)
head(diamonds)
## # A tibble: 6 × 10
## carat cut color clarity depth table price x y z
## <dbl> <ord> <ord> <ord> <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
## 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31
## 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31
## 4 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63
## 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75
## 6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48
ggplot(diamonds, aes(x = carat, y = price)) +
geom_point(alpha = 0.3, color = "steelblue") +
labs(
title = "Hubungan Berat Berlian (Carat) dan Harga",
x = "Carat (Berat Berlian)",
y = "Harga (USD)"
) +
theme_minimal()
Visualisasi ini menunjukkan hubungan positif yang sangat kuat antara carat dan harga. Semakin besar berat berlian, semakin tinggi harganya, bahkan kenaikan harga terlihat semakin tajam pada karat yang lebih besar. Pola ini menunjukkan bahwa ukuran total merupakan faktor utama dalam pembentukan nilai pasar berlian.
Ini menjadi dasar untuk membandingkan variabel fisik lainnya pada visualisasi berikutnya. Jika carat menunjukkan hubungan yang kuat, maka variabel lain seperti depth dan dimensi fisik perlu dilihat apakah memiliki kekuatan hubungan yang serupa atau justru lebih lemah.
ggplot(diamonds, aes(x = depth, y = price)) +
geom_point(alpha = 0.3, color = "steelblue") +
labs(
title = "Hubungan Kedalaman Berlian dan Harga",
x = "Depth",
y = "Harga (USD)"
) +
theme_minimal()
Pada visualisasi kedua, hubungan antara depth dan harga terlihat jauh lebih lemah dibandingkan hubungan carat dan harga sebelumnya. Tidak tampak pola peningkatan harga yang konsisten seiring perubahan depth, dan sebagian besar berlian memiliki rentang depth yang relatif seragam meskipun harganya bervariasi.
Jika dibandingkan dengan Visualisasi 1, jelas bahwa depth bukan faktor utama dalam menentukan harga. Hal ini menunjukkan bahwa proporsi kedalaman lebih mencerminkan standar pemotongan daripada menjadi penentu utama nilai ekonomi berlian.
ggplot(diamonds, aes(x = x, y = price)) +
geom_hex(color = "steelblue") +
labs(
title = "Hubungan Dimensi Panjang Berlian (x) dan Harga",
x = "Panjang Berlian (mm)",
y = "Harga (USD)"
) +
theme_minimal()
Visualisasi ketiga memperlihatkan bahwa dimensi panjang (x) memiliki hubungan positif terhadap harga. Semakin besar ukuran fisik berlian, harga cenderung meningkat. Namun pola sebarannya lebih luas dibandingkan hubungan carat dengan harga, sehingga kekuatan hubungannya tidak sekuat berat total.
Dibandingkan dengan dua visualisasi sebelumnya, dapat disimpulkan bahwa dimensi fisik memang berpengaruh terhadap harga, tetapi tetap berada di bawah pengaruh carat. Secara keseluruhan, ketiga visualisasi menunjukkan bahwa ukuran total (massa) adalah faktor dominan, sementara proporsi dan dimensi tunggal memiliki pengaruh yang lebih terbatas.
Berdasarkan ketiga visualisasi, terlihat bahwa carat memiliki pengaruh paling kuat terhadap harga berlian dibandingkan variabel fisik lainnya. Hubungan antara berat dan harga menunjukkan pola peningkatan yang jelas dan signifikan. Sementara itu, dimensi fisik seperti panjang (x) juga menunjukkan hubungan positif dengan harga, tetapi kekuatannya tidak sekuat carat. Adapun depth memiliki hubungan yang paling lemah dan tidak menunjukkan pola yang konsisten terhadap kenaikan harga.