Pendahuluan

Ketika mendengar kata “berlian”, kebanyakan orang langsung membayangkan sesuatu yang mahal dan berkilau. Namun muncul pertanyaan sederhana: apakah benar semakin berat berlian, maka semakin mahal harganya? Untuk menjawab pertanyaan itu, kita tidak langsung melihat hubungan keduanya. Kita mulai dari hal paling dasar, yaitu memahami bagaimana berat dan harga tersebar terlebih dahulu. Dengan memahami pola penyebarannya, kita bisa melihat gambaran besarnya sebelum menarik kesimpulan


Mengapa Berat dan Harga?

Saya memilih untuk menganalisis variabel berat karena merupakan ukuran fisik dari berliannya. Kemudian, variabel harga saya pilih karena merupakan nilai ekonomi yang dibayarkan pembeli. Kedua variabel ini merupakan suatu hal yang sudah lumrah diketahui oleh masyarakat luas.


BAB 1 – DISTRIBUSI BERAT BERLIAN

1.1 Histogram Berat Berlian

ggplot(diamonds, aes(x = carat)) +
  geom_histogram(bins = 40, fill = "#5DADE2", color = "white") +
  labs(title = "Histogram Berat Berlian", 
       x = "Berat (carat)", 
       y = "Frekuensi") +
  theme_minimal()

Apa yang terlihat dari grafik di atas?

Batang-batang di sebelah kiri (berat kecil) jauh lebih tinggi dibanding batang di sebelah kanan (berat besar).

Interpretasi:
Histogram di atas menunjukkan distribusi berat berlian dalam satuan carat. Dari histogram ini, tampak bahwa sebagian besar berlian dalam dataset memiliki berat yang kecil. Jumlah berlian dengan berat sekitar 0,2 sampai 0,5 carat jauh lebih banyak dibandingkan berlian yang beratnya di atas 1 karat.

Semakin ke kanan, artinya semakin berat berliannya. Namun ternyata, semakin berat sebuah berlian, jumlahnya pun semakin sedikit (seperti tampak pada histogram di atas). Ini berarti berlian yang berat memang ada, tetapi jumlahnya jauh lebih jarang dibandingkan berlian yang lebih ringan.

Hal ini sesuai dengan dunia nyata, bahwa berlian kecil jauh lebih umum dan lebih mudah ditemukan daripada berlian besar.


1.2 Density Plot Berat Berlian

ggplot(diamonds, aes(x = carat)) +
  geom_density(fill = "#5DADE2", alpha = 0.5) +
  labs(title = "Density Plot Berat Berlian",
       x = "Berat (carat)",
       y = "Density") +
  theme_minimal()

Apa yang terlihat dari grafik di atas?

Kurva tinggi di bagian kiri, lalu menurun panjang ke kanan.

Interpretasi:
Kurva ini memperjelas apa yang tadi terlihat di histogram. Puncak kurva berada di bagian berat rendah. Itu berarti sebagian besar data berkumpul di berat kecil. Bagian kanan terlihat memanjang tetapi rendah. Artinya, memang ada berlian yang beratnya besar, tetapi jumlahnya sangat sedikit. Dapat kita bayangkan seperti gunung yang tinggi di kiri dan landai panjang ke kanan. Hal ini menunjukkan bahwa berat yang kecil mendominasi dataset ini.


1.3 Boxplot Berat Berlian

ggplot(diamonds, aes(y = carat)) +
  geom_boxplot(fill = "#5DADE2") +
  labs(title = "Boxplot Berat Berlian",
       y = "Berat (carat)") +
  theme_minimal()

Apa yang terlihat dari grafik di atas?

Kotak berada di bagian bawah, dengan banyak titik di atasnya.

Interpretasi:
Kotak pada boxplot menunjukkan tempat berkumpulnya sebagian besar data. Di grafik ini, kotaknya berada di berat rendah. Hal ini berarti mayoritas berlian memiliki berat yang relatif kecil. Titik-titik di atas kotak menunjukkan berlian yang beratnya jauh lebih besar dibandingkan kebanyakan lainnya. Titik ini disebut nilai ekstrem. Artinya, ada beberapa berlian yang sangat berat, tetapi jumlahnya sedikit sekali dibandingkan mayoritas.



BAB 2 – DISTRIBUSI HARGA BERLIAN

2.1 Histogram Harga Berlian

ggplot(diamonds, aes(x = price)) +
  geom_histogram(bins = 40, fill = "#F1948A", color = "white") +
  labs(title = "Histogram Harga Berlian",
       x = "Harga (USD)",
       y = "Frekuensi") +
  theme_minimal()

Apa yang terlihat dari grafik di atas? :

Batang tinggi di harga rendah, makin kecil di harga tinggi.

Interpretasi:
Sebagian besar berlian dijual dengan harga yang relatif rendah sampai menengah. Hanya sedikit berlian yang memiliki harga sangat tinggi. Dari grafik di atas, dapat juga dilihat bahwa semakin mahal harga berlian, semakin sedikit jumlahnya dalam dataset ini. Dengan kata lain, berlian dengan harga sangat mahal memang ada, tetapi tidak banyak.


2.2 Density Plot Harga Berlian

ggplot(diamonds, aes(x = price)) +
  geom_density(fill = "#F1948A", alpha = 0.5) +
  labs(title = "Density Plot Harga Berlian",
       x = "Harga (USD)",
       y = "Density") +
  theme_minimal()

Apa yang terlihat dari grafik di atas?

Kurva tinggi di harga rendah, lalu memanjang ke kanan.

Interpretasi:
Kurva di atas menunjukkan sebagian besar harga terkumpul di bagian bawah (harga lebih murah). Kemudian kurva menurun perlahan ke arah harga yang lebih tinggi. Bagian kanan yang memanjang menunjukkan ada harga yang sangat tinggi, tetapi jumlahnya sedikit. Secara sederhana, hal ini berarti kebanyakan berlian berada pada harga yang tidak terlalu mahal.


2.3 Boxplot Harga Berlian

ggplot(diamonds, aes(y = price)) +
  geom_boxplot(fill = "#F1948A") +
  labs(title = "Boxplot Harga Berlian",
       y = "Harga (USD)") +
  theme_minimal()

Apa yang terlihat dari grafik di atas?

Banyak titik di atas kotak.

Interpretasi:
Kotak pada boxplot di atas menunjukkan harga yang paling umum atau paling sering muncul. Nilainya berada di harga yang relatif lebih rendah dibanding harga tertinggi di grafik. Kemudian, titik-titik yang ada di atasnya menunjukkan ada berlian yang harganya jauh lebih mahal dibandingkan rata-rata. Artinya, terdapat beberapa berlian yang sangat mahal, tetapi jumlahnya sedikit.



BAB 3 – HUBUNGAN BERAT DAN HARGA

# Membuat kelompok berat untuk analisis hubungan
diamonds_grouped <- diamonds
diamonds_grouped$kelompok_karat <- cut(
  diamonds_grouped$carat,
  breaks = c(0, 0.5, 1, 1.5, 2, Inf),
  labels = c("< 0.5 carat", "0.5-1 carat", "1-1.5 carat", "1.5-2 carat", "> 2 carat"),
  include.lowest = TRUE
)

3.1 Violin Plot Harga berdasarkan Kelompok Berat

ggplot(diamonds_grouped, aes(x = kelompok_karat, y = price, fill = kelompok_karat)) +
  geom_violin(alpha = 0.6) +
  labs(title = "Distribusi Harga berdasarkan Kelompok Berat Berlian",
       x = "Kelompok Berat",
       y = "Harga (USD)") +
  theme_minimal() +
  theme(legend.position = "none",
        axis.text.x = element_text(angle = 45, hjust = 1))

Apa yang terlihat dari grafik di atas?

Kelompok berat kecil memiliki harga yang lebih rendah. Kelompok berat besar memiliki harga yang lebih tinggi.

Interpretasi:
Ketika berat berlian dikelompokkan, terlihat bahwa semakin besar kelompok beratnya, semakin tinggi pula rentang harganya.

Kelompok berat kecil sebagian besar memiliki harga rendah. Kelompok berat menengah memiliki harga yang mulai naik. Kelompok berat besar memiliki harga yang jauh lebih tinggi. Hal ini menunjukkan bahwa berat dan harga bergerak searah. Saat berat naik, harga juga cenderung naik.

Selain itu, terlihat pula sebuah pola, bahwa semakin berat berlian, maka semakin tinggi dan semakin lebar distribusi harganya. Temuan ini mengindikasikan bahwa selain berat, faktor lain seperti kualitas (cut, color, clarity) diduga berperan dalam menentukan harga pada berlian berat.


3.2 Density Plot Harga Bertumpuk berdasarkan Kelompok Berat

ggplot(diamonds_grouped, aes(x = price, fill = kelompok_karat)) +
  geom_density(alpha = 0.4) +
  labs(title = "Density Plot Harga per Kelompok Berat Berlian",
       x = "Harga (USD)",
       y = "Density",
       fill = "Kelompok Berat") +
  theme_minimal() +
  scale_fill_brewer(palette = "Set1")

Apa yang terlihat dari grafik di atas?

Kurva kelompok berat kecil berada di kiri. Kurva kelompok berat besar bergeser ke kanan.

Interpretasi:
Kurva yang berada lebih ke kanan berarti memiliki harga yang lebih tinggi. Dapat pula kita lihat, bahwa kelompok berat besar memiliki kurva yang bergeser ke kanan, artinya harga mereka lebih mahal. Sedangkan kelompok berat kecil berada di kiri,yang berarti harganya lebih rendah.

Hal ini memperkuat temuan kita bahwa berat memengaruhi harga.


Penutup

Dari seluruh grafik, dapat disimpulkan bahwa:

  1. Sebagian besar berlian dalam dataset memiliki berat kecil.
  2. Sebagian besar berlian memiliki harga yang tidak terlalu mahal.
  3. Berlian yang sangat berat dan sangat mahal memang ada, tetapi jumlahnya sedikit.
  4. Semakin berat berlian, secara umum harganya semakin tinggi.

Artinya, memang terdapat hubungan yang jelas antara berat dan harga. Namun, berat bukan satu-satunya faktor penentu harga, tetapi terlihat memiliki pengaruh yang cukup kuat.