#Pendahuluan Visualisasi data merupakan bagian penting dalam proses analisis, terutama pada tahap eksplorasi awal. Melalui visualisasi, pola distribusi, perbandingan antar kategori, serta kecenderungan tertentu dalam data dapat dipahami secara lebih jelas dibandingkan hanya melihat angka dalam bentuk tabel. Grafik membantu menyederhanakan informasi sehingga lebih mudah diinterpretasikan, baik oleh pembaca teknis maupun non-teknis.

#Visualisasi 1 HISTOGRAM

ggplot(diamonds, aes(x = price)) +
  geom_histogram(
    binwidth = 2000,
    fill = "pink",
    color = "white"
  ) +
  labs(
    title = "Distribusi Harga Berlian",
    x = "Harga (US Dollar)",
    y = "Jumlah Berlian",
    caption = "Sumber: Dataset diamonds"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold")
  )

Dari histogram terlihat bahwa sebagian besar berlian berada pada rentang harga rendah hingga menengah. Semakin tinggi harga, jumlah berlian semakin sedikit. Artinya, pasar lebih didominasi oleh berlian yang relatif terjangkau. Pola ini menunjukkan distribusi yang miring ke kanan, di mana hanya sebagian kecil berlian yang memiliki harga sangat tinggi.

#Visualisasi 2 DENSITY PLOT

ggplot(diamonds, aes(x = carat)) +
  geom_density(
    fill = "cyan",
    alpha = 0.6,
    color = "blue",
    linewidth = 1
  ) +
  labs(
    title = "Distribusi Berat Berlian (Carat)",
    x = "Berat (Carat)",
    y = "Kepadatan",
    caption = "Sumber: Dataset diamonds"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold")
  )

Visualisasi data merupakan bagian penting dalam proses analisis, terutama pada tahap eksplorasi awal. Melalui visualisasi, pola distribusi, perbandingan antar kategori, serta kecenderungan tertentu dalam data dapat dipahami secara lebih jelas dibandingkan hanya melihat angka dalam bentuk tabel. Grafik membantu menyederhanakan informasi sehingga lebih mudah diinterpretasikan, baik oleh pembaca teknis maupun non-teknis.

#Visualisasi 3 BOXPLOT

ggplot(diamonds, aes(y = price)) +
  geom_boxplot(fill = "brown") +
  labs(
    title = "Boxplot Harga Berlian",
    y = "Harga (US Dollar)",
    caption = "Sumber: Dataset diamonds"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold")
  )

Dari boxplot terlihat bahwa median harga berada pada kisaran harga menengah. Namun terdapat banyak titik pencilan (outlier) di bagian atas, yang menunjukkan adanya berlian dengan harga sangat tinggi dibandingkan mayoritas data. Sebaliknya, bagian bawah relatif lebih rapat. Ini memperkuat bahwa distribusi harga tidak simetris dan cenderung miring ke kanan.

#Kesimpulan Secara keseluruhan, dataset ini menunjukkan bahwa pasar berlian didominasi oleh produk dengan harga dan berat yang relatif rendah. Berlian dengan harga dan berat tinggi memang ada, tetapi jumlahnya jauh lebih sedikit. Pola distribusi yang miring ke kanan pada variabel harga dan carat menunjukkan bahwa segmen premium bersifat eksklusif dan tidak mendominasi pasar.