library (ggplot2)
head(diamonds)
## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48
ggplot(diamonds, aes(x = carat))+
  geom_histogram(bins = 50, fill = "pink2", color = "black") +
  labs(
    title = "Histogram Carat Berlian",
    x = "Carat Berlian",
    y = "Frekuensi"
  )+
  theme_minimal()

Interpretasi Histogram

Histogram tersebut menunjukkan bahwa sebagian besar berlian dalam data memiliki berat (carat) yang kecil hingga sedang, terutama pada kisaran sekitar 0,3 sampai 1 carat karena pada rentang tersebut batang histogram terlihat paling tinggi yang berarti jumlahnya paling banyak. Semakin besar nilai carat, jumlah berliannya semakin sedikit, sehingga berlian dengan berat di atas 2 carat tergolong jarang dan yang mendekati 3 carat atau lebih jumlahnya sangat sedikit. Secara keseluruhan, bentuk grafiknya miring ke kanan (skewed right), yang menandakan bahwa data lebih banyak terkonsentrasi pada carat kecil, sementara berlian berukuran besar jauh lebih langka dalam dataset tersebut.

ggplot(diamonds, aes(x = cut, y = carat))+
  geom_boxplot(fill = "pink2") +
  labs(
    title = "Box Plot Carat Berlian Berdasarkan Potongan",
    x = "Potongan Berlian",
    y = "Carat Berlian"
  )+
  theme_minimal()

Interpretasi Box Plot

Box plot tersebut menunjukkan bahwa berat berlian (carat) berbeda-beda pada setiap jenis potongan. Median carat pada potongan Fair dan Premium terlihat sedikit lebih tinggi, sedangkan Ideal cenderung memiliki median yang lebih rendah, artinya banyak berlian Ideal berukuran lebih kecil. Semua kategori juga memiliki beberapa outlier di bagian atas, yang menunjukkan adanya berlian berukuran besar meskipun jumlahnya sedikit. Secara umum, sebagian besar berlian di setiap potongan tetap berada pada kisaran carat kecil hingga sedang.

ggplot(diamonds, aes(x = color, y = carat)) +
  geom_violin(fill = "pink2") +
  labs(
    title = "Violin Plot Carat Berlian Berdasarkan Warna",
    x = "Warna Berlian",
    y = "Carat Berlian"
  ) +
  theme_minimal()

Interpretasi Violin Plot

Violin plot tersebut menunjukkan sebaran berat berlian (carat) berdasarkan warna, dari D sampai J. Terlihat bahwa sebagian besar berlian pada semua warna memiliki carat kecil, karena bagian paling lebar dari grafik berada di kisaran sekitar 0,3 hingga 1 carat. Namun, semakin ke warna J, sebaran carat tampak lebih lebar dan menjangkau nilai yang lebih tinggi, artinya pada warna yang lebih rendah (seperti I dan J) lebih banyak ditemukan berlian dengan ukuran lebih besar. Sementara itu, warna yang lebih baik seperti D dan E cenderung memiliki sebaran yang lebih terkonsentrasi pada ukuran kecil hingga sedang. Secara umum, meskipun semua warna didominasi oleh carat kecil, warna yang kualitasnya lebih rendah cenderung memiliki variasi ukuran yang lebih besar.

ggplot(diamonds, aes(x = carat)) +
  geom_density(fill = "pink2") +
  labs(
    title = "Density Plot Carat Berlian Berdasarkan Warna",
    x = "Carat Berlian",
    y = "Kepadatan"
  ) +
  theme_minimal()

Interpretasi Density Plot

Density plot tersebut menunjukkan pola sebaran berat berlian (carat) dalam bentuk kurva kepadatan. Terlihat bahwa puncak tertinggi berada pada kisaran carat kecil, sekitar 0,3 sampai 0,5 carat, yang berarti ukuran tersebut paling banyak ditemukan. Setelah itu, kurva membentuk beberapa puncak kecil di sekitar 1 carat dan sedikit di atasnya, menandakan masih ada cukup banyak berlian di ukuran tersebut. Semakin besar nilai carat, kurva semakin menurun dan mendekati nol, artinya berlian berukuran besar jumlahnya semakin sedikit. Secara keseluruhan, grafik ini menunjukkan bahwa data didominasi oleh berlian berukuran kecil dan distribusinya miring ke kanan (right-skewed).