library(ggplot2)
head(diamonds)
## # A tibble: 6 × 10
## carat cut color clarity depth table price x y z
## <dbl> <ord> <ord> <ord> <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
## 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31
## 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31
## 4 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63
## 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75
## 6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48
ggplot(diamonds, aes(x = carat))+
geom_histogram(bins = 50, fill = "plum", color = "black") +
labs(
title = "Histogram Karat Berlian",
x = "Karat Berlian",
y = "Frekuensi"
)+
theme_minimal()
Histogram tersebut menunjukkan distribusi jumlah karat berlian dengan pola miring ke kanan (right skewed). Sebagian besar berlian memiliki karat kecil, terutama pada kisaran sekitar 0,3 hingga 1,2 karat, yang terlihat dari frekuensi yangtinggi pada rentang tersebut. Ini menandakan bahwa berlian berukuran kecil lebih umum ditemukan dibandingkan berlian berukuran besar. Frekuensi berlian mulai menurun secara signifikan setelah 1,5 karat, dan hanya sedikit berlian yang berukuran di atas 2 karat. Hal ini menunjukkan bahwa berlian dengan karat besar relatif jarang. Ekor panjang di sisi kanan histogram memperkuat adanya pencilan (outlier), yaitu berlian dengan karat sangat besar.
ggplot(diamonds, aes(x = cut, y = carat))+
geom_boxplot(fill = "orchid") +
labs(
title = "Box Plot Carat Berlian Berdasarkan Potongan",
x = "Potongan Berlian",
y = "Carat Berlian"
)+
theme_minimal()
Box plot tersebut menunjukkan distribusi karat berlian berdasarkan jenis potongan. Secara umum, median karat pada setiap kategori potongan tidak berbeda jauh. Potongan Premium dan Fair tampak memiliki median karat sedikit lebih tinggi dibandingkan kategori lainnya. Ini menunjukkan bahwa berlian dengan potongan tersebut memiliki variasi ukuran karat yang lebih besar. Sebaliknya, potongan Ideal dan Very Good memiliki median yang lebih rendah dan sebaran yang lebih sempit, menandakan ukuran berlian pada kategori ini lebih terkonsentrasi pada kisaran tertentu. Selain itu, semua kategori menunjukkan adanya outlier di bagian atas, yaitu berlian dengan karat jauh lebih besar dari kebanyakan data. Hal ini menunjukkan bahwa berlian berukuran besar ada di semua jenis potongan, tetapi jumlahnya sangat sedikit. Secara keseluruhan, jenis potongan tidak terlalu memengaruhi ukuran karat secara drastis, karena distribusi tiap kategori relatif mirip.
ggplot(diamonds, aes(x = cut, y = price)) +
geom_violin(fill = "mediumpurple") +
labs(
title = "Violin Plot Potongan Berlian Berdasarkan Harga",
x = "Potongan Berlian",
y = "Harga Berlian"
) +
theme_minimal()
Violin plot tersebut menunjukkan distribusi harga berlian berdasarkan jenis potongan. Secara umum, semua kategori potongan memiliki distribusi harga yang miring ke kanan (right skewed), artinya sebagian besar berlian memiliki harga relatif rendah hingga sedang, dan hanya sedikit berlian dengan harga sangat tinggi. Kepadatan data terbesar pada setiap potongan berada di kisaran harga sekitar 1000-4000, yang menandakan mayoritas berlian berada pada rentang harga tersebut. Potongan Premium dan Fair tampak memiliki sebaran harga yang lebih luas hingga ke nilai yang lebih tinggi, menunjukkan adanya berlian mahal dalam kategori ini. Sementara potongan Ideal, Good, dan Very Good memiliki distribusi yang lebih terkonsentrasi pada harga menengah, walaupun tetap ada beberapa nilai tinggi. Semua kategori menunjukkan ekor panjang di bagian atas violin plot, yang berarti terdapat oulier berupa berlian dengan harga sangat mahal.
ggplot(diamonds, aes(x = depth)) +
geom_density(fill = "purple", alpha = 0.6) +
labs(
title = "Density Plot Ketebalan Berlian",
x = "Ketebalan Berlian",
y = "Kepadatan"
) +
theme_minimal()
Density plot tersebut menunjukkan distribusi ketebalan berlian yang memiliki pola mendekati distribusi normal dengan satu puncak utama. Kepadatan tertinggi berada di sekitar nilai 61-62, yang menandakan sebagian besar berlian memiliki ketebalan pada kisaran tersebut. Sebaran data terlihat cukup sempit, artinya variasi ketebalan berlian tidak terlalu besar dan sebagian besar berlian memiliki ketebalan yang relatif seragam. Hanya sedikit data yang berada jauh di bawah 58 atau di atas 65, yang menunjukkan bahwa ketebalan esktrem jarang ditemukan.