library(ggplot2)
data("diamonds")
Analisis ini bertujuan untuk mengeksplorasi distribusi variabel kontinu pada dataset diamonds menggunakan visualisasi data. Visualisasi dilakukan dengan pendekatan univariate analysis untuk memahami pola sebaran harga berlian secara sederhana dan komunikatif.
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
head(diamonds)
## # A tibble: 6 × 10
## carat cut color clarity depth table price x y z
## <dbl> <ord> <ord> <ord> <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
## 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31
## 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31
## 4 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63
## 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75
## 6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48
summary(diamonds$price)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 326 950 2401 3933 5324 18823
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Dataset tidak memiliki nilai hilang dan variabel harga menunjukkan variasi nilai yang cukup besar, sehingga menarik untuk dianalisis lebih lanjut melalui visualisasi.
Jadi,berdasarkan hasil visualisasi data, dapat diketahui bahwa sebagian besar berlian dalam dataset memiliki harga pada kisaran rendah hingga menengah, sementara berlian dengan harga sangat tinggi jumlahnya relatif sedikit. Pola ini menunjukkan bahwa semakin mahal harga berlian, semakin jarang keberadaannya dalam data. Selain itu, perbandingan harga berdasarkan kategori cut memperlihatkan adanya variasi harga pada setiap kelompok kualitas potongan, dengan kemunculan beberapa berlian berharga sangat tinggi di berbagai kategori. Secara keseluruhan, visualisasi ini memberikan gambaran bahwa distribusi harga berlian tidak merata, didominasi oleh harga terjangkau, namun tetap terdapat berlian premium yang tersebar pada berbagai tingkat kualitas potongan.
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.