Pendahuluan

Data iris adalah dataset klasik yang sering digunakan dalam pembelajaran statistik dan machine learning. Dataset ini berisi 150 observasi dari 3 spesies bunga iris (setosa, versicolor, dan virginica), dengan atribut panjang dan lebar sepal (kelopak) dan petal (mahkota) dalam satuan sentimeter.

Tujuan analisis ini adalah untuk: - Menampilkan ringkasan statistik data. - Visualisasi distribusi panjang dan lebar sepal. - Menjelaskan perbedaan antar spesies berdasarkan atribut bunga.

Persiapan Library

Melihat Struktur dan Ringkasan Data

# Ringkasan statistik data iris
summary(iris)
##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##        Species  
##  setosa    :50  
##  versicolor:50  
##  virginica :50  
##                 
##                 
## 
# Menampilkan 6 data pertama
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Visualisasi Data: Boxplot Panjang Sepal

ggplot(iris, aes(x = Species, y = Sepal.Length, fill = Species)) +
  geom_boxplot() +
  labs(title = "Distribusi Panjang Sepal per Spesies",
       x = "Spesies",
       y = "Panjang Sepal (cm)") +
  theme_minimal()

Visualisasi Data: Scatter Plot Sepal vs Petal

ggplot(iris, aes(x = Petal.Length, y = Sepal.Length, color = Species)) +
  geom_point(size = 3, alpha = 0.7) +
  labs(title = "Panjang Mahkota vs Panjang Kelopak",
       x = "Panjang Mahkota (Petal)",
       y = "Panjang Kelopak (Sepal)") +
  theme_light()

Kesimpulan


Dengan menggunakan R Markdown, kamu bisa dengan mudah menggabungkan analisis, visualisasi, dan narasi menjadi satu laporan yang rapi. Jika kamu ingin pakai dataset lain (misalnya mtcars, ToothGrowth, atau diamonds), tinggal ganti aja bagian datanya ya!

# Contoh cepat pakai data mtcars
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
  geom_boxplot() +
  labs(title = "Distribusi MPG Berdasarkan Jumlah Silinder",
       x = "Jumlah Silinder", y = "Miles Per Gallon (MPG)")