Data iris adalah dataset klasik yang sering digunakan dalam pembelajaran statistik dan machine learning. Dataset ini berisi 150 observasi dari 3 spesies bunga iris (setosa, versicolor, dan virginica), dengan atribut panjang dan lebar sepal (kelopak) dan petal (mahkota) dalam satuan sentimeter.
Tujuan analisis ini adalah untuk: - Menampilkan ringkasan statistik data. - Visualisasi distribusi panjang dan lebar sepal. - Menjelaskan perbedaan antar spesies berdasarkan atribut bunga.
# Ringkasan statistik data iris
summary(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
## 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
## Median :5.800 Median :3.000 Median :4.350 Median :1.300
## Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
## 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
## Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
## Species
## setosa :50
## versicolor:50
## virginica :50
##
##
##
# Menampilkan 6 data pertama
head(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
ggplot(iris, aes(x = Species, y = Sepal.Length, fill = Species)) +
geom_boxplot() +
labs(title = "Distribusi Panjang Sepal per Spesies",
x = "Spesies",
y = "Panjang Sepal (cm)") +
theme_minimal()
ggplot(iris, aes(x = Petal.Length, y = Sepal.Length, color = Species)) +
geom_point(size = 3, alpha = 0.7) +
labs(title = "Panjang Mahkota vs Panjang Kelopak",
x = "Panjang Mahkota (Petal)",
y = "Panjang Kelopak (Sepal)") +
theme_light()
Dengan menggunakan R Markdown, kamu bisa dengan mudah menggabungkan
analisis, visualisasi, dan narasi menjadi satu laporan yang rapi. Jika
kamu ingin pakai dataset lain (misalnya mtcars,
ToothGrowth, atau diamonds), tinggal ganti aja
bagian datanya ya!
# Contoh cepat pakai data mtcars
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot() +
labs(title = "Distribusi MPG Berdasarkan Jumlah Silinder",
x = "Jumlah Silinder", y = "Miles Per Gallon (MPG)")