Pertemuan 5: Statistik Deskriptif dan Fungsi Distribusi dengan R (Versi Lebih Menarik)

1. Pengantar Statistik Deskriptif

Statistik deskriptif digunakan untuk menggambarkan pola, kecenderungan, dan karakteristik dasar dari suatu dataset. Pada pertemuan ini, kita tidak hanya menggunakan contoh sederhana, tetapi juga dataset real berupa data tinggi badan siswa.

Dataset ini akan digunakan untuk: - Menghitung ukuran pemusatan - Menghitung ukuran penyebaran - Melihat bentuk distribusi - Membuat visualisasi menarik (histogram modern, density plot, violin plot) - Menghitung PDF & CDF


2. Menggunakan Dataset Real

Misalkan kita memiliki data tinggi badan (cm) 50 siswa SMA.

set.seed(123)
tinggi <- round(rnorm(50, mean = 165, sd = 7), 1)
tinggi
##  [1] 161.1 163.4 175.9 165.5 165.9 177.0 168.2 156.1 160.2 161.9 173.6 167.5
## [13] 167.8 165.8 161.1 177.5 168.5 151.2 169.9 161.7 157.5 163.5 157.8 159.9
## [25] 160.6 153.2 170.9 166.1 157.0 173.8 168.0 162.9 171.3 171.1 170.8 169.8
## [37] 168.9 164.6 162.9 162.3 160.1 163.5 156.1 180.2 173.5 157.1 162.2 161.7
## [49] 170.5 164.4

3. Statistik Deskriptif dengan R

3.1 Ukuran Pemusatan

mean(tinggi)   # Rata-rata
## [1] 165.24
tinggi_median <- median(tinggi)   # Median
tinggi_median
## [1] 164.5

3.2 Ukuran Penyebaran

var(tinggi)    # Varians
## [1] 42.15469
sd(tinggi)     # Standar deviasi
## [1] 6.492665
range(tinggi)  # Nilai minimum & maksimum
## [1] 151.2 180.2

3.3 Ukuran Bentuk Distribusi

library(moments)
skewness(tinggi)   # Kemencengan distribusi
## [1] 0.1647452
kurtosis(tinggi)   # Kurtosis distribusi
## [1] 2.574427

4. Visualisasi Data (Grafik Lebih Menarik)

4.1 Histogram + Density Curve (lebih estetik)

hist(tinggi, probability = TRUE, col = "lightblue",
     main = "Histogram & Density Tinggi Badan", xlab = "Tinggi (cm)")
lines(density(tinggi), col = "red", lwd = 2)

4.2 Violin Plot (menarik untuk bentuk distribusi)

library(ggplot2)
ggplot(data.frame(tinggi), aes(x = "", y = tinggi)) +
  geom_violin(fill = "skyblue") +
  geom_boxplot(width = 0.1) +
  labs(title = "Violin Plot Tinggi Badan", y = "Tinggi (cm)")

4.3 Boxplot dengan Warna Menarik

boxplot(tinggi, col = "pink", main = "Boxplot Tinggi Badan", ylab = "Tinggi (cm)")


5. Fungsi Distribusi (PDF & CDF)

Misalkan data dianggap mendekati distribusi normal.

5.1 PDF – Probability Density Function

x <- seq(min(tinggi)-10, max(tinggi)+10, 0.1)
pdf <- dnorm(x, mean = mean(tinggi), sd = sd(tinggi))
plot(x, pdf, type = "l", lwd = 2, col = "blue",
     main = "PDF Tinggi Badan (Normal)", ylab = "Densitas")

5.2 CDF – Cumulative Distribution Function

cdf <- pnorm(x, mean = mean(tinggi), sd = sd(tinggi))
plot(x, cdf, type = "l", lwd = 2, col = "darkgreen",
     main = "CDF Tinggi Badan (Normal)", ylab = "Probabilitas Kumulatif")


6. Kesimpulan

Pada pertemuan ini kita telah belajar: - Menggunakan dataset real - Membuat grafik lebih menarik (density, violin, boxplot modern) - Menghitung statistik deskriptif lengkap - Menghitung & memvisualisasikan PDF dan CDF

Semua langkah ini adalah dasar penting untuk memahami karakteristik data sebelum melakukan analisis lanjutan seperti uji hipotesis dan regresi.