Statistik deskriptif merupakan cabang statistika yang digunakan untuk menggambarkan dan merangkum data sehingga lebih mudah dipahami. Melalui ukuran seperti mean, median, modus, varians, standar deviasi, dan visualisasi, analisis deskriptif membantu memberikan gambaran menyeluruh terhadap karakteristik data. Pada R, proses ini dapat dilakukan dengan sangat mudah menggunakan fungsi bawaan serta paket tambahan. Selain itu, R juga menyediakan fungsi distribusi seperti dnorm, pnorm, qnorm, dan rnorm yang sangat penting dalam analisis probabilitas dan distribusi normal.
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
berat <- c(45, 50, 55, 60, 52, 48, 65, 70, 58, 54)
berat
## [1] 45 50 55 60 52 48 65 70 58 54
mean(berat) # Rata-rata
## [1] 55.7
median(berat) # Median
## [1] 54.5
sd(berat) # Standar deviasi
## [1] 7.732328
var(berat) # Varians
## [1] 59.78889
summary(berat) # Ringkasan lengkap
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 45.0 50.5 54.5 55.7 59.5 70.0
hist(berat, main="Histogram Berat Badan", xlab="Berat", col="lightblue")
boxplot(berat, main="Boxplot Berat Badan", col="pink")
Fungsi distribusi normal memiliki empat fungsi utama:
dnorm(50, mean=55, sd=10) # Densitas di x = 50
## [1] 0.03520653
pnorm(50, mean=55, sd=10) # P(X <= 50)
## [1] 0.3085375
qnorm(0.95, mean=55, sd=10) # Quantile 95%
## [1] 71.44854
set.seed(123)
rnorm(5, mean=55, sd=10) # 5 data acak normal
## [1] 49.39524 52.69823 70.58708 55.70508 56.29288
x <- seq(20, 90, by=0.1)
plot(x, dnorm(x, mean=55, sd=10), type="l",
main="Kurva Distribusi Normal", ylab="Densitas")
set.seed(99)
data_norm <- rnorm(100, mean=55, sd=10)
plot(data_norm, type="o", col="blue",
main="Data Acak Distribusi Normal")
summary(data_norm)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 24.59 48.55 55.50 53.96 59.58 73.65