Statistika Deskriptif dengan R
belajar statistika deskriptif 14/08/2025
membuat tabel
melakukan analisis deskriprif
## mean dari data: 61.8 kg
## median dari data: 59 kg
# membuat fungsi untuk modus
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
# menampilkan modus
terbanyak <- modus(data$bb)
cat("modus dari data: ", data$bb, "kg", "\n")## modus dari data: 55 65 50 70 60 58 75 52 80 53 kg
menghitung penyebaran data (sebaran data)
# range, variansi, standar deviasi
rentang <- range(data$bb) # variabel
cat("rentang dari data: ", rentang, "\n") ## rentang dari data: 50 80
## [1] 50 80
## variansi dari data: 106.6222
## simpangan baku dari data ialah: 10.3258
membuat visualisasi
# membuat scatter plot
plot(data$bb, data$tb, main = "Hubungan berat badan dengan tinggi badan", xlab = "berat badan", ylab = "tinggi badan", pch = 19, col = "blue")
# membuat histogram
hist(data$bb, col = "skyblue",
main = "histogram berat badan mahasiswa kelas B",
xlab = "berat badan (kg)"
)
# barplot
barplot(data$tb, names.arg = data$tb, col = "yellow", main = "nilai siswa") # ini bawaan R grafik batang
# boxplot
# Hapus data dengan tb > 250 (batas wajar tinggi badan manusia)
data_no_outlier <- subset(data, tb <= 250)
# Buat boxplot
par(mfrow = c(1, 2)) # 2 plot sejajar
boxplot(data_no_outlier$bb,
main = "Boxplot Berat Badan (Tanpa Outlier)",
ylab = "Berat Badan (kg)")
boxplot(data_no_outlier$tb,
main = "Boxplot Tinggi Badan (Tanpa Outlier)",
ylab = "Tinggi Badan (cm)")
Note that the
echo = FALSE parameter was added to the code
chunk to prevent printing of the R code that generated the plot.