STATISTIKA DESKRIPTIF DENGAN R

Pada pembahasan kali ini saya akan membandingkan berat badan dan tinggi badan dari kelas A dan kelas B. Sebelum membandingkan yang pertama dilakukan adalah install.package dplyr dan library seperti syntax berikut ini.

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Kemudian setelah itu ikutilah langkah langkah berikut.

Persiapan data

Data harus disiapkan terlebih dahulu agar memudahkan untuk analisis selanjutnya. Berikut adalah data kelas A

nama_A <- c("Ani", "Budi", "Cahya", "Danu", "Eka", "Fitri", "Gilang", "Hani", "Indra", "Jihan")
bb_A <- c(55, 65, 50, 70, 60, 58, 75, 52, 80, 53)
tb_A <- c(160, 175, 155, 180, 165, 162, 178, 158, 185, 159)
Kelas_A <- data.frame(nama_A, bb_A, tb_A)
Kelas_A
##    nama_A bb_A tb_A
## 1     Ani   55  160
## 2    Budi   65  175
## 3   Cahya   50  155
## 4    Danu   70  180
## 5     Eka   60  165
## 6   Fitri   58  162
## 7  Gilang   75  178
## 8    Hani   52  158
## 9   Indra   80  185
## 10  Jihan   53  159

Berikut adalah data kelas B

nama_B <- c("Alya", "Bintang", "Rizki", "Ana", "Nanda", "Dimas", "Ali", "Agus", "Dwi", "Putri")
bb_B <- c(50, 55, 53, 60, 58, 70, 52, 57, 59, 54)
tb_B <- c(145, 160, 172, 155, 160, 170, 148, 162, 160, 143)
Kelas_B <- data.frame(nama_B, bb_B, tb_B)
Kelas_B
##     nama_B bb_B tb_B
## 1     Alya   50  145
## 2  Bintang   55  160
## 3    Rizki   53  172
## 4      Ana   60  155
## 5    Nanda   58  160
## 6    Dimas   70  170
## 7      Ali   52  148
## 8     Agus   57  162
## 9      Dwi   59  160
## 10   Putri   54  143

Setelah mempersiapkan data lanjutlah untuk mengerjakan soal soal.

1. Analisis dan Perbandingan Berat Badan Mahasiswa Kelas A dan Kelas B

a) Bandingkan ukuran pemusatan data (rata-rata, median, modus) dan ukuran penyebaran data(rentang, variansi, simpangan baku) untuk berat badan mahasiswa Kelas A dan Kelas B.

Berikut adalah pemusatan data berat badan kelas A

mean_bbA <- mean(bb_A)
cat("mean_bbA:", mean_bbA, "kg", "\n")
## mean_bbA: 61.8 kg
median_bbA <- median(bb_A)
cat("median_bbA:", median_bbA, "kg", "\n")
## median_bbA: 59 kg
modus <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}
modus_bbA <- modus(bb_A)
cat("modus_bbA:", modus_bbA, "kg", "\n")
## modus_bbA: 55 kg

Berikut adalah Pemusatan data berat badan kelas B

mean_bbB <- mean(bb_B)
cat("mean_bbB:", mean_bbB, "kg", "\n")
## mean_bbB: 56.8 kg
median_bbB <- median(bb_B)
cat("median_bbB:", median_bbB, "kg", "\n")
## median_bbB: 56 kg
modus_bbB <- modus(bb_B)
cat("modus_bbB:", modus_bbB, "kg", "\n")
## modus_bbB: 50 kg

Berikut adalah Penyebaran data berat badan kelas A

range_bbA <- range(bb_A)
cat("range_bbA:", range_bbA, "\n")
## range_bbA: 50 80
var_bbA <- var(bb_A)
cat("var_bbA:", var_bbA, "\n")
## var_bbA: 106.6222
sd_bbA <- sd(bb_A)
cat("sd_bbA:", sd_bbA, "\n")
## sd_bbA: 10.3258

Berikut adalah penyebaran data berat badan kelas B

range_bbB <- range(bb_B)
cat("range_bbB:", range_bbB, "\n")
## range_bbB: 50 70
var_bbB <- var(bb_B)
cat("var_bbB:", var_bbB, "\n")
## var_bbB: 31.73333
sd_bbB <- sd(bb_B)
cat("sd_bbB:", sd_bbB, "\n")
## sd_bbB: 5.633235

Kemudian untuk memudahkan dalam membandingkan pemusatan dan penyebaran data berat badan kelas A dan B, saya membuat data frame sebagai berikut.

penyebaran_pemusatan_bb <- data.frame(
  Kelas = c("Kelas A", "Kelas B"),
  Mean = c(mean(bb_A), mean(bb_B)),
  Median = c(median(bb_A), median(bb_B)),
  Modus = c(modus(bb_A), median(bb_B)),
  Rentang = c(max(bb_A) - min(bb_A), max(bb_B) - min(bb_B)),
  Variansi = c(var(bb_A), var(bb_B)),
  Simpangan_Baku = c(sd(bb_A), sd(bb_B))
)
penyebaran_pemusatan_bb
##     Kelas Mean Median Modus Rentang  Variansi Simpangan_Baku
## 1 Kelas A 61.8     59    55      30 106.62222      10.325804
## 2 Kelas B 56.8     56    56      20  31.73333       5.633235

b) Sertakan visualisasi data yang sesuai (misalnya, boxplot atau histogram) untuk menampilkan perbandingan perbedaan berat badan antara kedua kelas tersebut secara jelas.

untuk memudahkan dalam melihat perbandingan saya menggunakan histogram. Berikut adalah histogram berat badan kelas A

hist(Kelas_A$bb_A, col = "skyblue",
     main= "Histogram Berat Badan Mahasiswa Kelas A",
     xlab = "Berat Badan (kg)")

Berikut adalah histogram berat badan kelas B

hist(Kelas_B$bb_B, col = "pink",
     main= "Histogram Berat Badan Mahasiswa Kelas B",
     xlab = "Berat Badan (kg)")

c) Berikanlah penjelasan dari hasil analasis yang ditemukan. (minimal 3 kalimat)

Dari hasil perhitungan, rata-rata berat badan siswa di Kelas A tercatat lebih tinggi dibandingkan Kelas B, yaitu 61,8 kg berbanding 56,8 kg. Meski begitu, Kelas A juga menunjukkan rentang, variansi, serta simpangan baku yang lebih besar, yang menandakan perbedaan berat badan antar siswa di kelas ini cukup lebar. Sebaliknya, Kelas B memiliki nilai variansi dan simpangan baku yang lebih kecil, sehingga berat badan siswanya cenderung lebih merata.

2. Analisis dan Perbandingan Tinggi Badan Mahasiswa Kelas A dan Kelas B

a) Bandingkan ukuran pemusatan data (rata-rata, median, modus) dan ukuran penyebaran data (rentang, variansi, simpangan baku) untuk tinggi badan mahasiswa Kelas A dan Kelas B.

Berikut adalah pemusatan data tinggi badan kelas A

mean_tbA <- mean(tb_A)
cat("mean_tbA:", mean_tbA, "cm", "\n")
## mean_tbA: 167.7 cm
median_tbA <- median(tb_A)
cat("median_tbA:", median_tbA, "cm", "\n")
## median_tbA: 163.5 cm
modus_tbA <- modus(tb_A)
cat("modus_tbA:", modus_tbA, "cm", "\n")
## modus_tbA: 160 cm

Berikut adalah pemusatan data tinggi badan kelas B

mean_tbB <- mean(tb_B)
cat("mean_tbB:", mean_tbB, "cm", "\n")
## mean_tbB: 157.5 cm
median_tbB <- median(tb_B)
cat("median_tbB:", median_tbB, "cm", "\n")
## median_tbB: 160 cm
modus_tbB <- modus(tb_B)
cat("modus_tbB:", modus_tbB, "cm", "\n")
## modus_tbB: 160 cm

Kemudian untuk memudahkan dalam membandingkan pemusatan dan penyebaran data tinggi badan kelas A dan B, saya membuat data frame sebagai berikut.

penyebaran_pemusatan_tb <- data.frame(
  Kelas = c("Kelas A", "Kelas B"),
  Mean = c(mean(tb_A), mean(tb_B)),
  Median = c(median(tb_A), median(tb_B)),
  Modus = c(modus(tb_A), median(tb_B)),
  Rentang = c(max(tb_A) - min(tb_A), max(tb_B) - min(tb_B)),
  Variansi = c(var(tb_A), var(tb_B)),
  Simpangan_Baku = c(sd(tb_A), sd(tb_B))
)
penyebaran_pemusatan_tb
##     Kelas  Mean Median Modus Rentang Variansi Simpangan_Baku
## 1 Kelas A 167.7  163.5   160      30 115.5667      10.750194
## 2 Kelas B 157.5  160.0   160      29  96.5000       9.823441

b) Sertakan visualisasi data yang sesuai (misalnya, boxplot atau histogram) untuk menampilkan perbandingan perbedaan tinggi badan antara kedua kelas tersebut secara jelas.

untuk memudahkan dalam melihat perbandingan saya menggunakan histogram. Berikut adalah histogram tinggi badan kelas A

hist(Kelas_A$tb_A, col = "green",
     main= "Histogram Tinggi Badan Mahasiswa Kelas A",
     xlab = "Tinggi Badan (cm)")

Berikut adalah histogram tinggi badan kelas B

hist(Kelas_B$tb_B, col = "yellow",
     main= "Histogram Tinggi Badan Mahasiswa Kelas B",
     xlab = "Tinggi Badan (cm)")

c) Berikanlah penjelasan dari hasil analasis yang ditemukan. (minimal 3 kalimat)

Dari hasil analisis, rata-rata tinggi badan siswa Kelas A mencapai 167,7 cm, lebih tinggi dibandingkan Kelas B yang rata-ratanya 157,5 cm. Nilai rentang, variansi, dan simpangan baku di Kelas A sedikit lebih besar, menandakan bahwa perbedaan tinggi badan antar siswanya lebih bervariasi. Di sisi lain, Kelas B menunjukkan sebaran tinggi badan yang lebih seragam, meskipun nilai median tingginya sedikit melampaui Kelas A.

Berikut adalah hasil analisis saya

TERIMAKASIH :)