install.packages(“dplyr”)

Analisis dan Perbandingan Berat Badan dan Tinggi Badan Mahasiswa Kelas A dan Kelas B

Mahasiswa program studi Statistika terbagi menjadi 2 kelas, yaitu kelas A dan kelas B. Masing-masing kelas terdapat 10 mahasiswa yang mana memiliki tinggi dan berat badan yang beragam, untuk itu dilakukan perbandingan berat dan tinggi badan Mahasiswa kelas A dan kelas B. Setelah mengumpulkan data, maka didapatkan data

 library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#data kelas A

#nama mahasiswa
nama_kelas_A <- c("Ardi", "Cahyo", "Yogi", "Danu", "Fitri", "Dimas", "Fizi", "Udin", "Bayu", "Jihan")

#berat badan mahasiswa
bb_A <- c(82,70,50,62,50,65,62,50,80,75)

#tinggi badan mahasiswa
tb_A <- c(180,168,165,170,160,170,165,167,172,165)

#data berat dan tinggi badan mahasiswa
kelas_A <- data.frame(nama_kelas_A, bb_A, tb_A)
print(kelas_A)
##    nama_kelas_A bb_A tb_A
## 1          Ardi   82  180
## 2         Cahyo   70  168
## 3          Yogi   50  165
## 4          Danu   62  170
## 5         Fitri   50  160
## 6         Dimas   65  170
## 7          Fizi   62  165
## 8          Udin   50  167
## 9          Bayu   80  172
## 10        Jihan   75  165
#data kelas B

#nama mahasiswa
nama_kelas_B <- c("Nilam", "Nurdin", "Restu", "Putri", "Geo", "Cristy", "Alim", "Bagus", "Dwifa", "Nayla")

#berat badan mahasiswa
bb_B <- c(60, 65, 62, 70, 75, 68, 65, 50, 52, 58)

#tinggi badan mahasiswa
tb_B <- c(158, 165, 162, 172, 175, 165, 155, 150, 160,160)

#data berat dan tinggi badan mahasiswa
kelas_B <- data.frame(nama_kelas_B, bb_B, tb_B)
print(kelas_B)
##    nama_kelas_B bb_B tb_B
## 1         Nilam   60  158
## 2        Nurdin   65  165
## 3         Restu   62  162
## 4         Putri   70  172
## 5           Geo   75  175
## 6        Cristy   68  165
## 7          Alim   65  155
## 8         Bagus   50  150
## 9         Dwifa   52  160
## 10        Nayla   58  160

Perbandingan berat badan mahasiswa kelas A dan B

Setelah mendapatkan data seperti yang ditampilkan diatas, selanjutkan dapat dilakukan beberapa hal untuk membandingkan berat badan mahasiswa kelas A dan B

Menghitung Ukuran Pemusatan Data

Tiga ukuran pemusatan data yang umum adalah mean (rata-rata), median (nilai tengah), dan modus (nilai yang paling sering muncul). Ukuran pemusatan data ini juga sering disebut sebagai nilai yang mewakili kumpulan suatu data.

## rata-rata berat badan mahasiswa Statistika kelas A adalah  64.6 kg
## rata-rata berat badan mahasiswa Statistika kelas B adalah  62.5 kg

Dapat kita lihat bersama bahwa mahasiswa kelas A memiliki rata-rata berat badan lebih berat dibandingkan mahasiswa kelas B.

# Median 

median_bb_A <- median(bb_A)
cat("median berat badan mahasiswa Statistika kelas A adalah ", median_bb_A, "kg", "\n")
## median berat badan mahasiswa Statistika kelas A adalah  63.5 kg
median_bb_B <- median(bb_B)
cat("median berat badan mahasiswa Statistika kelas B adalah ", median_bb_B, "kg", "\n")
## median berat badan mahasiswa Statistika kelas B adalah  63.5 kg

Dapat kita lihat ternyata nilai tengah dari berat badan kelas A & B itu sama.

# modus

modus <- function(x){
  ux <- unique(x)
  ux[which.max(tabulate(match(x,ux)))]
}

modus_bb_A <- modus(bb_A)
cat("modus berat badan mahasiswa Statistika kelas A adalah ", modus_bb_A, "kg", "\n")
## modus berat badan mahasiswa Statistika kelas A adalah  50 kg
modus_bb_B <- modus(bb_B)
cat("modus berat badan mahasiswa Statistika kelas B adalah ", modus_bb_B, "kg", "\n")
## modus berat badan mahasiswa Statistika kelas B adalah  65 kg

Modus berat badan mahasiswa kelas B lebih besar dari pada kelas A.

Menghitung Penyebaran Data

Ukuran penyebaran data bisa disebut sebagai nilai statistik yang menggambarkan seberapa jauh data tersebar dari nilai pusatnya. Ada beberapa ukuran penyebaran data yang umum digunakan adalah range (rentang), variance (variansi/ragam), dan standard deviation (simpangan baku).

# Menghitung range

range_bb_A <- range(bb_A)
cat("range berat badan mahasiswa Statistika kelas A adalah ", range_bb_A, "\n")
## range berat badan mahasiswa Statistika kelas A adalah  50 82
range_bb_B <- range(bb_B)
cat("range berat badan mahasiswa Statistika kelas B adalah ", range_bb_B, "\n")
## range berat badan mahasiswa Statistika kelas B adalah  50 75

Dapat kita lihat bersama bahwa range atau rentang pada data berat badan kelas B lebih kecil dibanding kelas A yang berarti bahwa data kelas B lebih homogen.

# Menghitung variansi

var_bb_A <- var(bb_A)
cat("variasi berat badan mahasiswa Statistika kelas A adalah ", var_bb_A, "\n")
## variasi berat badan mahasiswa Statistika kelas A adalah  147.8222
var_bb_B <- var(bb_B)
cat("variasi berat badan mahasiswa Statistika kelas B adalah ", var_bb_B, "\n")
## variasi berat badan mahasiswa Statistika kelas B adalah  60.94444

Variansi data kelas B lebih kecil dibanding data kelas A yang berarti bahwa data kelas B lebih homogen atau konsisten dibanding kelas A.

# Menghitung standar deviation

sd_bb_A <- sd(bb_A)
cat("simpangan baku berat badan mahasiswa Statistika kelas A adalah ", sd_bb_A, "\n")
## simpangan baku berat badan mahasiswa Statistika kelas A adalah  12.15822
sd_bb_B <- sd(bb_B)
cat("simpangan baku berat badan mahasiswa Statistika kelas B adalah ", sd_bb_B, "\n")
## simpangan baku berat badan mahasiswa Statistika kelas B adalah  7.806692

Dapat dilihat bahwa data kelas B lebih seragam dibandingkan data kelas A karena simpangan baku berat badan kelas B lebih kecil dibandingkan kelas A.

visualisasi Data

# membuat histogram berat badan

hist(kelas_A$bb_A, col = "blue",
main= "Histogram Berat Badan Mahasiswa Kelas A",
xlab = "Berat Badan (kg)")

# membuat histogram berat badan

hist(kelas_B$bb_B, col = "red",
main= "Histogram Berat Badan Mahasiswa Kelas B",
xlab = "Berat Badan (kg)")

Perbandingan tinggi badan mahasiswa kelas A dan B

Setelah mendapatkan data seperti yang ditampilkan diatas, selanjutkan dapat dilakukan beberapa hal untuk membandingkan berat badan mahasiswa kelas A dan B

Menghitung Ukuran Pemusatan Data

Tiga ukuran pemusatan data yang umum adalah mean (rata-rata), median (nilai tengah), dan modus (nilai yang paling sering muncul). Ukuran pemusatan data ini juga sering disebut sebagai nilai yang mewakili kumpulan suatu data.

## rata-rata tinggi badan mahasiswa Statistika kelas A adalah  168.2 cm
## rata-rata tinggi badan mahasiswa Statistika kelas B adalah  162.2 cm

Dapat kita lihat bersama bahwa mahasiswa kelas A memiliki rata-rata tinggi badan lebih tinggi dibandingkan mahasiswa kelas B.

# Median 

median_tb_A <- median(tb_A)
cat("median tinggi badan mahasiswa Statistika kelas A adalah ", median_tb_A, "cm", "\n")
## median tinggi badan mahasiswa Statistika kelas A adalah  167.5 cm
median_tb_B <- median(tb_B)
cat("median tinggi badan mahasiswa Statistika kelas B adalah ", median_tb_B, "cm", "\n")
## median tinggi badan mahasiswa Statistika kelas B adalah  161 cm

Dapat kita lihat ternyata nilai tengah dari tinggi badan kelas A lebih tinggi dari kelas B.

# modus

modus <- function(x){
  ux <- unique(x)
  ux[which.max(tabulate(match(x,ux)))]
}

modus_tb_A <- modus(tb_A)
cat("modus tinggi badan mahasiswa Statistika kelas A adalah ", modus_tb_A, "cm", "\n")
## modus tinggi badan mahasiswa Statistika kelas A adalah  165 cm
modus_tb_B <- modus(tb_B)
cat("modus tinggi badan mahasiswa Statistika kelas B adalah ", modus_tb_B, "cm", "\n")
## modus tinggi badan mahasiswa Statistika kelas B adalah  165 cm

Modus tinggi badan mahasiswa kelas B sama dengan kelas A yang juga bisa diasumsikan bahwa banyak mahasiswa kelas A dan B memiliki tinggi badan yang sama.

Menghitung Penyebaran Data

Ukuran penyebaran data bisa disebut sebagai nilai statistik yang menggambarkan seberapa jauh data tersebar dari nilai pusatnya. Ada beberapa ukuran penyebaran data yang umum digunakan adalah range (rentang), variance (variansi/ragam), dan standard deviation (simpangan baku).

# Menghitung range

range_tb_A <- range(tb_A)
cat("range tinggi badan mahasiswa Statistika kelas A adalah ", range_tb_A, "\n")
## range tinggi badan mahasiswa Statistika kelas A adalah  160 180
range_tb_B <- range(tb_B)
cat("range tinggi badan mahasiswa Statistika kelas B adalah ", range_tb_B, "\n")
## range tinggi badan mahasiswa Statistika kelas B adalah  150 175

Dapat kita lihat bersama bahwa range atau rentang pada data tinggi badan kelas A lebih kecil dibanding kelas B yang berarti bahwa data kelas A lebih homogen.

# Menghitung variansi

var_tb_A <- var(tb_A)
cat("variasi tinggi badan mahasiswa Statistika kelas A adalah ", var_tb_A, "\n")
## variasi tinggi badan mahasiswa Statistika kelas A adalah  28.84444
var_tb_B <- var(tb_B)
cat("variasi tinggi badan mahasiswa Statistika kelas B adalah ", var_tb_B, "\n")
## variasi tinggi badan mahasiswa Statistika kelas B adalah  55.95556

Variansi data kelas A lebih kecil dibanding data kelas B yang berarti bahwa data kelas A lebih homogen atau konsisten dibanding kelas B. dapat juga dikatakan bahwa tinggi mahasiswa kelas A satu dengan yang lain tidak jauh perbedaanya.

# Menghitung standar deviation

sd_tb_A <- sd(tb_A)
cat("simpangan baku tinggi badan mahasiswa Statistika kelas A adalah ", sd_tb_A, "\n")
## simpangan baku tinggi badan mahasiswa Statistika kelas A adalah  5.370702
sd_tb_B <- sd(tb_B)
cat("simpangan baku tinggi badan mahasiswa Statistika kelas B adalah ", sd_tb_B, "\n")
## simpangan baku tinggi badan mahasiswa Statistika kelas B adalah  7.480345

Dapat dilihat bahwa data kelas A lebih seragam dibandingkan data kelas B karena simpangan baku berat badan kelas A lebih kecil dibandingkan kelas B.

visualisasi Data

# membuat histogram tinggi badan

hist(kelas_A$tb_A, col = "pink",
main= "Histogram tinggi Badan Mahasiswa Kelas A",
xlab = "Tinggi Badan (cm)")

# membuat histogram tinggi badan

hist(kelas_B$tb_B, col = "purple",
main= "Histogram Tinggi Badan Mahasiswa Kelas B",
xlab = "Tinggi Badan (cm)")

Dari 2 histogram diatas dapat dilihat bahwa data kelas A lebih stabil dibanding kelas B. Persebaran data pada kelas A juga relatif rata dibandingkan data B. Ada hal yang cukup menarik yakni mahasiswa kelas A memiliki tinggi badan yang relatif lebih rata tidak terlalu jauh perbedaanya namun memiliki berat badan yang justru beragam. Sebaliknya kelas B memiliki tinggi badan yang lebih beragam dibanding kelas A namun relarif lebih rata atau sama berat badannya dibanding kelas A.