install.packages(“dplyr”)
Mahasiswa program studi Statistika terbagi menjadi 2 kelas, yaitu kelas A dan kelas B. Masing-masing kelas terdapat 10 mahasiswa yang mana memiliki tinggi dan berat badan yang beragam, untuk itu dilakukan perbandingan berat dan tinggi badan Mahasiswa kelas A dan kelas B. Setelah mengumpulkan data, maka didapatkan data
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#data kelas A
#nama mahasiswa
nama_kelas_A <- c("Ardi", "Cahyo", "Yogi", "Danu", "Fitri", "Dimas", "Fizi", "Udin", "Bayu", "Jihan")
#berat badan mahasiswa
bb_A <- c(82,70,50,62,50,65,62,50,80,75)
#tinggi badan mahasiswa
tb_A <- c(180,168,165,170,160,170,165,167,172,165)
#data berat dan tinggi badan mahasiswa
kelas_A <- data.frame(nama_kelas_A, bb_A, tb_A)
print(kelas_A)
## nama_kelas_A bb_A tb_A
## 1 Ardi 82 180
## 2 Cahyo 70 168
## 3 Yogi 50 165
## 4 Danu 62 170
## 5 Fitri 50 160
## 6 Dimas 65 170
## 7 Fizi 62 165
## 8 Udin 50 167
## 9 Bayu 80 172
## 10 Jihan 75 165
#data kelas B
#nama mahasiswa
nama_kelas_B <- c("Nilam", "Nurdin", "Restu", "Putri", "Geo", "Cristy", "Alim", "Bagus", "Dwifa", "Nayla")
#berat badan mahasiswa
bb_B <- c(60, 65, 62, 70, 75, 68, 65, 50, 52, 58)
#tinggi badan mahasiswa
tb_B <- c(158, 165, 162, 172, 175, 165, 155, 150, 160,160)
#data berat dan tinggi badan mahasiswa
kelas_B <- data.frame(nama_kelas_B, bb_B, tb_B)
print(kelas_B)
## nama_kelas_B bb_B tb_B
## 1 Nilam 60 158
## 2 Nurdin 65 165
## 3 Restu 62 162
## 4 Putri 70 172
## 5 Geo 75 175
## 6 Cristy 68 165
## 7 Alim 65 155
## 8 Bagus 50 150
## 9 Dwifa 52 160
## 10 Nayla 58 160
Setelah mendapatkan data seperti yang ditampilkan diatas, selanjutkan dapat dilakukan beberapa hal untuk membandingkan berat badan mahasiswa kelas A dan B
Tiga ukuran pemusatan data yang umum adalah mean (rata-rata), median (nilai tengah), dan modus (nilai yang paling sering muncul). Ukuran pemusatan data ini juga sering disebut sebagai nilai yang mewakili kumpulan suatu data.
## rata-rata berat badan mahasiswa Statistika kelas A adalah 64.6 kg
## rata-rata berat badan mahasiswa Statistika kelas B adalah 62.5 kg
Dapat kita lihat bersama bahwa mahasiswa kelas A memiliki rata-rata berat badan lebih berat dibandingkan mahasiswa kelas B.
# Median
median_bb_A <- median(bb_A)
cat("median berat badan mahasiswa Statistika kelas A adalah ", median_bb_A, "kg", "\n")
## median berat badan mahasiswa Statistika kelas A adalah 63.5 kg
median_bb_B <- median(bb_B)
cat("median berat badan mahasiswa Statistika kelas B adalah ", median_bb_B, "kg", "\n")
## median berat badan mahasiswa Statistika kelas B adalah 63.5 kg
Dapat kita lihat ternyata nilai tengah dari berat badan kelas A & B itu sama.
# modus
modus <- function(x){
ux <- unique(x)
ux[which.max(tabulate(match(x,ux)))]
}
modus_bb_A <- modus(bb_A)
cat("modus berat badan mahasiswa Statistika kelas A adalah ", modus_bb_A, "kg", "\n")
## modus berat badan mahasiswa Statistika kelas A adalah 50 kg
modus_bb_B <- modus(bb_B)
cat("modus berat badan mahasiswa Statistika kelas B adalah ", modus_bb_B, "kg", "\n")
## modus berat badan mahasiswa Statistika kelas B adalah 65 kg
Modus berat badan mahasiswa kelas B lebih besar dari pada kelas A.
Ukuran penyebaran data bisa disebut sebagai nilai statistik yang menggambarkan seberapa jauh data tersebar dari nilai pusatnya. Ada beberapa ukuran penyebaran data yang umum digunakan adalah range (rentang), variance (variansi/ragam), dan standard deviation (simpangan baku).
# Menghitung range
range_bb_A <- range(bb_A)
cat("range berat badan mahasiswa Statistika kelas A adalah ", range_bb_A, "\n")
## range berat badan mahasiswa Statistika kelas A adalah 50 82
range_bb_B <- range(bb_B)
cat("range berat badan mahasiswa Statistika kelas B adalah ", range_bb_B, "\n")
## range berat badan mahasiswa Statistika kelas B adalah 50 75
Dapat kita lihat bersama bahwa range atau rentang pada data berat badan kelas B lebih kecil dibanding kelas A yang berarti bahwa data kelas B lebih homogen.
# Menghitung variansi
var_bb_A <- var(bb_A)
cat("variasi berat badan mahasiswa Statistika kelas A adalah ", var_bb_A, "\n")
## variasi berat badan mahasiswa Statistika kelas A adalah 147.8222
var_bb_B <- var(bb_B)
cat("variasi berat badan mahasiswa Statistika kelas B adalah ", var_bb_B, "\n")
## variasi berat badan mahasiswa Statistika kelas B adalah 60.94444
Variansi data kelas B lebih kecil dibanding data kelas A yang berarti bahwa data kelas B lebih homogen atau konsisten dibanding kelas A.
# Menghitung standar deviation
sd_bb_A <- sd(bb_A)
cat("simpangan baku berat badan mahasiswa Statistika kelas A adalah ", sd_bb_A, "\n")
## simpangan baku berat badan mahasiswa Statistika kelas A adalah 12.15822
sd_bb_B <- sd(bb_B)
cat("simpangan baku berat badan mahasiswa Statistika kelas B adalah ", sd_bb_B, "\n")
## simpangan baku berat badan mahasiswa Statistika kelas B adalah 7.806692
Dapat dilihat bahwa data kelas B lebih seragam dibandingkan data kelas A karena simpangan baku berat badan kelas B lebih kecil dibandingkan kelas A.
# membuat histogram berat badan
hist(kelas_A$bb_A, col = "blue",
main= "Histogram Berat Badan Mahasiswa Kelas A",
xlab = "Berat Badan (kg)")
# membuat histogram berat badan
hist(kelas_B$bb_B, col = "red",
main= "Histogram Berat Badan Mahasiswa Kelas B",
xlab = "Berat Badan (kg)")
Setelah mendapatkan data seperti yang ditampilkan diatas, selanjutkan dapat dilakukan beberapa hal untuk membandingkan berat badan mahasiswa kelas A dan B
Tiga ukuran pemusatan data yang umum adalah mean (rata-rata), median (nilai tengah), dan modus (nilai yang paling sering muncul). Ukuran pemusatan data ini juga sering disebut sebagai nilai yang mewakili kumpulan suatu data.
## rata-rata tinggi badan mahasiswa Statistika kelas A adalah 168.2 cm
## rata-rata tinggi badan mahasiswa Statistika kelas B adalah 162.2 cm
Dapat kita lihat bersama bahwa mahasiswa kelas A memiliki rata-rata tinggi badan lebih tinggi dibandingkan mahasiswa kelas B.
# Median
median_tb_A <- median(tb_A)
cat("median tinggi badan mahasiswa Statistika kelas A adalah ", median_tb_A, "cm", "\n")
## median tinggi badan mahasiswa Statistika kelas A adalah 167.5 cm
median_tb_B <- median(tb_B)
cat("median tinggi badan mahasiswa Statistika kelas B adalah ", median_tb_B, "cm", "\n")
## median tinggi badan mahasiswa Statistika kelas B adalah 161 cm
Dapat kita lihat ternyata nilai tengah dari tinggi badan kelas A lebih tinggi dari kelas B.
# modus
modus <- function(x){
ux <- unique(x)
ux[which.max(tabulate(match(x,ux)))]
}
modus_tb_A <- modus(tb_A)
cat("modus tinggi badan mahasiswa Statistika kelas A adalah ", modus_tb_A, "cm", "\n")
## modus tinggi badan mahasiswa Statistika kelas A adalah 165 cm
modus_tb_B <- modus(tb_B)
cat("modus tinggi badan mahasiswa Statistika kelas B adalah ", modus_tb_B, "cm", "\n")
## modus tinggi badan mahasiswa Statistika kelas B adalah 165 cm
Modus tinggi badan mahasiswa kelas B sama dengan kelas A yang juga bisa diasumsikan bahwa banyak mahasiswa kelas A dan B memiliki tinggi badan yang sama.
Ukuran penyebaran data bisa disebut sebagai nilai statistik yang menggambarkan seberapa jauh data tersebar dari nilai pusatnya. Ada beberapa ukuran penyebaran data yang umum digunakan adalah range (rentang), variance (variansi/ragam), dan standard deviation (simpangan baku).
# Menghitung range
range_tb_A <- range(tb_A)
cat("range tinggi badan mahasiswa Statistika kelas A adalah ", range_tb_A, "\n")
## range tinggi badan mahasiswa Statistika kelas A adalah 160 180
range_tb_B <- range(tb_B)
cat("range tinggi badan mahasiswa Statistika kelas B adalah ", range_tb_B, "\n")
## range tinggi badan mahasiswa Statistika kelas B adalah 150 175
Dapat kita lihat bersama bahwa range atau rentang pada data tinggi badan kelas A lebih kecil dibanding kelas B yang berarti bahwa data kelas A lebih homogen.
# Menghitung variansi
var_tb_A <- var(tb_A)
cat("variasi tinggi badan mahasiswa Statistika kelas A adalah ", var_tb_A, "\n")
## variasi tinggi badan mahasiswa Statistika kelas A adalah 28.84444
var_tb_B <- var(tb_B)
cat("variasi tinggi badan mahasiswa Statistika kelas B adalah ", var_tb_B, "\n")
## variasi tinggi badan mahasiswa Statistika kelas B adalah 55.95556
Variansi data kelas A lebih kecil dibanding data kelas B yang berarti bahwa data kelas A lebih homogen atau konsisten dibanding kelas B. dapat juga dikatakan bahwa tinggi mahasiswa kelas A satu dengan yang lain tidak jauh perbedaanya.
# Menghitung standar deviation
sd_tb_A <- sd(tb_A)
cat("simpangan baku tinggi badan mahasiswa Statistika kelas A adalah ", sd_tb_A, "\n")
## simpangan baku tinggi badan mahasiswa Statistika kelas A adalah 5.370702
sd_tb_B <- sd(tb_B)
cat("simpangan baku tinggi badan mahasiswa Statistika kelas B adalah ", sd_tb_B, "\n")
## simpangan baku tinggi badan mahasiswa Statistika kelas B adalah 7.480345
Dapat dilihat bahwa data kelas A lebih seragam dibandingkan data kelas B karena simpangan baku berat badan kelas A lebih kecil dibandingkan kelas B.
# membuat histogram tinggi badan
hist(kelas_A$tb_A, col = "pink",
main= "Histogram tinggi Badan Mahasiswa Kelas A",
xlab = "Tinggi Badan (cm)")
# membuat histogram tinggi badan
hist(kelas_B$tb_B, col = "purple",
main= "Histogram Tinggi Badan Mahasiswa Kelas B",
xlab = "Tinggi Badan (cm)")
Dari 2 histogram diatas dapat dilihat bahwa data kelas A lebih stabil
dibanding kelas B. Persebaran data pada kelas A juga relatif rata
dibandingkan data B. Ada hal yang cukup menarik yakni mahasiswa kelas A
memiliki tinggi badan yang relatif lebih rata tidak terlalu jauh
perbedaanya namun memiliki berat badan yang justru beragam. Sebaliknya
kelas B memiliki tinggi badan yang lebih beragam dibanding kelas A namun
relarif lebih rata atau sama berat badannya dibanding kelas A.