Berikut Cara menginstal Paket

# install.packages("dplyr") 
library(dplyr) # memanggil paket dplyr
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Persiapkan Data

Sebelum kita mulai menganalisis data, langkah pertama yang harus dilakukan adalah menyiapkan datanya terlebih dahulu. Pada sesi ini, kita membuat data sendiri yang berisi nama, berat badan, tinggi badan dari 10 mahasiswa kelas A dan 10 mahasiswa kelas B. Data ini disimpan dalam tabel menggunakan fungsi data.frame sebagai berikut:

# Data Kelas A
# Nama mahasiswa 
nama_A <- c("Ani", "Budi", "Cahaya", "Danu", "Eka", "Fitri", "Gilang", "Hani", "Indra","Jihan")

#Berat badan mahasiswa 
bb_A <-c(55, 65, 50, 70, 60, 58, 75, 52, 80, 53)

#Tinggi badan mahasiswa 
tb_A <- c(160, 175, 155, 180, 165, 162, 178, 158, 185, 159)

# Data berat dan tinggi badan Mahasiswa
kelas_A <- data.frame(nama_A, bb_A, tb_A)

#Data Kelas B
#Nama mahasiswa 
nama_B <- c("Alya", "Bintang", "Rizki", "Ana", "Nanda", "Dimas", "Ali", "Agus", "Dwi" , "Putri")

#Berat badan mahasiswa
bb_B <- c(50, 55, 53, 60, 58, 70, 52, 57, 59, 54)

#Tinggi badan mahasiswa
tb_B <- c(145, 160, 172, 155, 160, 170, 148, 162, 160, 143 )

# Data berat dan tinggi badan mahsiswa 
kelas_B <- data.frame(nama_B, bb_B, tb_B)

#Membaca data kelas A dan B
kelas_A
##    nama_A bb_A tb_A
## 1     Ani   55  160
## 2    Budi   65  175
## 3  Cahaya   50  155
## 4    Danu   70  180
## 5     Eka   60  165
## 6   Fitri   58  162
## 7  Gilang   75  178
## 8    Hani   52  158
## 9   Indra   80  185
## 10  Jihan   53  159
kelas_B
##     nama_B bb_B tb_B
## 1     Alya   50  145
## 2  Bintang   55  160
## 3    Rizki   53  172
## 4      Ana   60  155
## 5    Nanda   58  160
## 6    Dimas   70  170
## 7      Ali   52  148
## 8     Agus   57  162
## 9      Dwi   59  160
## 10   Putri   54  143

1. Menganalisis berat badan mahasiswa kelas A dan B

Menghitung Ukuran Pemusatan Data

Ukuran pemusatan data digunakan untuk melihat nilai yang mewakili sekumpulan data. Pada analisis ini, kita menghitung rata-rata, median dan modus berat badan mahasiswa kelas A dan kelas B. perhitungan ini untuk membandingkan kondisi umum kedua kelas tersebut, sehingga dapat terlihat kelas mana yang cenderung memiliki berat badan yang lebih besar.

# Mean Kelas A
mean_bbA <- mean(bb_A)
cat("mean_bbA", mean_bbA, "kg", "\n")
## mean_bbA 61.8 kg
# Mean Kelas B
mean_bbB <- mean(bb_B)
cat("mean_bbB", mean_bbB, "kg", "\n")
## mean_bbB 56.8 kg
# Median Kelas A
median_bbA <- median(bb_A)
cat ("median_bbA", median_bbA, "kg", "\n")
## median_bbA 59 kg
# Median Kelas B
median_bbB <- median(bb_B)
cat ("median_bbB", median_bbB, "kg", "\n")
## median_bbB 56 kg
# Modus (gunakan Fungsi custom)
modus <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}
# Modus Kelas A
modus_bbA <- modus(bb_A)
cat("modus_bbA", modus_bbA, "kg", "\n")
## modus_bbA 55 kg
# Modus Kelas B
modus_bbB <- modus(bb_B)
cat("modus_bbB", modus_bbB, "kg", "\n")
## modus_bbB 50 kg

Menghitung Penyebaran Data

Ukuran Penyebaran data digunakan untuk membantu kita mengetahui seberapa besar variasi ataupun perbedaan antar nilai dalam sekumpulan data. Pada analisis ini, Kita menghitung range (rentang), variance(variansi), dan standard deviation (simpangan baku) berat badan mahasiswa kelas A dan B, yang mana hasilnya nnti akan menunjukkan seberapa lebar sebaran data di masing-masing kelas dan membantu melihat apakah data antar kelas cenderung homogen atau bervariasi.

# Menghitung range (rentang) Kelas A
range_bbA <- range(bb_A)
cat("range_bbA", range_bbA, "\n")
## range_bbA 50 80
# Menghitung range (rentang) Kelas B
range_bbB <- range(bb_B)
cat("range_bbB", range_bbB, "\n")
## range_bbB 50 70
# Menghitung variansi (keragaman) Kelas A
var_bbA <- var(bb_A)
cat("var_bbA", var_bbA, "\n")
## var_bbA 106.6222
# Menghitung variansi (keragaman) Kelas B
var_bbB <- var(bb_B)
cat("var_bbB", var_bbB, "\n")
## var_bbB 31.73333
#Menghitung standar deviation (simpangan baku) Kelas A
sd_bbA <- sd(bb_A)
cat("sd_bbA", sd_bbA, "\n")
## sd_bbA 10.3258
#Menghitung standar deviation (simpangan baku) Kelas B
sd_bbB <- sd(bb_B)
cat("sd_bbB", sd_bbB, "\n")
## sd_bbB 5.633235

Visualisasi Data

visualisasi Data digunakan untuk memudahkan kita memahami perbedaan dan pola dalam data secara cepat. Pada analisis ini, kita menggunakan histogram dan boxplot untuk menampilkan distribusi, nilai tengah, dan sebaran berat badan mahasiswa kelas A dan B. Dengan menggunakan grafik ini, Perbedaan antar kelas dapat terlihat lebih jelas dan lebih mudah dipahami di bandingkan hanya dengan melihat angka saja.

# Membuat histogram berat badan mahasiswa kelas A
hist(kelas_A$bb_A, col = "skyblue",
     main = "Histogram Berat Badan Mahasiswa  Kelas A",
     xlab = "Berat Badan (kg)")

# Membuat histogram berat badan mahasiswa kelas B
hist(kelas_B$bb_B, col = "pink",
     main = "Histogram Berat Badan Mahasiswa  Kelas B",
     xlab = "Berat Badan (kg)")

# Membuat boxplot berat badan Mahasiswa kelas A
boxplot(kelas_A$bb_A, horizontal = TRUE,
        main = "Boxplot Berat Badan Mahasiswa Kelas A",
        col = "coral")

# Membuat boxplot berat badan Mahasiswa kelas B
boxplot(kelas_B$bb_B, horizontal = TRUE,
        main = "Boxplot Berat Badan Mahasiswa Kelas B",
        col = "red")

Interpretasi

Berdasarkan hasil analisis, mahasiswa kelas A memiliki rata-rata berat badan sebesar 61.8 kg, sedangkan mahasiswa kelas B sebesar 56.8 kg. Hal ini menunjukkan bahwa secara umum mahasiswa kelas A cenderung memiliki berat badan yang lebih tinggi. Nilai median pada kelas A adalah 59 kg, lebih besar di bandingkan median kelas B sebesar 56 k, sehingga perbedaan ini tidak hanya diseabkan oleh beberapa nilai ekstrem, tetapi juga mencerminkan kondisi umum seluruh mahasiswa.Nilai modus kelas A adalah 55 kg, sedangkan pada kelas B adalah 50 kg, yang artinya kelompok berat badan yang paling sering muncul di kelas A berada pada tingkat yang lebih tinggi. Dari segi penyebaran datanya, kelas A memiliki rentang berat badan sebesar 30 kg (50-80 kg), lebih lebar dibandingkan kelas B yang hanya 20 kg (50-70 kg). Variansi kelas A adalah 106.6222 dengan standar deviasi 10.3258, sedangkan kelas B memiliki variansi 31.73333 dan standar deviasi 5.633235. Maka dengan angka-angka ini menunjukkan bahwa kelas A memiliki perbedaan berat badan antar mahasiswa yang lebih bervariasi, sementara kelas B cenderung lebih homogen. Visualisasi data dalam bentuk histogram memperlihatkan bahwa meskipun kedua kelas memilki puncak frekuensi di rentang yang sama yaitu 50-55 kg, tetapi kelas A memiliki distribusi yang menyebar hingga 80 kg, sedangkan kelas B lebih berfokus di rentang 50-60 kg. Dengan boxplot dapat memperkuat hasil analisis, dimana median kelas A berada di angka 59 kg yang kotaknya lebih besar dibandingkan kotak kelas B. Hal ini menunjukkan bahwa kedua kelas ini tidak memiliki outlier, sehingga seluruh data berada dalam batas normal.

2. Menganalisis tinggi badan mahasiswa kelas A dan B

Menghitung Ukuran Pemusatan Data

Ukuran pemusatan data digunakan untuk melihat nilai yang mewakili sekumpulan data. Pada analisis ini, kita menghitung rata-rata, median dan modus tinggi badan mahasiswa kelas A dan B. perhitungan ini untuk membandingkan kondisi umum kedua kelas tersebut, sehingga dapat terlihat kelas mana yang cenderung memiliki tinggi badan yang lebih besar.

# Mean Kelas A
mean_tbA <- mean(tb_A)
cat("mean_tbA", mean_tbA, "cm", "\n")
## mean_tbA 167.7 cm
# Mean Kelas B
mean_tbB<- mean(tb_B)
cat("mean_tbB", mean_tbB, "cm", "\n")
## mean_tbB 157.5 cm
# Median Kelas A
median_tbA <- median(tb_A)
cat ("median_tbA", median_tbA, "cm", "\n")
## median_tbA 163.5 cm
# Median Kelas B
median_tbB <- median(tb_B)
cat ("median_tbB", median_tbB, "cm", "\n")
## median_tbB 160 cm
# Modus (gunakan Fungsi custom)
modus <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}
# Modus Kelas A
modus_tbA <- modus(tb_A)
cat("modus_tbA", modus_tbA, "cm", "\n")
## modus_tbA 160 cm
# Modus Kelas B
modus_tbB <- modus(tb_B)
cat("modus_tbB", modus_tbB, "cm", "\n")
## modus_tbB 160 cm

Menghitung Penyebaran Data

Ukuran Penyebaran data digunakan untuk membantu kita mengetahui seberapa besar variasi ataupun perbedaan antar nilai dalam sekumpulan data. Pada analisis ini, Kita menghitung range (rentang), variance(variansi), dan standard deviation (simpangan baku) tinggi badan mahasiswa kelas A dan kelas B. Hasilnya nanti akan menunjukkan seberapa lebar sebaran data di masing-masing kelas dan membantu melihat apakah data cenderung homogen atau bervariasi.

# Menghitung range (rentang) Kelas A
range_tbA <- range(tb_A)
cat("range_tbA", range_tbA, "\n")
## range_tbA 155 185
# Menghitung range (rentang) Kelas B
range_tbB <- range(tb_B)
cat("range_tbB", range_tbB, "\n")
## range_tbB 143 172
# Menghitung variansi (keragaman) Kelas A
var_tbA <- var(tb_A)
cat("var_tbA", var_tbA, "\n")
## var_tbA 115.5667
# Menghitung variansi (keragaman) Kelas B
var_tbB <- var(tb_B)
cat("var_tbB", var_tbB, "\n")
## var_tbB 96.5
#Menghitung standar deviation (simpangan baku) Kelas A
sd_tbA <- sd(tb_A)
cat("sd_bbA", sd_tbA, "\n")
## sd_bbA 10.75019
#Menghitung standar deviation (simpangan baku) Kelas B
sd_tbB <- sd(tb_B)
cat("sd_tbB", sd_tbB, "\n")
## sd_tbB 9.823441

Visualisasi Data

visualisasi Data digunakan untuk memudahkan kita memahami perbedaan dan pola dalam data secara cepat. Pada analisis ini, kita menggunakan histogram dan boxplot untuk menampilkan distribusi, nilai tengah, dan sebaran tinggi badan mahasiswa kelas A dan B. Dengan menggunakan grafik ini, Perbedaan antar kelas dapat terlihat lebih jelas dan lebih mudah dipahami di bandingkan hanya dengan melihat angka saja.

# Membuat histogram tinggi badan mahasiswa kelas A
hist(kelas_A$tb_A, col = "chocolate",
     main = "Histogram Tinggi Badan Mahasiswa  Kelas A",
     xlab = "Tinggi Badan (cm)")

# Membuat histogram tinggi badan mahasiswa kelas B
hist(kelas_B$tb_B, col = "yellow",
     main = "Histogram Tinggi Badan Mahasiswa  Kelas B",
     xlab = "Tinggi Badan (cm)")

# Membuat boxplot tinggi badan mahasiswa kelas A
boxplot(kelas_A$tb_A, horizontal = TRUE,
        main = "Boxplot Tinggi Badan Mahasiswa Kelas A",
        col = "grey")

# Membuat boxplot tinggi badan mahasiswa kelas B
boxplot(kelas_B$tb_B, horizontal = TRUE,
        main = "Boxplot Tinggi Badan Mahasiswa Kelas B",
        col = "green")

Interpretasi

Berdasarkan hasil analisis, mahasiswa Kelas A memiliki rata-rata tinggi badan sebesar 167,7 cm, sedangkan Kelas B memiliki rata-rata 157,5 cm. Perbedaan ini menunjukkan bahwa secara umum mahasiswa Kelas A cenderung lebih tinggi dibanding Kelas B. Median tinggi badan Kelas A adalah 163,5 cm, sedikit lebih besar dari Kelas B yang berada di 160 cm, yang berarti separuh mahasiswa Kelas A memiliki tinggi di atas 163,5 cm, sedangkan pada Kelas B setengahnya berada di atas 160 cm. Dari sisi modus, Kelas A tidak memiliki modus tunggal karena seluruh nilai tinggi badan muncul satu kali, sedangkan Kelas B memiliki modus 160 cm, yang merupakan tinggi badan paling umum di kelas tersebut. Kondisi ini menunjukkan bahwa distribusi tinggi badan di Kelas B memiliki titik kumpul yang jelas, sementara di Kelas A tinggi badan lebih bervariasi tanpa ada satu nilai yang mendominasi. Untuk penyebaran data, Kelas A memiliki rentang tinggi badan 30 cm (155–185 cm), hampir sama dengan Kelas B yang memiliki rentang 29 cm (143–172 cm). Variansi dan standar deviasi Kelas A sedikit lebih besar, menandakan bahwa tinggi badan di Kelas A sedikit lebih beragam dibanding Kelas B. Visualisasi dalam bentuk histogram menunjukkan bahwa Kelas A didominasi mahasiswa dengan tinggi di atas 160 cm, bahkan ada yang mencapai 185 cm, sedangkan Kelas B lebih terkonsentrasi di sekitar 155–162 cm. Boxplot mempertegas perbedaan ini, di mana median Kelas A berada lebih tinggi dan kotak interkuartilnya sedikit lebih besar dibanding Kelas B, menandakan variasi yang sedikit lebih tinggi di Kelas A.