Tahap awal analisis diawali dengan membuat data dalam bentuk vektor menggunakan fungsi c(). Vektor ini berisi kumpulan nilai dengan tipe data yang sama, misalnya angka atau teks. Setelah semua vektor yang diperlukan dibuat, langkah berikutnya adalah menggabungkannya menjadi data frame menggunakan fungsi data.frame().
Data frame adalah struktur data dua dimensi di R yang menyerupai tabel, di mana setiap kolom dapat memiliki tipe data berbeda, dan setiap baris merepresentasikan satu observasi. Data frame ini akan menjadi sumber data yang nantinya digunakan untuk menghitung ukuran-ukuran statistik seperti rata-rata, median, variansi, dan standar deviasi.
#KELAS A
#Nama mahasiswa kelas A
Nama_A <- c("Ani", "Budi", "Cahya", "Danu", "Eka", "Fitri", "Gilang", "Hani", "Indra", "Jihan")
#Berat badan mahasiswa kelas A
Bb_A <- c(55, 65, 50, 70, 60, 58, 75, 52, 80, 53)
#Tinggi badan mahasiswa kelas A
Tb_A <- c(160, 175, 155, 180, 165, 162, 178, 158, 185, 159)
#Data berat dan tinggi badan mahasiswa kelas A
Kelas_A <- data.frame(Nama_A, Bb_A, Tb_A)
#KELAS B
#Nama mahasiswa kelas B
Nama_B <- c("Alya", "Bintang", "Rizki", "Ana", "Nanda", "Dimas", "Ali", "Agus", "Dwi", "Putri")
#Berat badan mahasiswa kelas B
Bb_B <- c(50, 55, 53, 60, 58, 70, 52, 57, 59, 54)
#Tinggi badan mahasiswa kelas B
Tb_B <- c(145, 160, 172, 155, 160, 170, 148, 162, 160, 143)
#Data berat dan tinggi badan mahasiswa kelas B
Kelas_B <- data.frame(Nama_B, Bb_B, Tb_B)
#Membaca data kelas A
Kelas_A
## Nama_A Bb_A Tb_A
## 1 Ani 55 160
## 2 Budi 65 175
## 3 Cahya 50 155
## 4 Danu 70 180
## 5 Eka 60 165
## 6 Fitri 58 162
## 7 Gilang 75 178
## 8 Hani 52 158
## 9 Indra 80 185
## 10 Jihan 53 159
#Membaca data kelas B
Kelas_B
## Nama_B Bb_B Tb_B
## 1 Alya 50 145
## 2 Bintang 55 160
## 3 Rizki 53 172
## 4 Ana 60 155
## 5 Nanda 58 160
## 6 Dimas 70 170
## 7 Ali 52 148
## 8 Agus 57 162
## 9 Dwi 59 160
## 10 Putri 54 143
Analisis ini dilakukan untuk membandingkan distribusi berat badan mahasiswa pada dua kelas yang berbeda, yaitu Kelas A dan Kelas B. Perbandingan mencakup tiga aspek utama, yaitu ukuran pemusatan yang menunjukkan nilai tengah data, ukuran penyebaran yang menggambarkan tingkat variasi berat badan antar mahasiswa, serta visualisasi dalam bentuk boxplot yang memberikan gambaran jelas mengenai posisi median, rentang antarkuartil, sebaran data, dan keberadaan outlier.
Ukuran pemusatan (mean, median, modus) menunjukkan nilai rata-rata atau titik tengah berat badan mahasiswa pada tiap kelas. Sementara ukuran penyebaran (rentang, variansi, simpangan baku) menggambarkan seberapa besar variasi berat badan antar mahasiswa. Kombinasi keduanya membantu melihat kecenderungan dan keragaman berat badan di Kelas A dan Kelas B.
Mean_Bb_A <- mean(Bb_A)
Median_Bb_A <- median(Bb_A)
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
Modus_Bb_A <- modus(Bb_A)
cat("Mean berat badan mahasiswa kelas A:", Mean_Bb_A, "kg\n")
## Mean berat badan mahasiswa kelas A: 61.8 kg
cat("Median berat badan mahasiswa kelas A:", Median_Bb_A, "kg\n")
## Median berat badan mahasiswa kelas A: 59 kg
cat("Modus berat badan mahasiswa kelas A:", Modus_Bb_A, "kg\n")
## Modus berat badan mahasiswa kelas A: 55 kg
Berdasarkan hasil perhitungan, rata-rata (mean) berat badan mahasiswa Kelas A adalah 61.8 kg, menunjukkan nilai tengah aritmetis dari seluruh data. Nilai tengah (median) adalah 59 kg, yang berarti separuh mahasiswa memiliki berat badan di bawah 59 kg dan separuhnya di atas 59 kg. Sedangkan modus berat badan adalah 55 kg, yang merupakan nilai yang paling sering muncul di antara mahasiswa Kelas A.
Range_Bb_A <- range(Bb_A)
Var_Bb_A <- var(Bb_A)
Sd_Bb_A <- sd(Bb_A)
cat("Rentang berat badan mahasiswa kelas A:", Range_Bb_A, "\n")
## Rentang berat badan mahasiswa kelas A: 50 80
cat("Variansi berat badan mahasiswa kelas A:", Var_Bb_A, "\n")
## Variansi berat badan mahasiswa kelas A: 106.6222
cat("Simpangan baku berat badan mahasiswa kelas A:", Sd_Bb_A, "\n")
## Simpangan baku berat badan mahasiswa kelas A: 10.3258
Rentang berat badan mahasiswa di Kelas A berada pada kisaran 50 kg hingga 80 kg, dengan selisih sebesar 30 kg. Nilai variansi sebesar 106.6222 menunjukkan seberapa besar penyebaran data dari nilai rata-ratanya. Sementara itu, simpangan baku sebesar 10.3258 kg berarti rata-rata berat badan mahasiswa Kelas A menyimpang sekitar 10.33 kg dari nilai rata-rata kelasnya.
Mean_Bb_B <- mean(Bb_B)
Median_Bb_B <- median(Bb_B)
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
Modus_Bb_B <- modus(Bb_B)
cat("Mean berat badan mahasiswa kelas B:", Mean_Bb_B, "kg\n")
## Mean berat badan mahasiswa kelas B: 56.8 kg
cat("Median berat badan mahasiswa kelas B:", Median_Bb_B, "kg\n")
## Median berat badan mahasiswa kelas B: 56 kg
cat("Modus berat badan mahasiswa kelas B:", Modus_Bb_B, "kg\n")
## Modus berat badan mahasiswa kelas B: 50 kg
Berdasarkan hasil perhitungan, rata-rata (mean) berat badan mahasiswa Kelas B adalah 56.8 kg, menunjukkan bahwa secara umum berat badan mahasiswa di kelas ini berada di kisaran tersebut. Nilai tengah (median) adalah 56 kg, yang berarti setengah mahasiswa memiliki berat badan di bawah 56 kg dan setengahnya lagi di atas nilai tersebut. Modus berat badan adalah 50 kg, yang merupakan nilai berat badan yang paling sering dimiliki mahasiswa di Kelas B.
Range_Bb_B <- range(Bb_B)
Var_Bb_B <- var(Bb_B)
Sd_Bb_B <- sd(Bb_B)
cat("Rentang berat badan mahasiswa kelas B:", Range_Bb_B, "\n")
## Rentang berat badan mahasiswa kelas B: 50 70
cat("Variansi berat badan mahasiswa kelas B:", Var_Bb_B, "\n")
## Variansi berat badan mahasiswa kelas B: 31.73333
cat("Simpangan baku berat badan mahasiswa kelas B:", Sd_Bb_B, "\n")
## Simpangan baku berat badan mahasiswa kelas B: 5.633235
Rentang berat badan mahasiswa Kelas B berada pada kisaran 50 kg hingga 70 kg, dengan selisih sebesar 20 kg. Nilai variansi sebesar 31.73333 menunjukkan bahwa penyebaran data berat badan di kelas ini relatif lebih kecil dibandingkan Kelas A, yang berarti berat badan mahasiswa Kelas B cenderung lebih homogen. Simpangan baku sebesar 5.63 kg mengindikasikan bahwa rata-rata berat badan mahasiswa Kelas B menyimpang sekitar 5.63 kg dari nilai rata-rata kelasnya.
# Membuat data frame perbandingan
perbandingan_bb <- data.frame(
Kelas = c("A", "B"),
Mean = c(Mean_Bb_A, Mean_Bb_B),
Median = c(Median_Bb_A, Median_Bb_B),
Modus = c(Modus_Bb_A, Modus_Bb_B),
Rentang = c(diff(Range_Bb_A), diff(Range_Bb_B)),
Variansi = c(Var_Bb_A, Var_Bb_B),
Simpangan_Baku = c(Sd_Bb_A, Sd_Bb_B)
)
perbandingan_bb
## Kelas Mean Median Modus Rentang Variansi Simpangan_Baku
## 1 A 61.8 59 55 30 106.62222 10.325804
## 2 B 56.8 56 50 20 31.73333 5.633235
Berdasarkan ukuran pemusatan, rata-rata berat badan mahasiswa Kelas A adalah 61,8 kg, median 59 kg, dan modus 55 kg. Nilai rata-rata lebih tinggi dibanding median dan modus, yang menunjukkan kemungkinan adanya beberapa nilai berat badan yang cukup tinggi sehingga menaikkan rata-rata. Sementara itu, Kelas B memiliki rata-rata 56,8 kg, median 56 kg, dan modus 50 kg. Perbedaan yang lebih besar antara mean, median, dan modus pada kedua kelas mengindikasikan distribusi data yang tidak sepenuhnya simetris.
Dari ukuran penyebaran, rentang berat badan mahasiswa Kelas A adalah 30 kg dengan variansi sebesar 106,62 dan simpangan baku 10,33. Nilai-nilai ini lebih tinggi dibandingkan Kelas B yang memiliki rentang 20 kg, variansi 31,73, dan simpangan baku 5,63. Hal ini menunjukkan bahwa berat badan mahasiswa Kelas B lebih homogen, yaitu nilai-nilainya cenderung berdekatan satu sama lain dan tidak jauh menyimpang dari rata-rata. Sebaliknya, Kelas A memiliki variasi yang lebih besar sehingga penyebaran berat badannya lebih lebar dan data lebih beragam.
boxplot(Bb_A, Bb_B,
names = c("Kelas A", "Kelas B"),
col = c("lightpink", "lightblue"),
main = "Perbandingan Berat Badan Mahasiswa Kelas A dan B",
xlab = "Kelas",
ylab = "Berat Badan (kg)")
Berdasarkan boxplot, distribusi berat badan mahasiswa Kelas A memiliki rentang yang lebih lebar dibandingkan Kelas B, menunjukkan variasi yang lebih besar. Kelas A memiliki median 59 kg dengan kuartil bawah (Q1) sekitar 54–55 kg dan kuartil atas (Q3) sekitar 68–69 kg, sehingga rentang antarkuartil (IQR) kurang lebih 14 kg, dengan penyebaran data yang cukup simetris dan tanpa pencilan yang mencolok.
Sementara itu, Kelas B memiliki rentang yang lebih sempit dengan median 56 kg, kuartil bawah sekitar 55 kg, dan kuartil atas sekitar 61–62 kg, dengan IQR sekitar 6–7 kg, menandakan data yang lebih homogen. Namun, terdapat satu pencilan (outlier) di Kelas B yang berada di kisaran 66–67 kg, mengindikasikan adanya satu mahasiswa dengan berat badan lebih tinggi dari mayoritas anggota kelasnya.
Ditinjau dari ukuran pemusatan, berat badan mahasiswa Kelas A memiliki median yang lebih tinggi dibandingkan Kelas B. Artinya, secara keseluruhan mahasiswa di Kelas A cenderung memiliki berat badan yang sedikit lebih besar. Perbedaan median ini juga menggambarkan bahwa titik tengah distribusi berat badan di Kelas A berada pada tingkat yang lebih tinggi dibandingkan Kelas B, meskipun selisihnya tidak terlalu jauh.
Berdasarkan ukuran penyebaran, Kelas A menunjukkan variasi berat badan yang lebih luas daripada Kelas B. Data pada Kelas A menyebar lebih jauh dari median, menandakan adanya perbedaan yang cukup beragam antar individu. Sementara itu, Kelas B memiliki sebaran data yang lebih sempit, menunjukkan bahwa berat badan mahasiswanya relatif lebih seragam. Kondisi ini mengindikasikan bahwa keberagaman berat badan di Kelas A lebih menonjol dibandingkan Kelas B.
Gambaran melalui boxplot memperlihatkan bahwa Kelas A memiliki panjang kotak dan whisker yang lebih besar, yang berarti rentang antarkuartil dan sebaran datanya lebih lebar. Pada Kelas A tidak ditemukan outlier, sedangkan pada Kelas B terdapat satu outlier di bagian atas. Kotak pada Kelas B tampak lebih pendek, yang mencerminkan distribusi data yang lebih rapat dan rentang total yang lebih kecil. Visualisasi ini menegaskan bahwa berat badan mahasiswa Kelas A lebih bervariasi, sedangkan Kelas B lebih terkonsentrasi di sekitar nilai tengah.
Secara umum, mahasiswa Kelas A memiliki median berat badan yang sedikit lebih tinggi dan keragaman yang lebih besar dibandingkan Kelas B. Hal ini menunjukkan bahwa Kelas A tidak hanya cenderung memiliki berat badan yang lebih besar, tetapi juga variasi yang lebih luas, sementara Kelas B lebih seragam meskipun terdapat satu nilai yang menyimpang di bagian atas.
Analisis ini bertujuan untuk mengetahui perbedaan distribusi tinggi badan mahasiswa di Kelas A dan Kelas B. Kajian dilakukan dengan meninjau ukuran pemusatan untuk melihat kecenderungan nilai tengah, ukuran penyebaran untuk mengukur tingkat keragaman tinggi badan, serta visualisasi boxplot untuk memberikan gambaran yang mudah dipahami mengenai distribusi, sebaran, dan kemungkinan adanya outlier pada masing-masing kelas.
Ukuran pemusatan (mean, median, modus) menunjukkan rata-rata atau titik tengah tinggi badan mahasiswa di masing-masing kelas. Sementara ukuran penyebaran (rentang, variansi, simpangan baku) memberikan gambaran seberapa bervariasi tinggi badan antar mahasiswa. Dengan melihat keduanya, kita dapat membandingkan kecenderungan dan keragaman tinggi badan antara Kelas A dan Kelas B.
Mean_Tb_A <- mean(Tb_A)
Median_Tb_A <- median(Tb_A)
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
Modus_Tb_A <- modus(Tb_A)
cat("Mean tinggi badan mahasiswa kelas A:", Mean_Tb_A, "cm\n")
## Mean tinggi badan mahasiswa kelas A: 167.7 cm
cat("Median tinggi badan mahasiswa kelas A:", Median_Tb_A, "cm\n")
## Median tinggi badan mahasiswa kelas A: 163.5 cm
cat("Modus tinggi badan mahasiswa kelas A:", Modus_Tb_A, "cm\n")
## Modus tinggi badan mahasiswa kelas A: 160 cm
Berdasarkan hasil perhitungan, rata-rata (mean) tinggi badan mahasiswa Kelas A adalah 167,7 cm, menunjukkan nilai tengah aritmetis dari seluruh data. Nilai tengah (median) adalah 163,5 cm, yang berarti separuh mahasiswa memiliki tinggi badan di bawah 163,5 cm dan separuhnya di atas 163,5 cm. Sedangkan modus tinggi badan adalah 160 cm, yang merupakan nilai yang paling sering muncul di antara mahasiswa Kelas A.
Range_Tb_A <- range(Tb_A)
Var_Tb_A <- var(Tb_A)
Sd_Tb_A <- sd(Tb_A)
cat("Rentang tinggi badan mahasiswa kelas A:", Range_Tb_A, "\n")
## Rentang tinggi badan mahasiswa kelas A: 155 185
cat("Variansi tinggi badan mahasiswa kelas A:", Var_Tb_A, "\n")
## Variansi tinggi badan mahasiswa kelas A: 115.5667
cat("Simpangan baku tinggi badan mahasiswa kelas A:", Sd_Tb_A, "\n")
## Simpangan baku tinggi badan mahasiswa kelas A: 10.75019
Rentang tinggi badan mahasiswa Kelas A adalah 155–185 cm, menunjukkan selisih antara tinggi terendah dan tertinggi. Nilai variansi sebesar 115,57 mengindikasikan tingkat keragaman data yang cukup besar. Sementara itu, simpangan baku sebesar 10,75 cm berarti rata-rata tinggi badan mahasiswa menyimpang sekitar 10,75 cm dari nilai rata-ratanya, sehingga variasi tinggi badan dalam kelas ini tergolong sedang.
Mean_Tb_B <- mean(Tb_B)
Median_Tb_B <- median(Tb_B)
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
Modus_Tb_B <- modus(Tb_B)
cat("Mean tinggi badan mahasiswa kelas B:", Mean_Tb_B, "cm\n")
## Mean tinggi badan mahasiswa kelas B: 157.5 cm
cat("Median tinggi badan mahasiswa kelas B:", Median_Tb_B, "cm\n")
## Median tinggi badan mahasiswa kelas B: 160 cm
cat("Modus tinggi badan mahasiswa kelas B:", Modus_Tb_B, "cm\n")
## Modus tinggi badan mahasiswa kelas B: 160 cm
Berdasarkan hasil perhitungan, rata-rata (mean) tinggi badan mahasiswa Kelas B adalah 157,5 cm, menunjukkan nilai tengah aritmetis dari seluruh data. Nilai tengah (median) adalah 160 cm, yang berarti separuh mahasiswa memiliki tinggi badan di bawah 160 cm dan separuhnya di atas 160 cm. Sedangkan modus tinggi badan adalah 160 cm, yang merupakan nilai yang paling sering muncul di antara mahasiswa Kelas B.
Range_Tb_B <- range(Tb_B)
Var_Tb_B <- var(Tb_B)
Sd_Tb_B <- sd(Tb_B)
cat("Rentang tinggi badan mahasiswa kelas B:", Range_Tb_B, "\n")
## Rentang tinggi badan mahasiswa kelas B: 143 172
cat("Variansi tinggi badan mahasiswa kelas B:", Var_Tb_B, "\n")
## Variansi tinggi badan mahasiswa kelas B: 96.5
cat("Simpangan baku tinggi badan mahasiswa kelas B:", Sd_Tb_B, "\n")
## Simpangan baku tinggi badan mahasiswa kelas B: 9.823441
Rentang tinggi badan mahasiswa Kelas B berada pada kisaran 143 cm hingga 172 cm, dengan selisih sebesar 29 cm. Nilai variansi sebesar 96,5 menunjukkan bahwa penyebaran data tinggi badan di kelas ini cukup moderat. Simpangan baku sebesar 9,82 cm mengindikasikan bahwa rata-rata tinggi badan mahasiswa Kelas B menyimpang sekitar 9,82 cm dari nilai rata-rata kelasnya.
# Membuat data frame perbandingan tinggi badan
perbandingan_tb <- data.frame(
Kelas = c("A", "B"),
Mean = c(Mean_Tb_A, Mean_Tb_B),
Median = c(Median_Tb_A, Median_Tb_B),
Modus = c(Modus_Tb_A, Modus_Tb_B),
Rentang = c(diff(Range_Tb_A), diff(Range_Tb_B)),
Variansi = c(Var_Tb_A, Var_Tb_B),
Simpangan_Baku = c(Sd_Tb_A, Sd_Tb_B)
)
perbandingan_tb
## Kelas Mean Median Modus Rentang Variansi Simpangan_Baku
## 1 A 167.7 163.5 160 30 115.5667 10.750194
## 2 B 157.5 160.0 160 29 96.5000 9.823441
Berdasarkan ukuran pemusatan, rata-rata tinggi badan mahasiswa Kelas A adalah 167,7 cm, median 163,5 cm, dan modus 160 cm. Perbedaan yang cukup besar antara mean, median, dan modus menunjukkan adanya ketidaksimetrisan distribusi data, kemungkinan disebabkan oleh beberapa nilai ekstrem (outlier) yang lebih tinggi dari mayoritas data.
Sementara itu, Kelas B memiliki rata-rata 157,5 cm, median 160 cm, dan modus 160 cm. Nilai median dan modus yang sama, serta perbedaan yang kecil dari rata-ratanya, menunjukkan bahwa distribusi tinggi badan mahasiswa Kelas B relatif lebih simetris dibanding Kelas A.
Dari ukuran penyebaran, rentang tinggi badan mahasiswa Kelas A adalah 30 cm (selisih antara nilai tertinggi dan terendah), dengan variansi sebesar 115,57 dan simpangan baku 10,75 cm. Nilai ini sedikit lebih tinggi dibandingkan Kelas B yang memiliki rentang 29 cm, variansi 96,50, dan simpangan baku 9,82 cm. Hal ini menunjukkan bahwa variasi tinggi badan di Kelas A lebih besar, sehingga terdapat perbedaan tinggi badan yang lebih lebar antar mahasiswa. Sebaliknya, Kelas B memiliki penyebaran yang lebih sempit, sehingga tinggi badan para mahasiswanya lebih homogen.
boxplot(Tb_A, Tb_B,
names = c("Kelas A", "Kelas B"),
col = c("lightpink", "lightblue"),
main = "Perbandingan Tinggi Badan Mahasiswa Kelas A dan B",
xlab = "Kelas",
ylab = "Tinggi Badan (cm)")
Distribusi tinggi badan mahasiswa Kelas A memiliki rentang yang lebih lebar dibandingkan Kelas B, menunjukkan variasi tinggi yang lebih besar di Kelas A. Median Kelas A berada di sekitar 163–164 cm dengan kuartil bawah (Q1) sekitar 159–160 cm dan kuartil atas (Q3) sekitar 176–177 cm, sehingga rentang antarkuartil (IQR) sekitar 17–18 cm. Dengan penyebaran data relatif simetris dan tidak tampak adanya pencilan (outlier).
Sementara itu, Kelas B memiliki rentang yang lebih sempit dengan median 160 cm, kuartil bawah sekitar 150 cm, dan kuartil atas sekitar 162 cm, dengan IQR sekitar 12 cm, menandakan data yang lebih homogen. Meski demikian, tinggi badan mahasiswa Kelas B cenderung berada pada kisaran yang lebih rendah dibanding Kelas A.
Berdasarkan ukuran pemusatan, tinggi badan mahasiswa Kelas A memiliki median yang lebih tinggi dibandingkan Kelas B. Hal ini menunjukkan bahwa secara umum, sebagian besar mahasiswa di Kelas A memiliki tinggi badan yang sedikit lebih besar. Perbedaan median ini juga mengindikasikan adanya kecenderungan bahwa distribusi tinggi badan di Kelas A berada pada level yang lebih tinggi dibandingkan Kelas B, meskipun keduanya masih berada pada kisaran yang relatif berdekatan.
Ditinjau dari ukuran penyebaran, Kelas A menunjukkan variasi tinggi badan yang lebih besar daripada Kelas B. Hal ini tercermin dari rentang dan simpangan baku yang lebih besar, yang berarti data di Kelas A menyebar lebih luas dari nilai median. Sebaliknya, Kelas B memiliki penyebaran yang lebih sempit, menandakan bahwa tinggi badan mahasiswa di kelas ini lebih homogen. Perbedaan ini mengindikasikan bahwa keberagaman postur tubuh di Kelas A lebih menonjol dibandingkan Kelas B.
Visualisasi boxplot memperkuat hasil pengamatan sebelumnya. Kelas A memperlihatkan panjang kotak dan whisker yang lebih besar, menandakan rentang antarkuartil dan sebaran data yang lebih lebar, tanpa adanya outlier. Sementara itu, Kelas B memiliki kotak yang lebih pendek, menunjukkan distribusi data yang lebih rapat, dan whisker yang lebih pendek menandakan rentang data yang lebih kecil. Bentuk boxplot ini secara visual memperjelas bahwa Kelas A memiliki distribusi tinggi badan yang lebih bervariasi.
Secara keseluruhan, mahasiswa Kelas A memiliki median tinggi badan yang lebih tinggi dan variasi yang lebih besar dibandingkan Kelas B. Perbedaan ini menunjukkan bahwa Kelas A tidak hanya cenderung lebih tinggi secara umum, tetapi juga memiliki keberagaman tinggi badan yang lebih luas, sedangkan Kelas B lebih seragam dalam hal tinggi badan.