Tugas 2 Komputasi Statistika

Analisis dan Perbandingan Statistika Deskriptif

Dimiliki beberapa data dari Kelas A dan Kelas B seperti berikut.

#Data Kelas A
#Nama Mahasiswa
nama_A <- c("Ani", "Budi", "Cahya", "Danu", "Eka", "Fitri", "Gilang", "Hani", "Indra", "Jihan")

#Berat Badan Mahasiswa
bb_A <- c(55, 65, 50, 70, 60, 58, 75, 52, 80, 53)

#Tinggi Badan Mahasiswa
tb_A <- c(160, 175, 155, 180, 165, 162, 178, 158, 185, 159)

#Data Berat dan Tinggi Badan Mahasiswa
kelas_A <- data.frame(nama_A, bb_A, tb_A)
kelas_A
##    nama_A bb_A tb_A
## 1     Ani   55  160
## 2    Budi   65  175
## 3   Cahya   50  155
## 4    Danu   70  180
## 5     Eka   60  165
## 6   Fitri   58  162
## 7  Gilang   75  178
## 8    Hani   52  158
## 9   Indra   80  185
## 10  Jihan   53  159
#Data Kelas B
#Nama Mahasiswa
nama_B <- c("Alya", "Bintang", "Rizki", "Ana", "Nanda", "Dimas", "Ali", "Agus", "Dwi", "Putri")

#Berat Badan Mahasiswa
bb_B <- c(50, 55, 53, 60, 58, 70, 52, 57, 59, 54)

#Tinggi Badan Mahasiswa
tb_B <- c(145, 160, 172, 155, 160, 170, 148, 162, 160, 143)

#Data Berat dan Tinggi Badan Mahasiswa
kelas_B <- data.frame(nama_B, bb_B, tb_B)
kelas_B
##     nama_B bb_B tb_B
## 1     Alya   50  145
## 2  Bintang   55  160
## 3    Rizki   53  172
## 4      Ana   60  155
## 5    Nanda   58  160
## 6    Dimas   70  170
## 7      Ali   52  148
## 8     Agus   57  162
## 9      Dwi   59  160
## 10   Putri   54  143

1. Analisis dan Perbandingan Berat Badan Mahasiswa Kelas A dan Kelas B

a. Membandingkan Ukuran Pemusatan dan Penyebaran Data Berat Badan Kelas A dan Kelas B

Untuk membandingkan ukuran pemusatan dan penyebaran data berat badan antara kedua kelas, maka perlulah kita mencari ukuran pemusatan (rata-rata, median, dan modus) dan penyebaran data (rentang, variansi, dan simpangan baku) dari data berat badan kedua kelas.

Berikut ini ukuran pemusatan data:

Mean Berat Badan

mean_bbA <- mean(bb_A)
cat("mean_bbA:", mean_bbA, "kg")
## mean_bbA: 61.8 kg
mean_bbB <- mean(bb_B)
cat("mean_bbB:", mean_bbB, "kg")
## mean_bbB: 56.8 kg

Dari output yang dihasilkan, dapat kita lihat bahwa rata-rata kelas A lebih berat daripada kelas B. Di sini rata-rata kelas A sebesar 61,8 kg dan Kelas B sebesar 56,8 kg. Berarti selisih rata-rata kelas A dan kelas B yaitu 5 kg.

Median Berat Badan

median_bbA <- median(bb_A)
cat("median_bbA:", median_bbA, "kg")
## median_bbA: 59 kg
median_bbB <- median(bb_B)
cat("median_bbB:", median_bbB, "kg")
## median_bbB: 56 kg

Tidak hanya rata-rata saja, tetapi kita juga mencari median (nilai tengah) dari setiap data. Terlihat bahwa nilai tengah kelas A lebih tinggi yaitu 59 kg daripada nilai tengah kelas B yaitu 56 kg

Modus Berat Badan

modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
modus_bbA <- modus(bb_A)
cat("modus_bbA:", modus_bbA, "kg")
## modus_bbA: 55 kg
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
modus_bbB <- modus(bb_B)
cat("modus_bbB:", modus_bbB, "kg")
## modus_bbB: 50 kg

Salah satu ukuran pemusatan data yaitu modus. Modus yang akan menunjukkan data yang sering muncul. Kelas A memiliki modus 55 kg dan kelas B 50 kg.

Berikut ini ukuran penyebaran data:

Range (Rentang) Berat Badan

range_bbA <- range(bb_A)
cat("range_bbA:", range_bbA)
## range_bbA: 50 80
range_bbB <- range(bb_B)
cat("range_bbB:", range_bbB)
## range_bbB: 50 70

Dari output terlihat bahwa rentang data kelas A lebih panjang daripada kelas B. Ini dibuktikkan dengan rentangan data berat badan kelas A dari 50 sampai 80 sedangkan kelas B hanya dari 50 sampai 70.

Variansi (Keragaman) Berat Badan

var_bbA <- var(bb_A)
cat("var_bbA:", var_bbA)
## var_bbA: 106.6222
var_bbB <- var(bb_B)
cat("var_bbB:", var_bbB)
## var_bbB: 31.73333

Output menunjukan bahwa variansi tinggi badan kelas A sebesar 106,62 dan variansi tinggi badan kelas B sebesar 31,73. Artinya, berat badan kelas A memiliki keragaman yang cukup tinggi daripada keragaman berat badan kelas B. Ini membuktikan bahwa berat badan kelas A menyebar jauh dari rata-ratanya, sedangkan berat badan kelas B menyebar merapat di sekitar rata-ratanya.

Standard Deviation (Simpangan Baku) Berat Badan

sd_bbA <- sd(bb_A)
cat("sd_bbA:", sd_bbA)
## sd_bbA: 10.3258
sd_bbB <- sd(bb_B)
cat("sd_bbB:", sd_bbB)
## sd_bbB: 5.633235

Sama seperti variansi, simpangan baku berat badan kelas A lebih besar daripada simpangan baku berat badan kelas B. Ini terlihat dengan simpangan baku berat badan kelas A sebesar 10,32 sedangkan simpangan baku berat badan kelas B sebesar 5,63.

b. Membandingkan Data Berat Badan Kelas A dan Kelas B dengan Melihat Visualisasi Data

Banyak sekali visualisasi data yang dapat kita lakukan. Itu dapat berupa histogram, boxplot, dan lain-lain.

Histogram Berat Badan

hist(kelas_A$bb_A, col = "maroon",
main= "Histogram Berat Badan Mahasiswa Kelas A",
xlab = "Berat Badan (kg)")

hist(kelas_B$bb_B, col = "maroon",
main= "Histogram Berat Badan Mahasiswa Kelas B",
xlab = "Berat Badan (kg)")

Dari kedua histogram berat badan kelas A dan kelas B, langsung terlihat bagaimana penyebaran kedua data berat badan masing-masing kelas. Terlihat bahwa berat badan kelas A menyebar dari 50-80 kg, sedangkan kelas B lebih terpusat sekitar 50-60 kg. Distribusi data berat badan kelas A juga condong ke kanan, sedangkan kelas B bisa dikatakan lebih rapat daripada kelas A. Untuk modus dari kedua data sama-sama berada di sekitar angka 50-55 kg.

Boxplot Berat Badan

boxplot(kelas_A$bb_A, horizontal = TRUE,
main = "Boxplot Berat Badan Mahasiswa Kelas A",
col = "maroon")

boxplot(kelas_B$bb_B, horizontal = TRUE,
main = "Boxplot Berat Badan Mahasiswa Kelas B",
col = "maroon")

Boxplot kedua data berat badan juga menunjukkan rentang datanya. Median dari kedua kelas juga terlihat, yaitu median kelas A sebesar 59 kg dan median kelas B sebesar 56 kg. Dari boxplot kelas A terlihat tidak terdapat pencilan, sedangkan dari boxplot kelas B menunjukkan adanya pencilan yaitu dengan nilai 70 kg. Untuk penyebaranpun lebih terlihat bahwa berat badan kelas B lebih rapat daripada kelas A.

c. Memberikan Penjelasan dari Hasil Analisis

Dari analisis yang didapatkan, dapat kita tarik kesimpulan bahwa penyebaran berat badan kelas A lebih menyebar daripada berat badan kelas B. Bukan hanya itu, dari rata-rata berat badan kedua kelas, bisa juga disebutkan bahwa kelas A lebih berat daripada kelas B. Tetapi berat badan kelas B lebih berpusat di sekitar rata-ratanya dibandingkan kelas A.

2. Analisis dan Perbandingan Tinggi Badan Mahasiswa Kelas A dan Kelas B

a. Membandingkan Ukuran Pemusatan dan Penyebaran Data Tinggi Badan Kelas A dan Kelas B

Untuk membandingkan ukuran pemusatan dan penyebaran data tinggi badan antara kedua kelas, maka perlulah kita mencari ukuran pemusatan (rata-rata, median, dan modus) dan penyebaran data (rentang, variansi, dan simpangan baku) dari data tinggi badan kedua kelas.

Berikut ini ukuran pemusatan data:

Mean Tinggi Badan

mean_tbA <- mean(tb_A)
cat("mean_tbA:", mean_tbA, "cm")
## mean_tbA: 167.7 cm
mean_tbB <- mean(tb_B)
cat("mean_tbB:", mean_tbB, "cm")
## mean_tbB: 157.5 cm

Dari output yang dihasilkan, terlihat bahwa rata-rata tinggi badan mahasiswa kelas B lebih rendah daripada kelas A. Ini dibuktikan dengan rata-rata tinggi badan kelas A sebesar 167,7 cm, sedangkan rata-rata tinggi badan kelas B sebesar 157,5 cm. Berarti terdapat selisi rata-rata tinggi badan kelas A dan kelas B sebesar 10,2 cm.

Median Tinggi Badan

median_tbA <- median(tb_A)
cat("median_tbA:", median_tbA, "cm")
## median_tbA: 163.5 cm
median_tbB <- median(tb_B)
cat("median_tbB:", median_tbB, "cm")
## median_tbB: 160 cm

Dari output yang dihasilkan, terlihat nilai tengah tinggi badan kelas A lebih tinggi daripada tinggi badan kelas B. Nilai tengah dari tinggi badan kelas A sebesar 163,5 cm, sedangkan kelas B sebesar 160 cm.

Modus Tinggi Badan

modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
modus_tbA <- modus(tb_A)
cat("modus_tbA:", modus_tbA, "cm")
## modus_tbA: 160 cm
modus <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
modus_tbB <- modus(tb_B)
cat("modus_tbB:", modus_tbB, "cm")
## modus_tbB: 160 cm

Untuk modus tinggi badan kedua kelas tersebut sama, yaitu sebesar 160 cm.

Berikut ini ukuran penyebaran data:

Range(Rentang) Tinggi Badan

range_tbA <- range(tb_A)
cat("range_tbA:", range_tbA)
## range_tbA: 155 185
range_tbB <- range(tb_B)
cat("range_tbB:", range_tbB)
## range_tbB: 143 172

Dari output range yang dihasilkan, terlihat bahwa tinggi badan kelas A lebih tinggi daripada tinggi badan kelas B. Ini dibuktikan dengan rentang tinggi badan kelas A berada di angka 155-185 cm, sedangkan kelas B berada di angka 143-172 cm. Kenapa bisa dibilang kelas A lebih tinggi, itu dibuktikan dengan tinggi badan orang terpendek di kelas A hanya 155 cm, sedangkan di kelas B yaitu 143 cm. Tidak hanya dibandingkan dengan orang terpendek, orang tertinggi di masing-masing kelas juga lebih tinggi kelas A, yaitu 185 cm, sedangkan kelas B hanya 172 cm.

variansi(Keragaman) Tinggi Badan

var_tbA <- var(tb_A)
cat("var_tbA:", var_tbA)
## var_tbA: 115.5667
var_tbB <- var(tb_B)
cat("var_tbB:", var_tbB)
## var_tbB: 96.5

Output menunjukan bahwa variansi tinggi badan kelas A sebesar 115,56 dan variansi tinggi badan kelas B sebesar 96,5. Artinya, tinggi badan kelas A memiliki keragaman yang lebih tinggi daripada keragaman tinggi badan kelas B.

Standard Deviation (Simpangan Baku) Tinggi Badan

sd_tbA <- sd(tb_A)
cat("sd_tbA:", sd_tbA)
## sd_tbA: 10.75019
sd_tbB <- sd(tb_B)
cat("sd_tbB:", sd_tbB)
## sd_tbB: 9.823441

Sama seperti variansi, simpangan baku tinggi badan kelas A lebih besar daripada simpangan baku tinggi badan kelas B. Ini terlihat dengan simpangan baku tinggi badan kelas A sebesar 10,75 sedangkan tinggi badan kelas B sebesar 9,82.

b. Membandingkan Data Tinggi Badan Badan Kelas A dan Kelas B dengan Melihat Visualisasi Data

Banyak sekali visualisasi data yang dapat kita lakukan. Itu dapat berupa histogram, boxplot, dan lain-lain.

Histogram Tinggi Badan

hist(kelas_A$tb_A, col = "maroon",
main= "Histogram Tinggi Badan Mahasiswa Kelas A",
xlab = "Tinggi Badan (cm)")

hist(kelas_B$tb_B, col = "maroon",
main= "Histogram Tinggi Badan Mahasiswa Kelas B",
xlab = "Tinggi Badan (cm)")

Dari output, dapat disimpulkan bahwa penyebaran data tinggi badan kelas B lebih merata daripada kelas A, ini terlihat dengan bentuk histogram tinggi badan mahasiswa kelas B yang sudah merata. Dan juga bisa dilihat pada Histogram Tinggi Badan Kelas A, tinggi badan mahasiswanya memiliki frekuensi yang rendah di interval 165-170 cm.

Boxplot Tinggi Badan

boxplot(kelas_A$tb_A, horizontal = TRUE,
main = "Boxplot Tinggi Badan Mahasiswa Kelas A",
col = "maroon")

boxplot(kelas_B$tb_B, horizontal = TRUE,
main = "Boxplot Tinggi Badan Mahasiswa Kelas B",
col = "maroon")

Untuk hasil boxplot, dapat disimpulkan bahwa tinggi badan mahasiswa kelas B lebih berpusat ke rata-ratanya dibandingkan dengan tinggi badan mahasiswa kelas A yang tampak lebih menyebar dari rata-ratanya. Ini membuktikan bahwa variansi tinggi badan kelas A cukup tinggi dibandingkan kelas B. Dan juga terlihat bahwa nilai median tinggi badan kelas A berada di sekitar 164 an, sedangkan untuk kelas B berada pada 160. Untuk kedua data, tidak terlihat ada outlier (pencilan).

c. Memberikan Penjelasan dari Hasil Analisis

Dari hasil analisis tadi, didapatkan beberapa kesimpulan. Yang pertama, mahasiswa kelas A lebih tinggi daripada mahasiswa kelas B. Tetapi tinggi badan mahasiswa kelas A tidak menyebar secara merata dibandingkan dengan kelas B. Dan untuk setiap kelas, tidak terdapat pencilan.

Kesimpulan

Jadi, dari hasil analisis berat badan dan tinggi badan dari kelas A dan B, dapat disimpullkan bahwa mahasiswa yang berada di kelas A lebih tinggi dan lebih berat daripada mahasiswa di kelas B. Sedangkan untuk pemusatan data, terlihat bahwa tinggi badan dan berat badan mahasiswa kelas B lebih terpusat di sekitar rata-ratanya dibandingkan mahasiswa kelas A.