Seorang mahasiswa di Universitas Wisconsin melakukan survei terhadap 40 mahasiswa yang tinggal di asramanya mengenai partisipasi mereka dalam kegiatan ekstrakurikuler selama satu minggu terakhir. Data yang diperoleh menunjukkan jumlah kegiatan ekstrakurikuler yang diikuti oleh masing-masing mahasiswa. Sajikan data tersebut dalam bentuk tabel frekuensi dan diagram batang frekuensi relatif.
# Data jumlah aktivitas
activities <- c(
1,5,0,1,4,3,0,2,1,6,1,1,0,0,
2,0,0,3,1,2,1,2,2,2,2,2,1,0,
2,2,3,4,2,7,2,2,3,3,1,1
)
length(activities) # cek jumlah data
## [1] 40
# Tabel frekuensi
freq <- table(activities)
# Frekuensi relatif
rel_freq <- prop.table(freq)
# Gabungkan dalam satu tabel
freq_table <- data.frame(
Activities = as.numeric(names(freq)),
Frequency = as.vector(freq),
Relative_Frequency = round(as.vector(rel_freq), 3),
Percent = round(as.vector(rel_freq) * 100, 2)
)
freq_table
## Activities Frequency Relative_Frequency Percent
## 1 0 7 0.175 17.5
## 2 1 10 0.250 25.0
## 3 2 13 0.325 32.5
## 4 3 5 0.125 12.5
## 5 4 2 0.050 5.0
## 6 5 1 0.025 2.5
## 7 6 1 0.025 2.5
## 8 7 1 0.025 2.5
barplot(
height = rel_freq,
names.arg = names(freq),
xlab = "Number of Activities",
ylab = "Relative Frequency",
main = "Relative Frequency Bar Chart of Activities",
ylim = c(0, max(rel_freq) + 0.05)
)
barplot(
height = rel_freq * 100,
names.arg = names(freq),
xlab = "Number of Activities",
ylab = "Percent",
main = "Relative Frequency Bar Chart of Activities (%)"
)
# Soal 2 Data berikut merepresentasikan nilai 40 mahasiswa pada sebuah
tes kualifikasi perguruan tinggi (sumber: R. W. Johnson). Buatlah
tampilan stem-and-leaf (batang dan daun) dari data
tersebut.
# Data nilai mahasiswa
scores <- c(
162,171,138,145,144,126,145,162,174,178,
167,98,161,152,182,136,165,137,133,143,
184,166,115,115,95,190,119,144,176,135,
194,147,160,158,178,162,131,106,157,154
)
length(scores) # cek jumlah data
## [1] 40
stem(scores)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 9 | 58
## 10 | 6
## 11 | 559
## 12 | 6
## 13 | 135678
## 14 | 344557
## 15 | 2478
## 16 | 01222567
## 17 | 14688
## 18 | 24
## 19 | 04
#install.packages("aplpack") # jalankan sekali
library(aplpack)
stem.leaf(scores)
## 1 | 2: represents 12
## leaf unit: 1
## n: 40
## 2 9 | 58
## 3 10 | 6
## 6 11 | 559
## 7 12 | 6
## 13 13 | 135678
## 19 14 | 344557
## (4) 15 | 2478
## 17 16 | 01222567
## 9 17 | 14688
## 4 18 | 24
## 2 19 | 04
Menurut Survei Komunitas Amerika (American Community Survey) tahun 2015, pada tahun 2012 Amerika Serikat memiliki 30,1 juta rumah tangga dengan satu orang, 37,1 juta rumah tangga dengan dua orang, 17,8 juta rumah tangga dengan tiga orang, 15,0 juta rumah tangga dengan empat orang, dan 10,4 juta rumah tangga dengan lima orang atau lebih.
# =========================
# Agresti Exercise 3.4 (R)
# =========================
# Data (dalam juta rumah tangga)
size <- c("1", "2", "3", "4", "5+")
freq_million <- c(30.1, 37.1, 17.8, 15.0, 10.4)
# Total
total <- sum(freq_million)
# (a) Relative frequency distribution
rel_freq <- freq_million / total
percent <- rel_freq * 100
dist_table <- data.frame(
Household_Size = size,
Frequency_Million = freq_million,
Relative_Frequency = round(rel_freq, 4),
Percent = round(percent, 2)
)
dist_table
## Household_Size Frequency_Million Relative_Frequency Percent
## 1 1 30.1 0.2726 27.26
## 2 2 37.1 0.3361 33.61
## 3 3 17.8 0.1612 16.12
## 4 4 15.0 0.1359 13.59
## 5 5+ 10.4 0.0942 9.42
sum(rel_freq) # harus = 1
## [1] 1
# (b) Bar chart (relative frequency / percent)
barplot(
height = percent,
names.arg = size,
xlab = "Household size (persons)",
ylab = "Percent",
main = "Relative Frequency Bar Chart of Household Size"
)
# Bentuknya: right-skewed (miring ke kanan)
# (c) Median dan Mode
cum_rel <- cumsum(rel_freq)
# Median kategori: kategori pertama yang membuat kumulatif >= 0.5
median_cat <- size[which(cum_rel >= 0.5)[1]]
# Mode kategori: frekuensi terbesar
mode_cat <- size[which.max(freq_million)]
median_cat
## [1] "2"
mode_cat
## [1] "2"
Cobakan soal no 1 untuk membuat steam and leaf