Kelompok kami meneliti perbedaan jam tidur mahasiswa dari tiga jurusan berbeda: Statistika, Ilmu Komputer, dan Biologi. Data dibangkitkan dari distribusi normal dengan 30 data perjurusan. Kemudian, Kami menguji apakah terdapat perbedaan signifikan dalam rata-rata jam tidur antar ketiga jurusan tersebut. Kelompok kami ingin membuktikan apakah mahasiswa Statistika benar-benar tidur rata-rata 7 jam per malam seperti yang banyak diasumsikan.
Kami membangkitkan data jam tidur mahasiswa dari 3 jurusan dengan 30 mahasiswa setiap jurusan
set.seed(123)
Statistika <- rnorm(30, mean = 7.5, sd = 0.9)
Ilmu_Komputer <- rnorm(30, mean = 7.2, sd = 1.0)
Biologi <- rnorm(30, mean = 6.8, sd = 1.1)
# Gabungkan Seluruh Data
data_tidur <- data.frame(
jam_tidur = c(Statistika, Ilmu_Komputer, Biologi),
jurusan = factor(rep(c("Statistika", "Ilmu_Komputer", "Biologi"), each = 30)))
Kami menyederhanakan perhitungan statistik deskriptif dengan menggunakan satu fungsi yang dapat digunakan berulang kali untuk ketiga jurusan untuk menghindari pengulangan kode yang tidak perlu.
# Fungsi untuk menghitung statistik deskriptif
hitung_statistik <- function(data, nama_jurusan) {
mean_val <- mean(data)
median_val <- median(data)
var_val <- var(data)
sd_val <- sd(data)
cat("Statistika Deskriptif Jurusan", nama_jurusan, ":\n")
cat("Mean:", round(mean_val, 2), "jam\n")
cat("Median:", round(median_val, 2), "jam\n")
cat("Variansi:", round(var_val, 2), "\n")
cat("Standar Deviasi:", round(sd_val, 2), "\n\n")
}
# Hitung statistik untuk masing-masing jurusan
hitung_statistik(Statistika, "Statistika")
## Statistika Deskriptif Jurusan Statistika :
## Mean: 7.46 jam
## Median: 7.43 jam
## Variansi: 0.78
## Standar Deviasi: 0.88
hitung_statistik(Ilmu_Komputer, "Ilmu_Komputer")
## Statistika Deskriptif Jurusan Ilmu_Komputer :
## Mean: 7.38 jam
## Median: 7.25 jam
## Variansi: 0.7
## Standar Deviasi: 0.84
hitung_statistik(Biologi, "Biologi")
## Statistika Deskriptif Jurusan Biologi :
## Mean: 6.83 jam
## Median: 6.83 jam
## Variansi: 0.92
## Standar Deviasi: 0.96
Kami menampilkan tiga histogram dalam satu baris horizontal menggunakan paramater par(mfrow = c(1, 3)) agar memudahkan perbandingan visual distribusi jam tidur antar jurusan
# Set layout untuk 3 histogram dalam satu baris
par(mfrow = c(1, 3))
# Histogram Jam Tidur Mahasiswa Jurusan Statistika
hist(Statistika, col = "lightblue",
main = "Histogram Jam Tidur\nMahasiswa Statistika",
xlab = "Jam Tidur (Jam)")
# Histogram Jam Tidur Mahasiswa Jurusan Ilmu Komputer
hist(Ilmu_Komputer, col = "lightgreen",
main = "Histogram Jam Tidur\nMahasiswa Ilmu Komputer",
xlab = "Jam Tidur (Jam)")
# Histogram Jam Tidur Mahasiswa Jurusan Biologi
hist(Biologi, col = "lightpink",
main = "Histogram Jam Tidur\nMahasiswa Biologi",
xlab = "Jam Tidur (Jam)")
# Reset layout
par(mfrow = c(1, 1))
Uji one-sample t-test ini digunakan untuk menguji apakah mahasiswa statistika tidur selama 7 jam
# Uji one-sample t-test (klaim mu = 7)
t.test(Statistika, mu = 7)
##
## One Sample t-test
##
## data: Statistika
## t = 2.8388, df = 29, p-value = 0.008188
## alternative hypothesis: true mean is not equal to 7
## 95 percent confidence interval:
## 7.127916 7.787297
## sample estimates:
## mean of x
## 7.457607
Selanjutnya, Kami melakukan uji ANOVA untuk membandingkan rata-rata jam tidur antar jurusan, dilanjutkan dengan uji Turkey untuk mengidentifikasi perbedaan secara spesifik antar kelompok, dan menampilkan boxplot.
# Uji ANOVA
anova_model <- aov(jam_tidur ~ jurusan, data = data_tidur)
summary(anova_model)
## Df Sum Sq Mean Sq F value Pr(>F)
## jurusan 2 7.08 3.541 4.441 0.0146 *
## Residuals 87 69.38 0.797
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Signifikan Lannjut TurkeyHSD
TukeyHSD(anova_model)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = jam_tidur ~ jurusan, data = data_tidur)
##
## $jurusan
## diff lwr upr p adj
## Ilmu_Komputer-Biologi 0.55147591 0.001674827 1.1012770 0.0491328
## Statistika-Biologi 0.63074419 0.080943110 1.1805453 0.0204269
## Statistika-Ilmu_Komputer 0.07926828 -0.470532796 0.6290694 0.9369781
# VISUALISASI ANOVA
boxplot(jam_tidur ~ jurusan, data = data_tidur,
col = c("lightblue", "lightgreen", "lightpink"),
main = "Perbandingan Distribusi Jam Tidur Mahasiswa per Jurusan",
xlab = "Program Studi/Jurusan",
ylab = "Jam Tidur per Malam (Jam)",
names = c("Statistika", "Ilmu Komputer", "Biologi"))
Deskriptif: Secara rata-rata, mahasiswa Statistika memiliki jam tidur yang paling lama yaitu sebesar (7,6), diikuti oleh Ilmu Komputer (7,4), dan kemudian Biologi memiliki rata-rata jam tidur paling singkat yaitu(6,8).
Visualisasi: Secara visualisasi terlihat bahwwa jam tidur mahasisawa dari ketiga jurusan berdistribusi normal.
Hipotesis: p-value < 0.05 yang artinya H0 ditolak. Artinya rata-rata jam tidur mahasiswa tidak sama dengan 7
ANOVA: Statistika vs. Biologi (p-adj = 0.020): SIGNIFIKAN. Mahasiswa Statistika tidur lebih lama dengan perbandingan rata-rata 0.63 jam lebih lama dibandingkan dengan mahasiswa Biologi.
Ilmu Komputer vs. Biologi (p-adj = 0.049): SIGNIFIKAN tepat berada di batas. Mahasiswa Ilmu Komputer ternyata juga tidur lebih lama dengan rata-rata 0.55 jam lebih lama dari mahasiswa Biologi.
Statistika vs. Ilmu Komputer (p-adj = 0.937): TIDAK SIGNIFIKAN. Tidak ada perbedaan yang signifikan antara jam tidur mahasiswa Statistika dan mahasiswa Ilmu Komputer.