Studi Kasus

Kelompok kami meneliti perbedaan jam tidur mahasiswa dari tiga jurusan berbeda: Statistika, Ilmu Komputer, dan Biologi. Data dibangkitkan dari distribusi normal dengan 30 data perjurusan. Kemudian, Kami menguji apakah terdapat perbedaan signifikan dalam rata-rata jam tidur antar ketiga jurusan tersebut. Kelompok kami ingin membuktikan apakah mahasiswa Statistika benar-benar tidur rata-rata 7 jam per malam seperti yang banyak diasumsikan.

1. Bangkitkan Data

Kami membangkitkan data jam tidur mahasiswa dari 3 jurusan dengan 30 mahasiswa setiap jurusan

set.seed(123)
Statistika <- rnorm(30, mean = 7.5, sd = 0.9)
Ilmu_Komputer <- rnorm(30, mean = 7.2, sd = 1.0)
Biologi <- rnorm(30, mean = 6.8, sd = 1.1)

# Gabungkan Seluruh Data
data_tidur <- data.frame(
    jam_tidur = c(Statistika, Ilmu_Komputer, Biologi),
  jurusan = factor(rep(c("Statistika", "Ilmu_Komputer", "Biologi"), each = 30)))

2. Statistika Deskriptif & Visualisasi Data

Statistik Deskriptif

Jurusan Statistika

Kami menyederhanakan perhitungan statistik deskriptif dengan menggunakan satu fungsi yang dapat digunakan berulang kali untuk ketiga jurusan untuk menghindari pengulangan kode yang tidak perlu.

# Fungsi untuk menghitung statistik deskriptif
hitung_statistik <- function(data, nama_jurusan) {
  mean_val <- mean(data)
  median_val <- median(data)
  var_val <- var(data)
  sd_val <- sd(data)
  
  cat("Statistika Deskriptif Jurusan", nama_jurusan, ":\n")
  cat("Mean:", round(mean_val, 2), "jam\n")
  cat("Median:", round(median_val, 2), "jam\n")
  cat("Variansi:", round(var_val, 2), "\n")
  cat("Standar Deviasi:", round(sd_val, 2), "\n\n")
}

# Hitung statistik untuk masing-masing jurusan
hitung_statistik(Statistika, "Statistika")
## Statistika Deskriptif Jurusan Statistika :
## Mean: 7.46 jam
## Median: 7.43 jam
## Variansi: 0.78 
## Standar Deviasi: 0.88
hitung_statistik(Ilmu_Komputer, "Ilmu_Komputer")
## Statistika Deskriptif Jurusan Ilmu_Komputer :
## Mean: 7.38 jam
## Median: 7.25 jam
## Variansi: 0.7 
## Standar Deviasi: 0.84
hitung_statistik(Biologi, "Biologi")
## Statistika Deskriptif Jurusan Biologi :
## Mean: 6.83 jam
## Median: 6.83 jam
## Variansi: 0.92 
## Standar Deviasi: 0.96

Visualisasi Data

Kami menampilkan tiga histogram dalam satu baris horizontal menggunakan paramater par(mfrow = c(1, 3)) agar memudahkan perbandingan visual distribusi jam tidur antar jurusan

# Set layout untuk 3 histogram dalam satu baris
par(mfrow = c(1, 3))

# Histogram Jam Tidur Mahasiswa Jurusan Statistika
hist(Statistika, col = "lightblue", 
     main = "Histogram Jam Tidur\nMahasiswa Statistika",
     xlab = "Jam Tidur (Jam)")

# Histogram Jam Tidur Mahasiswa Jurusan Ilmu Komputer
hist(Ilmu_Komputer, col = "lightgreen", 
     main = "Histogram Jam Tidur\nMahasiswa Ilmu Komputer", 
     xlab = "Jam Tidur (Jam)")

# Histogram Jam Tidur Mahasiswa Jurusan Biologi
hist(Biologi, col = "lightpink", 
     main = "Histogram Jam Tidur\nMahasiswa Biologi", 
     xlab = "Jam Tidur (Jam)")

# Reset layout
par(mfrow = c(1, 1))

3. Uji Hipotesis Tambahan

Uji one-sample t-test ini digunakan untuk menguji apakah mahasiswa statistika tidur selama 7 jam

# Uji one-sample t-test (klaim mu = 7)
t.test(Statistika, mu = 7)
## 
##  One Sample t-test
## 
## data:  Statistika
## t = 2.8388, df = 29, p-value = 0.008188
## alternative hypothesis: true mean is not equal to 7
## 95 percent confidence interval:
##  7.127916 7.787297
## sample estimates:
## mean of x 
##  7.457607

4. ANOVA (k populasi)

Selanjutnya, Kami melakukan uji ANOVA untuk membandingkan rata-rata jam tidur antar jurusan, dilanjutkan dengan uji Turkey untuk mengidentifikasi perbedaan secara spesifik antar kelompok, dan menampilkan boxplot.

# Uji ANOVA
anova_model <- aov(jam_tidur ~ jurusan, data = data_tidur)
summary(anova_model)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## jurusan      2   7.08   3.541   4.441 0.0146 *
## Residuals   87  69.38   0.797                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Signifikan Lannjut TurkeyHSD
TukeyHSD(anova_model)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = jam_tidur ~ jurusan, data = data_tidur)
## 
## $jurusan
##                                diff          lwr       upr     p adj
## Ilmu_Komputer-Biologi    0.55147591  0.001674827 1.1012770 0.0491328
## Statistika-Biologi       0.63074419  0.080943110 1.1805453 0.0204269
## Statistika-Ilmu_Komputer 0.07926828 -0.470532796 0.6290694 0.9369781
# VISUALISASI ANOVA
boxplot(jam_tidur ~ jurusan, data = data_tidur,
        col = c("lightblue", "lightgreen", "lightpink"),
        main = "Perbandingan Distribusi Jam Tidur Mahasiswa per Jurusan", 
        xlab = "Program Studi/Jurusan", 
        ylab = "Jam Tidur per Malam (Jam)",
        names = c("Statistika", "Ilmu Komputer", "Biologi"))

5. Interpretasi

Deskriptif: Secara rata-rata, mahasiswa Statistika memiliki jam tidur yang paling lama yaitu sebesar (7,6), diikuti oleh Ilmu Komputer (7,4), dan kemudian Biologi memiliki rata-rata jam tidur paling singkat yaitu(6,8).

Visualisasi: Secara visualisasi terlihat bahwwa jam tidur mahasisawa dari ketiga jurusan berdistribusi normal.

Hipotesis: p-value < 0.05 yang artinya H0 ditolak. Artinya rata-rata jam tidur mahasiswa tidak sama dengan 7

ANOVA: Statistika vs. Biologi (p-adj = 0.020): SIGNIFIKAN. Mahasiswa Statistika tidur lebih lama dengan perbandingan rata-rata 0.63 jam lebih lama dibandingkan dengan mahasiswa Biologi.

Ilmu Komputer vs. Biologi (p-adj = 0.049): SIGNIFIKAN tepat berada di batas. Mahasiswa Ilmu Komputer ternyata juga tidur lebih lama dengan rata-rata 0.55 jam lebih lama dari mahasiswa Biologi.

Statistika vs. Ilmu Komputer (p-adj = 0.937): TIDAK SIGNIFIKAN. Tidak ada perbedaan yang signifikan antara jam tidur mahasiswa Statistika dan mahasiswa Ilmu Komputer.