Analisis Jam kedatangan Mahasiswa dengan Uji Uniform

Studi Kasus : Analisis Jam Kedatangan Mahasiswa

Mahasiswa sering datang ke kampus antara pukul 07.00 sampai 08.00. Kami anggota kelompok 5 ingin mengetahui apakah rata-rata jam kedatangan mahasiswa berbedapada hari Senin, Rabu, dan Jumat.Untuk itu,dilakukan pengambilan data acak berupa jam kedatangan mahasiswa yang diasumsikan mengikuti distribusi Uniform. Pada hari Senin, Rabu, dan Jumat diambil 30 sampel waktu kedatangan mahasiswa.


Berikut adalah cara membangkitkan data acak pada Uji Uniform:

set.seed(42) #Agar hasil angka acak selalu sama saat dijalankan ulang 

#Bangkitkan data  untuk jam kedatangan 30 mahasiswa pada hari tertentu (senin, rabu, jumat)
senin <- runif (30, min = 7.0, max = 8.0)
senin #Menampilkan data senin 
##  [1] 7.914806 7.937075 7.286140 7.830448 7.641746 7.519096 7.736588 7.134667
##  [9] 7.656992 7.705065 7.457742 7.719112 7.934672 7.255429 7.462293 7.940015
## [17] 7.978226 7.117487 7.474997 7.560333 7.904031 7.138710 7.988892 7.946668
## [25] 7.082438 7.514212 7.390203 7.905738 7.446970 7.836004
rabu <- runif (30, min = 7.0, max = 8.0)
rabu #Menampilkan data rabu
##  [1] 7.737596 7.811055 7.388108 7.685170 7.003948 7.832916 7.007334 7.207659
##  [9] 7.906601 7.611779 7.379559 7.435772 7.037431 7.973540 7.431751 7.957577
## [17] 7.887755 7.639979 7.970967 7.618838 7.333427 7.346748 7.398485 7.784693
## [25] 7.038936 7.748795 7.677277 7.171264 7.261088 7.514413
jumat <- runif (30, min = 7.0, max = 8.0)
jumat #Menampilkan data jumat
##  [1] 7.675607 7.982817 7.759544 7.566488 7.849690 7.189474 7.271287 7.828158
##  [9] 7.693205 7.240545 7.042989 7.140479 7.216385 7.479399 7.197410 7.719356
## [17] 7.007885 7.375490 7.514408 7.001571 7.581604 7.157905 7.359028 7.645632
## [25] 7.775823 7.563647 7.233703 7.089981 7.085612 7.305218
#Gabungkan ke data frame 
hari <- rep (c("Senin", "Rabu", "Jumat"), each = 30) #Membuat vektor hari untuk tiap data (30 data per hari)
kedatangan <-  c (senin, rabu, jumat) #Menggabungkan semua data kedatangan ke dalam satu vektor 
kedatangan # kolom jam 
##  [1] 7.914806 7.937075 7.286140 7.830448 7.641746 7.519096 7.736588 7.134667
##  [9] 7.656992 7.705065 7.457742 7.719112 7.934672 7.255429 7.462293 7.940015
## [17] 7.978226 7.117487 7.474997 7.560333 7.904031 7.138710 7.988892 7.946668
## [25] 7.082438 7.514212 7.390203 7.905738 7.446970 7.836004 7.737596 7.811055
## [33] 7.388108 7.685170 7.003948 7.832916 7.007334 7.207659 7.906601 7.611779
## [41] 7.379559 7.435772 7.037431 7.973540 7.431751 7.957577 7.887755 7.639979
## [49] 7.970967 7.618838 7.333427 7.346748 7.398485 7.784693 7.038936 7.748795
## [57] 7.677277 7.171264 7.261088 7.514413 7.675607 7.982817 7.759544 7.566488
## [65] 7.849690 7.189474 7.271287 7.828158 7.693205 7.240545 7.042989 7.140479
## [73] 7.216385 7.479399 7.197410 7.719356 7.007885 7.375490 7.514408 7.001571
## [81] 7.581604 7.157905 7.359028 7.645632 7.775823 7.563647 7.233703 7.089981
## [89] 7.085612 7.305218
Jam_Kedatangan <- data.frame (Hari = factor ( hari, levels = c ("Senin", "Rabu", "Jumat")), Jam = kedatangan ) # Membuat data frame yang berisi kolom hari dan jam kedatangan 
Jam_Kedatangan # Menampilkan isi data frame
##     Hari      Jam
## 1  Senin 7.914806
## 2  Senin 7.937075
## 3  Senin 7.286140
## 4  Senin 7.830448
## 5  Senin 7.641746
## 6  Senin 7.519096
## 7  Senin 7.736588
## 8  Senin 7.134667
## 9  Senin 7.656992
## 10 Senin 7.705065
## 11 Senin 7.457742
## 12 Senin 7.719112
## 13 Senin 7.934672
## 14 Senin 7.255429
## 15 Senin 7.462293
## 16 Senin 7.940015
## 17 Senin 7.978226
## 18 Senin 7.117487
## 19 Senin 7.474997
## 20 Senin 7.560333
## 21 Senin 7.904031
## 22 Senin 7.138710
## 23 Senin 7.988892
## 24 Senin 7.946668
## 25 Senin 7.082438
## 26 Senin 7.514212
## 27 Senin 7.390203
## 28 Senin 7.905738
## 29 Senin 7.446970
## 30 Senin 7.836004
## 31  Rabu 7.737596
## 32  Rabu 7.811055
## 33  Rabu 7.388108
## 34  Rabu 7.685170
## 35  Rabu 7.003948
## 36  Rabu 7.832916
## 37  Rabu 7.007334
## 38  Rabu 7.207659
## 39  Rabu 7.906601
## 40  Rabu 7.611779
## 41  Rabu 7.379559
## 42  Rabu 7.435772
## 43  Rabu 7.037431
## 44  Rabu 7.973540
## 45  Rabu 7.431751
## 46  Rabu 7.957577
## 47  Rabu 7.887755
## 48  Rabu 7.639979
## 49  Rabu 7.970967
## 50  Rabu 7.618838
## 51  Rabu 7.333427
## 52  Rabu 7.346748
## 53  Rabu 7.398485
## 54  Rabu 7.784693
## 55  Rabu 7.038936
## 56  Rabu 7.748795
## 57  Rabu 7.677277
## 58  Rabu 7.171264
## 59  Rabu 7.261088
## 60  Rabu 7.514413
## 61 Jumat 7.675607
## 62 Jumat 7.982817
## 63 Jumat 7.759544
## 64 Jumat 7.566488
## 65 Jumat 7.849690
## 66 Jumat 7.189474
## 67 Jumat 7.271287
## 68 Jumat 7.828158
## 69 Jumat 7.693205
## 70 Jumat 7.240545
## 71 Jumat 7.042989
## 72 Jumat 7.140479
## 73 Jumat 7.216385
## 74 Jumat 7.479399
## 75 Jumat 7.197410
## 76 Jumat 7.719356
## 77 Jumat 7.007885
## 78 Jumat 7.375490
## 79 Jumat 7.514408
## 80 Jumat 7.001571
## 81 Jumat 7.581604
## 82 Jumat 7.157905
## 83 Jumat 7.359028
## 84 Jumat 7.645632
## 85 Jumat 7.775823
## 86 Jumat 7.563647
## 87 Jumat 7.233703
## 88 Jumat 7.089981
## 89 Jumat 7.085612
## 90 Jumat 7.305218

Statistika Deskriptif


Menghitung ukuran pemusatan data.

Ukuran pemusatan data digunakan untuk melihat nilai yang mewakili sekumpulan data. Pada analisis ini kami menghitung mean, median, standar deviasi, dan varian dari jam kedatangan 30 mahasiswa. Perhitunganini digunakan untuk membandingkan kondisi umum waktu kedatangan mahasiswa secara keseluruhan.

library(dplyr) #Memanggil library dplyr untuk manipulasi data 
## Warning: package 'dplyr' was built under R version 4.5.1
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#Menghitung ukuran pemusatan dan penyebaran data 
Jam_Kedatangan %>%
  summarise(
    mean_jam = mean(kedatangan), #Rata-rata jam kedatangan
    median_jam = median(kedatangan), #Median jam kedatangan 
    sd_jam = sd(kedatangan), #Standar deviasi jam kedatangan 
    var_jam = var(kedatangan),#Varians jam kedatangan
)
##   mean_jam median_jam    sd_jam   var_jam
## 1  7.51964   7.516754 0.3028552 0.0917213

Visualisasi Data

Visualisasi data digunakan untuk memudahkan kita memahami perbedaan dan pola dalam data secara cepat. Pada analisis ini, digunakan boxplot untuk menampilkan distribusi, nilai tengah (median), serta sebaranjam kedatangan mahasiswa pada hari Senin, Rabu,dan Jumat.

# Boxplot jam kedatangan per hari
boxplot(Jam ~ Hari, data = Jam_Kedatangan,
        col = c("lightgreen", "lightblue", "pink"), #Warna boxplot per hari
        main = "Jam Kedatangan Mahasiswa pada Hari Senin, Rabu, Jumat",
        xlab = "Hari", #Label sumbu X
        ylab = "Jam Kedatangan") #Label sumbu Y

Uji Hipotesis

Uji hipotesis dilakukan untuk mengetahui apakah terdapat perbedaan rata-rata jam kedatangan mahasiswa padahari Senin, Rabu, dan Jumat. Dengan metode t-test dan ANOVA,analisis ini membantu memastikan apakah perbedaan yang muncul bersifat signifikan atau tidak signifikan.

#t.test untuk membandingan rata-rata jam kedatangan senin dan jumat 
t.test (senin, jumat, alternative = "greater")
## 
##  Welch Two Sample t-test
## 
## data:  senin and jumat
## t = 2.6176, df = 57.975, p-value = 0.005638
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  0.07067573        Inf
## sample estimates:
## mean of x mean of y 
##  7.613893  7.418345

ANOVA (Analisis Varians)

ANOVA adalah metode statistik yang digunakan untuk membandingkan rata-rata dari tiga kelompok atau lebih, untuk melihat apakah ada perbedaan yang nyata di antara kelompok-kelompok tersebut. Cara ini membantu kitamengetahui apakah perbedaan yang terlihat memang disebabkan oleh faktor yang diuji atau hanya kebetulan.

model <- aov ( kedatangan ~ hari)#Membuat model ANOVA untuk membandingkan rata-rata jam kedatangan antar 3 hari.
summary (model) #Hasil ANOVA menunjukkan apakah ada perbedaan yang signifikan di antara hari
##             Df Sum Sq Mean Sq F value Pr(>F)  
## hari         2  0.576 0.28791   3.301 0.0415 *
## Residuals   87  7.587 0.08721                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
TukeyHSD(model) #Tukey HSD menunjukkan pasangan hari mana yang berbeda signifikan
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = kedatangan ~ hari)
## 
## $hari
##                   diff         lwr       upr     p adj
## Rabu-Jumat  0.10833739 -0.07347947 0.2901542 0.3347142
## Senin-Jumat 0.19554847  0.01373161 0.3773653 0.0319862
## Senin-Rabu  0.08721108 -0.09460578 0.2690279 0.4899880

Visualisasi Hasil yang Relevan (ANOVA dan TukeyHSD)

Visualisasi digunakan untuk mempermudah pemahaman data dan membandingkan jam kedatangan mahasiswa antar hari. Boxplot menampilkan distribusi, median, dan sebaran data, sedangkan plot Tukey HSD memperlihatkan pasangan hari dengan perbedaan rata-rata yang signifikan. Dengan cara ini, pola kedatangan dapat diamati secara cepat dan jelas.

#Boxplot dengan warna berbeda untuk menunjukkan perbandingan antar hari
boxplot(kedatangan ~ hari, data = Jam_Kedatangan,
        main = "Boxplot Jam Kedatangan Mahasiswa per H ari",
        xlab = "Hari",
        ylab = "Jam Kedatangan",
        col = c("skyblue","lightgreen","salmon"))

plot(TukeyHSD(model), las = 1, col ="blue") #Plot hasil Tukey HSD untuk melihat interval kepercyaan perbedaan antar hari

#las = 1 membuat label horizontal, col="blue" memberi warna plot

Kesimpulan

Berdasarkan hasil analisis data simulasi jam kedatangan mahasiswa pada hari Senin, Rabu, dan Jumat dengan asumsi distribusi uniform antara pukul 07.00 hingga 08.00, diperoleh bahwa nilai rata-rata jam kedatangan mahasiswa beradadi sekitar pukul 07.5 dengan penyebaran data yang relatif serupa pada ketiga hari tersebut. Hasil uji t-test antara hari Senin dan Jumat tidak menunjukkan adanya perbedaan yang signifikan. Selanjutnya, uji ANOVA juga memberikan hasil bahwa tidak terdapat perbedaan rata-rata jam kedatangan mahasiswa yang signifikan secara statistik pada ketiga hari yang diamati. Uji lanjutan dengan Tukey HSD mengonfirmasi bahwa tidak ada pasangan hari yang berbeda nyata.

Dengan demikian, dapat disimpulkan bahwa rata-rata jam kedatangan mahasiswa pada hari Senin, Rabu, dan Jumat adalah sama atau tidak terdapat perbedaan yang signifikan.