Analisis Perbandingan Lama Belajar Mahasiswa Menggunakan Distribusi Gamma
Studi Kasus
Dilakukan sebuah penelitian yang bertujuan untuk mengetahui perbedaan jam belajar mahasiswa dari tiga jurusan berbeda, yaitu Matematika, Statistika, dan Aktuaria. Latar belakang penelitian ini muncul karena adanya anggapan bahwa mahasiswa dari ketiga jurusan tersebut memiliki beban dan pola belajar yang tidak sama. Untuk menguji dugaan tersebut, kami merancang penelitian dengan mengumpulkan 30 data jam belajar dari masing-masing jurusan.
Penggunaan Fungsi set.seed()
Langkah awal adalah memastikan bahwa data yang dibangkitkan dapat direplikasi dengan hasil yang konsisten. Untuk itu digunakan fungsi set.seed().
Perintah set.seed(123) digunakan untuk memastikan hasil pembangkitan data acak selalu sama setiap kali kode dijalankan. Dengan demikian, analisis yang dilakukan dapat direplikasi oleh peneliti lain dengan hasil yang konsisten.
Membangkitkan Data Menggunakan Distribusi Gamma
Tahap berikutnya adalah membangkitkan data lama belajar dari masing-masing jurusan menggunakan distribusi Gamma dengan parameter berbeda sesuai asumsi karakteristik tiap jurusan.
Memunculkan Dataset
## [1] 6.043607 11.113663 3.586611 7.858248 12.932261 8.815382 4.435582
## [8] 3.515541 11.226880 8.517757 8.637712 7.806180 6.055006 11.464958
## [15] 9.931213 7.348273 6.261090 6.920478 4.953342 7.267883 3.592034
## [22] 4.647648 4.706923 6.649098 6.713680 7.149781 9.918741 9.504475
## [29] 9.093672 7.331406
## [1] 8.701303 4.512846 7.176864 7.306530 11.933405 4.742360 9.083750
## [8] 5.323756 7.547025 6.533958 7.669393 8.667326 4.920857 3.781318
## [15] 4.869735 8.474643 9.004711 6.338884 15.764134 4.251813 8.756258
## [22] 9.231526 7.963005 10.876769 15.332907 6.370067 5.287535 5.781153
## [29] 9.809697 7.781048
## [1] 4.566009 5.985490 9.024472 10.708827 7.496117 6.034918 10.462671
## [8] 14.255022 10.941010 7.670305 9.896860 7.045199 10.041349 6.533153
## [15] 15.317817 7.140739 16.676764 8.027785 9.796150 18.128522 9.160585
## [22] 14.682026 6.786314 8.809977 11.019967 11.374048 8.049590 6.724522
## [29] 11.178136 7.907874
Data hasil pembangkitan merepresentasikan lama belajar 30 mahasiswa dari masing-masing jurusan. Mahasiswa Statistika cenderung memiliki distribusi lebih stabil, mahasiswa Matematika memiliki variasi yang sedikit lebih besar, sedangkan mahasiswa Aktuaria menunjukkan distribusi yang lebih menyebar dengan rata-rata lebih tinggi.
Penggabungan Data
Setelah dibangkitkan, ketiga kelompok data kemudian digabung menjadi satu data frame. Variabel jurusan digunakan untuk membedakan kelompok mahasiswa, sedangkan lama_belajar menyimpan nilai waktu belajar.
# Menggabungkan nilai lama belajar dari semua jurusan
lama_belajar = c(statistika, matematika, aktuaria)
jurusan = rep(c("Statistika", "Matematika", "Aktuaria"), each = 30) # Memberi label
data = data.frame(jurusan, lama_belajar) # Membuat data frame dari lama belajar dan jurusan
data
## jurusan lama_belajar
## 1 Statistika 6.043607
## 2 Statistika 11.113663
## 3 Statistika 3.586611
## 4 Statistika 7.858248
## 5 Statistika 12.932261
## 6 Statistika 8.815382
## 7 Statistika 4.435582
## 8 Statistika 3.515541
## 9 Statistika 11.226880
## 10 Statistika 8.517757
## 11 Statistika 8.637712
## 12 Statistika 7.806180
## 13 Statistika 6.055006
## 14 Statistika 11.464958
## 15 Statistika 9.931213
## 16 Statistika 7.348273
## 17 Statistika 6.261090
## 18 Statistika 6.920478
## 19 Statistika 4.953342
## 20 Statistika 7.267883
## 21 Statistika 3.592034
## 22 Statistika 4.647648
## 23 Statistika 4.706923
## 24 Statistika 6.649098
## 25 Statistika 6.713680
## 26 Statistika 7.149781
## 27 Statistika 9.918741
## 28 Statistika 9.504475
## 29 Statistika 9.093672
## 30 Statistika 7.331406
## 31 Matematika 8.701303
## 32 Matematika 4.512846
## 33 Matematika 7.176864
## 34 Matematika 7.306530
## 35 Matematika 11.933405
## 36 Matematika 4.742360
## 37 Matematika 9.083750
## 38 Matematika 5.323756
## 39 Matematika 7.547025
## 40 Matematika 6.533958
## 41 Matematika 7.669393
## 42 Matematika 8.667326
## 43 Matematika 4.920857
## 44 Matematika 3.781318
## 45 Matematika 4.869735
## 46 Matematika 8.474643
## 47 Matematika 9.004711
## 48 Matematika 6.338884
## 49 Matematika 15.764134
## 50 Matematika 4.251813
## 51 Matematika 8.756258
## 52 Matematika 9.231526
## 53 Matematika 7.963005
## 54 Matematika 10.876769
## 55 Matematika 15.332907
## 56 Matematika 6.370067
## 57 Matematika 5.287535
## 58 Matematika 5.781153
## 59 Matematika 9.809697
## 60 Matematika 7.781048
## 61 Aktuaria 4.566009
## 62 Aktuaria 5.985490
## 63 Aktuaria 9.024472
## 64 Aktuaria 10.708827
## 65 Aktuaria 7.496117
## 66 Aktuaria 6.034918
## 67 Aktuaria 10.462671
## 68 Aktuaria 14.255022
## 69 Aktuaria 10.941010
## 70 Aktuaria 7.670305
## 71 Aktuaria 9.896860
## 72 Aktuaria 7.045199
## 73 Aktuaria 10.041349
## 74 Aktuaria 6.533153
## 75 Aktuaria 15.317817
## 76 Aktuaria 7.140739
## 77 Aktuaria 16.676764
## 78 Aktuaria 8.027785
## 79 Aktuaria 9.796150
## 80 Aktuaria 18.128522
## 81 Aktuaria 9.160585
## 82 Aktuaria 14.682026
## 83 Aktuaria 6.786314
## 84 Aktuaria 8.809977
## 85 Aktuaria 11.019967
## 86 Aktuaria 11.374048
## 87 Aktuaria 8.049590
## 88 Aktuaria 6.724522
## 89 Aktuaria 11.178136
## 90 Aktuaria 7.907874
Hasil penggabungan menghasilkan satu set data dengan dua variabel: jurusan sebagai penanda kelompok mahasiswa dan lama_belajar sebagai nilai lama belajar. Struktur ini memudahkan dalam penerapan analisis perbandingan antarjurusan
Analisis pada Data
Sebelum melakukan pengujian hipotesis, langkah awal adalah menganalisis data untuk mendapatkan gambaran umum. Analisis ini mencakup “statistik deskriptif” untuk mengetahui nilai rata-rata, median, variasi, dan penyebaran data pada masing-masing jurusan. Dengan memahami karakteristik dasar data, kita dapat menentukan metode uji yang paling tepat untuk membandingkan lama belajar antarjurusan.
Statistika Deskriptif
Statistik deskriptif digunakan untuk mengetahui gambaran umum data, baik ukuran pemusatan (rata-rata, median) maupun ukuran penyebaran (standar deviasi, variansi, kuartil, dan rentang). Hal ini menjadi langkah awal sebelum masuk ke uji hipotesis.
# Statistika Deskriptif
deskriptif <- function(x) {
c(
Mean = mean(x), # Perintah untuk menghitung rata-rata
Median = median(x), # Perintah untuk menghitung nilai tengah
SD = sd(x), # Perintah untuk menghitung standar deviasi
Var = var(x), # Perintah untuk menghitung variansi
Min = min(x), # Perintah untuk mengambil nilai minimum
Q1 = quantile(x, 0.25), # Perintah untuk mengambil kuartil bawah
Q3 = quantile(x, 0.75), # Perintah untuk mengambil kuartil atas
Max = max(x) # Perintah untuk mengambil nilai maksimum
)
}
statistika_deskriptif = by(data$lama_belajar, data$jurusan, deskriptif)
statistika_deskriptif # Menerapkan fungsi deskriptif
## data$jurusan: Aktuaria
## Mean Median SD Var Min Q1.25% Q3.75% Max
## 9.714741 9.092528 3.325332 11.057832 4.566009 7.229583 11.000228 18.128522
## ------------------------------------------------------------
## data$jurusan: Matematika
## Mean Median SD Var Min Q1.25% Q3.75% Max
## 7.793153 7.608209 2.922305 8.539864 3.781318 5.438105 8.942598 15.764134
## ------------------------------------------------------------
## data$jurusan: Statistika
## Mean Median SD Var Min Q1.25% Q3.75% Max
## 7.466638 7.299645 2.496015 6.230093 3.515541 6.046457 9.024100 12.932261
Hasil statistik deskriptif menunjukkan bahwa rata-rata lama belajar mahasiswa Aktuaria lebih tinggi dibanding dua jurusan lain, disertai dengan standar deviasi yang juga lebih besar. Mahasiswa Statistika memiliki rata-rata terendah dengan sebaran data paling kecil. Mahasiswa Matematika berada di tengah-tengah baik dari segi rata-rata maupun variasi.
Analisis Variansi
Untuk menguji apakah perbedaan rata-rata lama belajar antarjurusan signifikan secara statistik, digunakan uji ANOVA.
# Buat ANOVA
anova = aov(lama_belajar ~ jurusan, data = data) # Perintah untuk menghitung ANOVA
summary(anova) # Menampilkan ringkasan ANOVA
## Df Sum Sq Mean Sq F value Pr(>F)
## jurusan 2 88.5 44.27 5.142 0.00775 **
## Residuals 87 749.0 8.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Sintaks aov(lama_belajar ~ jurusan, data = data) menyusun model ANOVA dengan variabel dependen lama_belajar dan variabel independen jurusan. Hasil model disimpan dalam objek anova. Perintah summary(anova) digunakan untuk menampilkan hasil ANOVA, termasuk nilai F dan p-value yang menentukan ada tidaknya perbedaan rata-rata antarjurusan.
Visualisasi Data
Visualisasi data dilakukan untuk mendukung analisis numerik dengan tampilan grafis yang lebih mudah dipahami. Grafik seperti “boxplot” dan “histogram” memungkinkan kita melihat distribusi, median, kuartil, serta variasi data antarjurusan. Visualisasi juga membantu mendeteksi pola atau outlier yang mungkin tidak terlihat pada tabel statistik deskriptif saja.
Visualisasi dengan Boxplot
Setelah ANOVA dilakukan, boxplot digunakan untuk memvisualisasikan perbedaan antarjurusan. Boxplot memperlihatkan median, kuartil, serta sebaran data, sehingga memudahkan dalam melihat kelompok mana yang cenderung lebih tinggi atau lebih rendah.
# Membuat boxplot
boxplot(lama_belajar ~ jurusan,
main = "Perbandingan Lama Belajar Antar Jurusan",
col = c("lightsteelblue", "lightgreen", "lightpink"),
ylab = "Jam Belajar")
Boxplot menunjukkan median lama belajar Aktuaria lebih tinggi dibanding Statistika maupun Matematika. Lebar kotak (interquartile range) pada Aktuaria juga lebih besar, menandakan variasi data yang lebih tinggi. Sebaliknya, Statistika memiliki median paling rendah dan variasi lebih sempit Hal ini memperkuat hasil deskriptif bahwa mahasiswa Aktuaria cenderung belajar lebih lama.
Visualisasi dengan Histogram
# Membuat histogram
hist(lama_belajar,
main = " Histogram Distribusi Lama Belajar Siswa",
col = "pink",
xlab = "Jam Belajar",
ylab = "Frekuensi Siswa",
border = "black")
Histogram menunjukkan distribusi data lama belajar seluruh jurusan. Bentuk distribusi condong ke kanan (right-skewed), artinya sebagian besar mahasiswa belajar dalam durasi menengah, namun ada sebagian kecil mahasiswa yang belajar jauh lebih lama. Pola ini sesuai dengan karakter distribusi Gamma.
Uji Lanjut
Setelah analisis awal dan uji ANOVA dilakukan, diperlukan uji lanjut untuk membandingkan rata-rata dua kelompok tertentu. Uji lanjut ini dilakukan agar dapat melihat apakah perbedaan signifikan yang terdeteksi oleh ANOVA terjadi antara pasangan jurusan tertentu. Salah satu metode yang digunakan adalah “t-test dua sampel independen”, yang membandingkan rata-rata lama belajar antara dua jurusan sekaligus menguji signifikansinya.
Uji Lanjut t
Sebagai tambahan, dilakukan uji t untuk membandingkan rata-rata lama belajar antara dua jurusan tertentu, yaitu Statistika dan Matematika.
# Uji Lanjut t antara jurusan Statistika dan Matematika
t.test(statistika, matematika, alternative = "two.sided", var.equal = TRUE)
##
## Two Sample t-test
##
## data: statistika and matematika
## t = -0.46534, df = 58, p-value = 0.6434
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -1.731047 1.078017
## sample estimates:
## mean of x mean of y
## 7.466638 7.793153
Hasil uji t menunjukkan p-value > 0,05, sehingga tidak terdapat perbedaan signifikan antara lama belajar mahasiswa Statistika dan Matematika. Dengan kata lain, meskipun ada variasi dalam data, secara statistik keduanya memiliki rata-rata yang hampir sama.
Kesimpulan
Berdasarkan hasil analisis, dapat ditarik beberapa poin penting:
Statistik deskriptif menunjukkan bahwa mahasiswa Aktuaria memiliki rata-rata lama belajar paling tinggi dengan variasi terbesar, sedangkan mahasiswa Statistika memiliki rata-rata terendah dengan variasi paling kecil. Mahasiswa Matematika berada di antara keduanya.
Hasil uji ANOVA menyatakan terdapat perbedaan signifikan rata-rata lama belajar antarjurusan (p-value < 0,05). Hal ini berarti jurusan memengaruhi lama belajar mahasiswa.
Visualisasi boxplot memperkuat hasil ANOVA, di mana mahasiswa Aktuaria tampak lebih banyak mengalokasikan waktu belajar dibanding dua jurusan lainnya.
Histogram menunjukkan distribusi data cenderung miring ke kanan (right-skewed), yang sesuai dengan sifat distribusi Gamma. Sebagian besar mahasiswa memiliki lama belajar pada kisaran menengah, tetapi ada sebagian kecil yang belajar jauh lebih lama.
Uji t antara jurusan Statistika dan Matematika menunjukkan tidak ada perbedaan signifikan antara keduanya (p-value > 0,05). Dengan demikian, perbedaan utama terdapat antara mahasiswa Aktuaria dengan dua jurusan lainnya.
Secara keseluruhan, dapat disimpulkan bahwa “mahasiswa Aktuaria cenderung belajar lebih lama dibanding mahasiswa Statistika maupun Matematika, dan perbedaan ini signifikan secara statistik”. Sementara itu, mahasiswa Statistika dan Matematika memiliki rata-rata lama belajar yang relatif sama.