Analisis Perbandingan Nilai Akhir Siswa Laki-laki dan Perempuan Menggunakan Two Sample t-test

1. Penjelasan Data

Dataset yang digunakan adalah “Student Performance Data” dari UCI Machine Learning Repository url : https://archive.ics.uci.edu/dataset/320/student+performance , yang berisi informasi tentang siswa dan nilai mereka dalam mata pelajaran Matematika. Data ini digunakan untuk membandingkan rata-rata nilai akhir (G3) antara siswa laki-laki dan perempuan.

# Memuat data dari file CSV
data <- read.csv("D:/SEMESTER 3/Komputasi Statistika/pertemuan 4/student+performance/student/student-mat.csv", sep = ";")
head(data)
##   school sex age address famsize Pstatus Medu Fedu     Mjob     Fjob     reason
## 1     GP   F  18       U     GT3       A    4    4  at_home  teacher     course
## 2     GP   F  17       U     GT3       T    1    1  at_home    other     course
## 3     GP   F  15       U     LE3       T    1    1  at_home    other      other
## 4     GP   F  15       U     GT3       T    4    2   health services       home
## 5     GP   F  16       U     GT3       T    3    3    other    other       home
## 6     GP   M  16       U     LE3       T    4    3 services    other reputation
##   guardian traveltime studytime failures schoolsup famsup paid activities
## 1   mother          2         2        0       yes     no   no         no
## 2   father          1         2        0        no    yes   no         no
## 3   mother          1         2        3       yes     no  yes         no
## 4   mother          1         3        0        no    yes  yes        yes
## 5   father          1         2        0        no    yes  yes         no
## 6   mother          1         2        0        no    yes  yes        yes
##   nursery higher internet romantic famrel freetime goout Dalc Walc health
## 1     yes    yes       no       no      4        3     4    1    1      3
## 2      no    yes      yes       no      5        3     3    1    1      3
## 3     yes    yes      yes       no      4        3     2    2    3      3
## 4     yes    yes      yes      yes      3        2     2    1    1      5
## 5     yes    yes       no       no      4        3     2    1    2      5
## 6     yes    yes      yes       no      5        4     2    1    2      5
##   absences G1 G2 G3
## 1        6  5  6  6
## 2        4  5  5  6
## 3       10  7  8 10
## 4        2 15 14 15
## 5        4  6 10 10
## 6       10 15 15 15
# Mnyiapan data untuk melakukan uji t
male_students <- subset(data, sex == "M")$G3
female_students <- subset(data, sex == "F")$G3
male_students
##   [1] 15 11 19 15 14 11 16  5 10 15 15 16 12 11 15 11 11 12 17 16 12 15 18 15 12
##  [26] 18 11 20 14 10 15  9 12 15 10 14 10 10 10 12 11 15 10  7 14 15  5 17 14 18
##  [51] 18 13 19 19  9 16 14 13  8 13 15 13 12  0 18  0  0 12  0  9  0  0 10  0 14
##  [76]  0  8 13 15 12  0  7  0 10  7 12 10  0 16 10  9  6  9 11  8 12 11 11 15 10
## [101]  8 10 14 16 10 13  8  8 13 12  9 11  9 13  6 10 13  0 12 12  0 12 18 13  8
## [126]  5 15  8 10  8  8 12  8 11 14  8 12 17 10 10 14  9 10  8 10 11 14 15 11 14
## [151] 11 16 10 13 18  8 12 11 11 16 10  8  0 15 16  9 13  8 13  8  8 11 10 12 10
## [176] 13 12 14  7 10  0  5  9 16  7 10  9
female_students
##   [1]  6  6 10 15 10  6  9 12 14 14 10  8  8  6 11 13 11  9  6 11  7 13 13 11 13
##  [26] 10 15 16 11 11  9  9 10 15  6  8 16  5 11 11  5  6 10  8  6 14  8 18  6 10
##  [51] 10 10 14  8  6 11  8 16 10 13 15 13  8 11  9  0  0 12 11  0  0 15 11 13 11
##  [76]  0 11 10 12 10 16  0 14  0  9 11 17  8 12  9 13  9 15 18 10 16 10 10  6 11
## [101]  9  7 13 10  7  8 14 10 15  4  8 10  6  0 17 14  7 15 12 14 12 11  0 13  0
## [126] 18  9  0 11  0  9 14 11 10 12  9  8 12 10 11 19 12 15 13 18  0  8 14 11 14
## [151] 18 12 10  0 13 11 13 11  0  9 10 11 13  9 11 15 15  9 14 14  0  0  0 15 13
## [176]  0 17 10 11  0 10 14 15  9 13 11 16 13 10 15 12  0 10 11  9 11  5 19 10 15
## [201] 10 15 10 10  6  0  8  0
summary(male_students)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    9.00   11.00   10.91   14.00   20.00
summary(female_students)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   8.000  10.000   9.966  13.000  19.000

2. Metode yang Digunakan

Uji hipotesis yang digunakan adalah Two Sample t-test untuk melihat apakah terdapat perbedaan signifikan dalam rata-rata nilai akhir antara dua kelompok siswa berdasarkan jenis kelamin dengan interval kepercayaan ssebesar 95% atau dengan alpha 0,05%.

Perumusan Hipotesis

    H0 : μ1 = μ2  -> tidak terdapat perbedaan signifikan antara rata rata nilai akhir kelompok siswa laki laki dan perempuan
    H0 : μ1 ≠ μ2  -> terdapat perbedaan signifikan antara rata rata nilai akhir kelompok siswa laki laki dan perempuan
    

3. Hasil Analisis

# Melakukan two sample t-test
t_test_result <- t.test(male_students, female_students, var.equal = TRUE)
print(t_test_result)
## 
##  Two Sample t-test
## 
## data:  male_students and female_students
## t = 2.062, df = 393, p-value = 0.03987
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.04412838 1.85205632
## sample estimates:
## mean of x mean of y 
## 10.914439  9.966346

Kriteria pengujian

kriteria uji dengan alpha = 0,05
Tolak H0 jika t hitung < - t table atau t hitung > t tabel
df = n - 1 = 393 - 1 = 392

Pengambilan Keputusan

Dengan alpha 0,05, didapatkan kriteria uji 2 ekor:
tolak H0 jika t hitung < - 1.965 atau t hitung > 1.965
karena t hitung = 0.03987 bernilai kurang dari t table
(tidak terletak wil penolakan) maka H0 gagal di tolak.

4. Kesimpulan

Hasil dari two sample t-test adalah sebagai berikut:pada tingkat signifikasnsi 5%, pernyataan tsb belum dapat di yakini kebenarannya. Dengan kata lain, tidak terdapat perbedaan antara rata rata nilai akhir laki laki dengan perempuan.