Dataset yang digunakan adalah “Student Performance Data” dari UCI Machine Learning Repository url : https://archive.ics.uci.edu/dataset/320/student+performance , yang berisi informasi tentang siswa dan nilai mereka dalam mata pelajaran Matematika. Data ini digunakan untuk membandingkan rata-rata nilai akhir (G3) antara siswa laki-laki dan perempuan.
# Memuat data dari file CSV
data <- read.csv("D:/SEMESTER 3/Komputasi Statistika/pertemuan 4/student+performance/student/student-mat.csv", sep = ";")
head(data)
## school sex age address famsize Pstatus Medu Fedu Mjob Fjob reason
## 1 GP F 18 U GT3 A 4 4 at_home teacher course
## 2 GP F 17 U GT3 T 1 1 at_home other course
## 3 GP F 15 U LE3 T 1 1 at_home other other
## 4 GP F 15 U GT3 T 4 2 health services home
## 5 GP F 16 U GT3 T 3 3 other other home
## 6 GP M 16 U LE3 T 4 3 services other reputation
## guardian traveltime studytime failures schoolsup famsup paid activities
## 1 mother 2 2 0 yes no no no
## 2 father 1 2 0 no yes no no
## 3 mother 1 2 3 yes no yes no
## 4 mother 1 3 0 no yes yes yes
## 5 father 1 2 0 no yes yes no
## 6 mother 1 2 0 no yes yes yes
## nursery higher internet romantic famrel freetime goout Dalc Walc health
## 1 yes yes no no 4 3 4 1 1 3
## 2 no yes yes no 5 3 3 1 1 3
## 3 yes yes yes no 4 3 2 2 3 3
## 4 yes yes yes yes 3 2 2 1 1 5
## 5 yes yes no no 4 3 2 1 2 5
## 6 yes yes yes no 5 4 2 1 2 5
## absences G1 G2 G3
## 1 6 5 6 6
## 2 4 5 5 6
## 3 10 7 8 10
## 4 2 15 14 15
## 5 4 6 10 10
## 6 10 15 15 15
# Mnyiapan data untuk melakukan uji t
male_students <- subset(data, sex == "M")$G3
female_students <- subset(data, sex == "F")$G3
male_students
## [1] 15 11 19 15 14 11 16 5 10 15 15 16 12 11 15 11 11 12 17 16 12 15 18 15 12
## [26] 18 11 20 14 10 15 9 12 15 10 14 10 10 10 12 11 15 10 7 14 15 5 17 14 18
## [51] 18 13 19 19 9 16 14 13 8 13 15 13 12 0 18 0 0 12 0 9 0 0 10 0 14
## [76] 0 8 13 15 12 0 7 0 10 7 12 10 0 16 10 9 6 9 11 8 12 11 11 15 10
## [101] 8 10 14 16 10 13 8 8 13 12 9 11 9 13 6 10 13 0 12 12 0 12 18 13 8
## [126] 5 15 8 10 8 8 12 8 11 14 8 12 17 10 10 14 9 10 8 10 11 14 15 11 14
## [151] 11 16 10 13 18 8 12 11 11 16 10 8 0 15 16 9 13 8 13 8 8 11 10 12 10
## [176] 13 12 14 7 10 0 5 9 16 7 10 9
female_students
## [1] 6 6 10 15 10 6 9 12 14 14 10 8 8 6 11 13 11 9 6 11 7 13 13 11 13
## [26] 10 15 16 11 11 9 9 10 15 6 8 16 5 11 11 5 6 10 8 6 14 8 18 6 10
## [51] 10 10 14 8 6 11 8 16 10 13 15 13 8 11 9 0 0 12 11 0 0 15 11 13 11
## [76] 0 11 10 12 10 16 0 14 0 9 11 17 8 12 9 13 9 15 18 10 16 10 10 6 11
## [101] 9 7 13 10 7 8 14 10 15 4 8 10 6 0 17 14 7 15 12 14 12 11 0 13 0
## [126] 18 9 0 11 0 9 14 11 10 12 9 8 12 10 11 19 12 15 13 18 0 8 14 11 14
## [151] 18 12 10 0 13 11 13 11 0 9 10 11 13 9 11 15 15 9 14 14 0 0 0 15 13
## [176] 0 17 10 11 0 10 14 15 9 13 11 16 13 10 15 12 0 10 11 9 11 5 19 10 15
## [201] 10 15 10 10 6 0 8 0
summary(male_students)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 9.00 11.00 10.91 14.00 20.00
summary(female_students)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 8.000 10.000 9.966 13.000 19.000
Uji hipotesis yang digunakan adalah Two Sample t-test untuk melihat apakah terdapat perbedaan signifikan dalam rata-rata nilai akhir antara dua kelompok siswa berdasarkan jenis kelamin dengan interval kepercayaan ssebesar 95% atau dengan alpha 0,05%.
H0 : μ1 = μ2 -> tidak terdapat perbedaan signifikan antara rata rata nilai akhir kelompok siswa laki laki dan perempuan
H0 : μ1 ≠ μ2 -> terdapat perbedaan signifikan antara rata rata nilai akhir kelompok siswa laki laki dan perempuan
# Melakukan two sample t-test
t_test_result <- t.test(male_students, female_students, var.equal = TRUE)
print(t_test_result)
##
## Two Sample t-test
##
## data: male_students and female_students
## t = 2.062, df = 393, p-value = 0.03987
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.04412838 1.85205632
## sample estimates:
## mean of x mean of y
## 10.914439 9.966346
kriteria uji dengan alpha = 0,05
Tolak H0 jika t hitung < - t table atau t hitung > t tabel
df = n - 1 = 393 - 1 = 392
Dengan alpha 0,05, didapatkan kriteria uji 2 ekor:
tolak H0 jika t hitung < - 1.965 atau t hitung > 1.965
karena t hitung = 0.03987 bernilai kurang dari t table
(tidak terletak wil penolakan) maka H0 gagal di tolak.
Hasil dari two sample t-test adalah sebagai berikut:pada tingkat signifikasnsi 5%, pernyataan tsb belum dapat di yakini kebenarannya. Dengan kata lain, tidak terdapat perbedaan antara rata rata nilai akhir laki laki dengan perempuan.