Latihan Uji Chi Square dan Non-Parametrik

Author

Rena Oktaviyani - I3502241016

MK Statistika untuk ilmu-ilmu Sosial dan Perilaku (STAT1517)

Latihan Uji Chi Square dan Non-Parametrik

1. Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

Jawaban:

Uji yang digunakan: Uji Chi-Square Goodness of Fit

Hipotesis:

H₀ (nol): Distribusi jumlah kelahiran per hari selama satu minggu adalah seragam.

H₁ (alternatif): Distribusi jumlah kelahiran per hariselama satu minggu tidak seragam.

# Data jumlah kelahiran per hari selama satu minggu
kelahiran <- c(345, 370, 360, 342, 356, 330, 310)

# Uji Chi-Square untuk distribusi seragam
chisq.test(x = kelahiran, p = rep(1/length(kelahiran), length(kelahiran)))

    Chi-squared test for given probabilities

data:  kelahiran
X-squared = 7.0477, df = 6, p-value = 0.3165

Nilai p-value > 0,05, maka gagal menolak hipotesis nol. Dengan demikian, tidak terdapat bukti yang cukup untuk menyatakan bahwa distribusi jumlah kelahiran per hari selama satu minggu berbeda dari distribusi seragam.

2. Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

Jawaban:

Uji yang digunakan: Uji Chi-Square Goodness of Fit

Hipotesis:

H₀: Pemilih memilih keempat kandidat secara merata.

H₁: Pemilih tidak memilih keempat kandidat secara merata.

# Data jumlah pemilih untuk 4 kandidat
pemilih <- c(260, 240, 300, 200)

# Uji Chi-Square untuk distribusi seragam
chisq.test(x = pemilih, p = rep(1/length(pemilih), length(pemilih)))

    Chi-squared test for given probabilities

data:  pemilih
X-squared = 20.8, df = 3, p-value = 0.0001158

Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat. Dengan kata lain, terdapat perbedaan yang signifikan dalam jumlah suara yang diterima oleh masing-masing kandidat.

3. Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

Jawaban:

Uji yang digunakan: Uji Chi-Square Goodness of Fit

Hipotesis:

H₀ (nol): Tidak ada preferensi warna mobil di kampus.

H₁ (alternatif): Ada preferensi warna mobil di kampus.

# Data warna mobil
warna <- c(90, 60, 50, 40)

# Uji Chi-Square untuk distribusi seragam
chisq.test(x = warna, p = rep(1/length(warna), length(warna)))

    Chi-squared test for given probabilities

data:  warna
X-squared = 23.333, df = 3, p-value = 3.441e-05

Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat preferensi yang signifikan terhadap warna mobil di lingkungan kampus, menunjukkan bahwa pemilihan warna mobil tidak terjadi secara seragam.

4. Gunakan data di bawah ini

Gender Suka_Film_A Suka_Film_B
Laki-Laki 60 40
Perempuan 50 70

Apakah jenis kelamin berpengaruh terhadap preferensi film?

Jawaban:

Uji yang digunakan: Uji Chi-Square untuk Independensi

Hipotesis:

H₀:Jenis kelamin tidak berpengaruh terhadap preferensi film.

H₁:Jenis kelamin berpengaruh terhadap preferensi film.

# Membuat matriks kontingensi
tabel <- matrix(c(60, 40, 50, 70), nrow = 2, byrow = TRUE)

colnames(tabel) <- c("Suka Film A", "Suka Film B")
rownames(tabel) <- c("Laki-Laki", "Perempuan")

# Menampilkan tabel
tabel
          Suka Film A Suka Film B
Laki-Laki          60          40
Perempuan          50          70
chisq.test(tabel)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel
X-squared = 6.6183, df = 1, p-value = 0.01009

Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa jenis kelamin berpengaruh terhadap preferensi film.

5. Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:

Prodi Kost Rumah_Orang_Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10

Jawaban:

Uji yang digunakan: Uji Chi-Square untuk Independensi

Hipotesis:

H₀:Tidak ada hubungan antara program studi dan tempat tinggal mahasiswa.

H₁:Ada hubungan antara program studi dan tempat tinggal mahasiswa.

# Membuat matriks kontingensi
tabel <- matrix(c(20, 10, 5, 15, 20, 10, 10, 25, 10), nrow = 3, byrow = TRUE)

colnames(tabel) <- c("Kost", "Rumah Orang Tua", "Asrama")
rownames(tabel) <- c("Statistik", "Komputer", "Ekonomi")

# Menampilkan tabel
tabel
          Kost Rumah Orang Tua Asrama
Statistik   20              10      5
Komputer    15              20     10
Ekonomi     10              25     10
chisq.test(tabel)

    Pearson's Chi-squared test

data:  tabel
X-squared = 10.863, df = 4, p-value = 0.02815

Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat hubungan antara program studi dan tempat tinggal mahasiswa.

6. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Sign Test

Jawaban:

Diketahui:

• Jumlah meningkat (positif) = 24

• Jumlah menurun (negatif) = 8

• (yang tetap = 3, diabaikan)

• Jadi total n = 32.

Hipotesis:

H₀:Tidak ada perbedaan signifikan dalam nilai setelah kursus.

H₁:Ada perbedaan signifikan dalam nilai setelah kursus.

library(BSDA)

SIGN.test(x = 24, n = 32, alternative = "two.sided")

    One-sample Sign-Test

data:  24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
 24 24
sample estimates:
median of x 
         24 

Karena p-value = 1, maka tidak ada bukti statistik yang cukup untuk menyimpulkan bahwa terdapat perbedaan signifikan dalam nilai siswa sebelum dan sesudah mengikuti kursus.

7. Gunakan Wilcoxon:

• Skor sebelum pelatihan: 75, 70, 68, 72, 69

• Skor sesudah: 78, 74, 70, 75, 72

Jawaban:

Hipotesis:

H₀:Tidak ada perbedaan signifikan antara skor sebelum dan sesudah pelatihan.

H₁:Ada perbedaan signifikan antara skor sebelum dan sesudah pelatihan.

# Data observasi
sebelum <- c(75, 70, 68, 72, 69)
sesudah <- c(78, 74, 70, 75, 72)

wilcox.test(sebelum, sesudah, paired = TRUE, exact = FALSE)

    Wilcoxon signed rank test with continuity correction

data:  sebelum and sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0

Nilai p-value > 0.05, maka gagal menolak hipotesis nol. Artinya, tidak terdapat perbedaan signifikan antara data “sebelum” dan “sesudah”. Dengan kata lain, tidak ada perbedaan yang secara statistik signifikan antara kedua set data tersebut.

8. Gunakan Mann-Whitney:

• Kelompok A: 62, 65, 66, 70, 68

• Kelompok B: 58, 60, 59, 63, 61

Jawaban:

Hipotesis:

H₀:Kedua kelompok berasal dari distribusi yang sama.

H₁:Kedua kelompok berasal dari distribusi yang berbeda.

kelompok_A <- c(62, 65, 66, 70, 68)
kelompok_B <- c(58, 60, 59, 63, 61)

wilcox.test(kelompok_A, kelompok_B)

    Wilcoxon rank sum exact test

data:  kelompok_A and kelompok_B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0

Karena p-value < 0.05, maka ada cukup bukti untuk menolak hipotesis nol (H₀). Dengan demikian, dapat disimpulkan bahwa kedua kelompok berasal dari distribusi yang berbeda secara signifikan. Perbedaan ini menunjukkan bahwa ada perbedaan yang nyata antara kelompok A dan kelompok B, yang tidak bisa dijelaskan hanya oleh variasi acak.