Statistika untuk Ilmu Sosial dan Perilaku (STK1517)
Uji Chi-Square dan Non-Parametrik
Latihan
Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.
Jawab:
Jumlah kelahiran per hari selama seminggu
Hari
Jumlah Kelahiran
Senin
345
Selasa
370
Rabu
360
Kamis
342
Jumat
356
Sabtu
330
Minggu
310
Total
2413
# Frekuensi observasiobserved =c(345,370,360,342,356,330,310) # Uji chi-square dengan asumsi distribusi seragamchisq.test(x = observed, p =rep(1/length(observed), length(observed)))
Chi-squared test for given probabilities
data: observed
X-squared = 7.0477, df = 6, p-value = 0.3165
Hipotesis:
H0 : Jumlah kelahiran per hari selama seminggu merata
H1 : Jumlah kelahiran per hari selama seminggu tidak merata
nilai p-value > 0.05, maka gagal menolak H0. Sehingga tidak cukup bukti untuk menyimpulkan bahwa distribusi jumlah kelahiran per hari selama seminggu tidak merata.
Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?
Jawab:
Jumlah pemilih empat kandidat
Kandidat
Jumlah Pemilih
A
260
B
240
C
300
D
200
Total
1000
# frekuensi observasiobserved =c(260,240,300,200)# Uji chi-square dengan asumsi distribusi seragamchisq.test(x = observed, p =rep(1/length(observed), length(observed)))
Chi-squared test for given probabilities
data: observed
X-squared = 20.8, df = 3, p-value = 0.0001158
Hipotesis:
H0 : Jumlah pemilih empat kandidat merata
H1 : Jumlah pemilih empat kandidat tidak merata
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa distribusi jumlah pemilih empat kandidat tidak merata.
Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?
Jawab:
Distribusi warna mobil di kampus
Warna Mobil
Jumlah
Hitam
90
Putih
60
Abu-abu
50
Merah
40
Total
240
# Frekuensi observasiobserved =c(90,60,50,40)# Uji chi-square dengan asumsi distribusi seragamchisq.test(x = observed, p =rep(1/length(observed), length(observed)))
Chi-squared test for given probabilities
data: observed
X-squared = 23.333, df = 3, p-value = 3.441e-05
Hipotesis:
H0 : preverensi warna mobil merata (tidak ada warna yang signifikan)
H1 : preverensi warna mobil tidak merata (ada warna yang signifikan)
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa distribusi warna mobil tidak merata atau terdapat preverensi warna mobil yang signifikan.
Gunakan data di bawah ini
Suka Film A
Suka Film B
Laki-laki
60
40
Perempuan
50
70
Apakah jenis kelamin berpengaruh terhadap preferensi film?
Jawab:
# Buat matriks kontingensitabel <-matrix(c(60, 40, 50, 70), nrow =2, byrow =TRUE)colnames(tabel) <-c("Suka Film A", "Suka Film B")rownames(tabel) <-c("Laki-laki", "Perempuan")tabel
Suka Film A Suka Film B
Laki-laki 60 40
Perempuan 50 70
# Uji Chi-square untuk independensichisq.test(tabel)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel
X-squared = 6.6183, df = 1, p-value = 0.01009
Hipotesis:
H0 : jenis kelamin tidak berpengaruh signifikan terhadap preferensi film
H1 : jenis kelamin berpengaruh signifikan terhadap preferensi film
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa jenis kelamin berpengaruh signifikan terhadap preferensi film.
Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:
Prodi
Kost
Rumah Orang Tua
Asrama
Statistik
20
10
5
Komputer
15
20
10
Ekonomi
10
25
10
Jawab:
# Buat matriks kontingensitabel <-matrix(c(20,10,5,15,20,10,10,25,10), nrow =3, byrow =TRUE)colnames(tabel) <-c("Kost", "Rumah orang tua", "Asrama")rownames(tabel) <-c("Statistik", "Komputer", "Ekonomi")tabel
Kost Rumah orang tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10
# Uji Chi-square untuk independensichisq.test(tabel)
H0 : Program studi tidak berhubungan signifikan dengan tempat tinggal
H1 : Program studi berhubungan signifikan dengan tempat tinggal
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa program studi berhubungan signifikan dengan tempat tinggal.
24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Sign Test
Jawab:
Dalam kasus ini digunakan fungsi binom.test(), bukan SIGN.test() karena data yang tersedia bukan berupa pasangan nilai individual (sebelum dan sesudah), melainkan hanya berupa jumlah siswa yang mengalami peningkatan, penurunan, dan tidak berubah. Fungsi SIGN.test() memerlukan input data dalam bentuk vektor nilai berpasangan, sedangkan binom.test() lebih tepat digunakan untuk menguji proporsi dua kemungkinan (misalnya, naik vs turun) ketika hanya diketahui jumlah kasusnya, sebagaimana dalam uji sign berbasis frekuensi.
# Jumlah siswa dengan nilai naik dan turunsuccesses <-24# nilai meningkatn <-32# total perubahan (tidak termasuk yang nilainya tetap)# Sign test: uji binomial (dua arah)binom.test(successes, n, p =0.5, alternative ="two.sided")
Exact binomial test
data: successes and n
number of successes = 24, number of trials = 32, p-value = 0.007
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.5659506 0.8853840
sample estimates:
probability of success
0.75
H0 : Tidak ada perbedaan signifikan
H1 : Ada perbedaan signifikan
karena p-value < 0,05, maka tolak H0, Sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara nilai sebelum dan setelah kursus.
Gunakan Wilcoxon:
Skor sebelum pelatihan: 75, 70, 68, 72, 69
Skor sesudah: 78, 74, 70, 75, 72
Jawab:
# Skor sebelum dan sesudah pelatihanSebelum =c(75,70,68,72,69)Sesudah =c(78,74,70,75,72)wilcox.test(Sebelum, Sesudah, paired =TRUE)
Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
exact p-value with ties
Wilcoxon signed rank test with continuity correction
data: Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
Hipotesis:
H0 : Tidak ada perbedaan signifikan antara skor sebelum dan sesudah pelatihan
H1 : Terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan
nilai p-value > 0.05, maka gagal tolak H0, sehingga tidak cukup bukti untuk dapat menyimpulkan bahwa terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan.
Wilcoxon rank sum exact test
data: Kelompok_A and Kelompok_B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0
Hipotesis:
H0 : Tidak ada perbedaan signifikan antara skor kelompok A dan kelompok B
H1 : Terdapat perbedaan signifikan antara skor kelompok A dan kelompok B
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara skor kelompok A dan kelompok B.
Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.
Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?
Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)
Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global?
Jawab:
# panggil data terlebih dahulusavi=read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")
9a. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?
Jawab:
# melihat nama kolom dan mengecek isinyanames(savi)
# membuat tabel kontingensitable=table(savi$European.Union.Membership, savi$Level.of.development)print(table)
Developed Developing
Member 20 0
Not Member 7 24
# melakukan uji chi-squarechisq.test(table)
Pearson's Chi-squared test with Yates' continuity correction
data: table
X-squared = 26.222, df = 1, p-value = 3.043e-07
Hipotesis:
H0 : Tidak ada hubungan signifikan antara keanggotaan Uni Eropa dengan level pembangunan
H1 : Terdapat hubungan signifikan antara keanggotaan Uni Eropa dengan level pembangunan
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat hubungan yang signifikan antara keanggotaan Uni Eropa dengan level pembangunan.
9b. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)
Jawab:
# Load datadata <-read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")# Ubah kolom EU menjadi faktordata$European.Union.Membership <-as.factor(data$European.Union.Membership)# Ubah WEI menjadi numerikdata$Women.Entrepreneurship.Index <-as.numeric(data$Women.Entrepreneurship.Index)# Ubah GEI menjadi numerikdata$Entrepreneurship.Index <-as.numeric(data$Entrepreneurship.Index)
# Uji Mann-Whitney untuk GEIwilcox.test(Entrepreneurship.Index ~ European.Union.Membership, data = data)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: Entrepreneurship.Index by European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
Hipotesis:
H0 : Tidak ada perbedaan signifikan antara nilai GEI antara member EU dan non member EU
H1 : Terdapat perbedaan signifikan antara nilai GEI antara member EU dan non member EU
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara nilai GEI member EU dan non member EU.
# Uji Mann-Whitney untuk WEIwilcox.test(Women.Entrepreneurship.Index ~ European.Union.Membership, data = data)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: Women.Entrepreneurship.Index by European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
Hipotesis:
H0 : Tidak ada perbedaan signifikan antara nilai WEI antara member EU dan non member EU
H1 : Terdapat perbedaan signifikan antara nilai WEI antara member EU dan non member EU
nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara nilai WEI member EU dan non member EU.
9c. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global?
# Load datadata2 <-read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")data2$Women.Entrepreneurship.Index <-as.numeric(data2$Women.Entrepreneurship.Index)# uji normalitas data WEIshapiro.test(data2$Women.Entrepreneurship.Index)
Shapiro-Wilk normality test
data: data2$Women.Entrepreneurship.Index
W = 0.94077, p-value = 0.01318
berdasarkan hasil uji normalitas, diketahui bahwa P-Value 0,01 < 0,05 yang menyimpulkan bahwa sebaran WEI tidak menyebar normal.
# Load datadata2 <-read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")data2$Entrepreneurship.Index <-as.numeric(data2$Entrepreneurship.Index)# uji normalitas data GEIshapiro.test(data2$Entrepreneurship.Index)
Shapiro-Wilk normality test
data: data2$Entrepreneurship.Index
W = 0.91004, p-value = 0.0009261
berdasarkan hasil uji normalitas, diketahui bahwa P-Value 0,000 < 0,05 yang menyimpulkan bahwa sebaran GEI juga tidak menyebar normal.
Karena kedua variabel memiliki sebaran tidak normal, maka uji yang dilakukan adalah uji non parametrik, yaitu Uji Rank Spearman.
Warning in cor.test.default(data2$Women.Entrepreneurship.Index,
data2$Entrepreneurship.Index, : Cannot compute exact p-value with ties
Spearman's rank correlation rho
data: data2$Women.Entrepreneurship.Index and data2$Entrepreneurship.Index
S = 2038.6, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.9077539
H0 : Tidak terdapat hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global
H1 : Terdapat hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global
Berdasarkan luaran statistik di atas, nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global.