MK Statistika untuk ilmu-ilmu Sosial dan Perilaku (STAT1517)
Latihan Uji Chi Square dan Non-Parametrik
1. Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.
Jawaban:
Uji yang digunakan: Uji Chi-Square Goodness of Fit
Hipotesis:
H₀ (nol): Distribusi jumlah kelahiran per hari selama satu minggu adalah seragam.
H₁ (alternatif): Distribusi jumlah kelahiran per hariselama satu minggu tidak seragam.
# Data jumlah kelahiran per hari selama satu minggukelahiran <-c(345, 370, 360, 342, 356, 330, 310)# Uji Chi-Square untuk distribusi seragamchisq.test(x = kelahiran, p =rep(1/length(kelahiran), length(kelahiran)))
Chi-squared test for given probabilities
data: kelahiran
X-squared = 7.0477, df = 6, p-value = 0.3165
Nilai p-value > 0,05, maka gagal menolak hipotesis nol. Dengan demikian, tidak terdapat bukti yang cukup untuk menyatakan bahwa distribusi jumlah kelahiran per hari selama satu minggu berbeda dari distribusi seragam.
2. Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?
Jawaban:
Uji yang digunakan: Uji Chi-Square Goodness of Fit
Hipotesis:
H₀: Pemilih memilih keempat kandidat secara merata.
H₁: Pemilih tidak memilih keempat kandidat secara merata.
# Data jumlah pemilih untuk 4 kandidatpemilih <-c(260, 240, 300, 200)# Uji Chi-Square untuk distribusi seragamchisq.test(x = pemilih, p =rep(1/length(pemilih), length(pemilih)))
Chi-squared test for given probabilities
data: pemilih
X-squared = 20.8, df = 3, p-value = 0.0001158
Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat. Dengan kata lain, terdapat perbedaan yang signifikan dalam jumlah suara yang diterima oleh masing-masing kandidat.
3. Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?
Jawaban:
Uji yang digunakan: Uji Chi-Square Goodness of Fit
Hipotesis:
H₀ (nol): Tidak ada preferensi warna mobil di kampus.
H₁ (alternatif): Ada preferensi warna mobil di kampus.
# Data warna mobilwarna <-c(90, 60, 50, 40)# Uji Chi-Square untuk distribusi seragamchisq.test(x = warna, p =rep(1/length(warna), length(warna)))
Chi-squared test for given probabilities
data: warna
X-squared = 23.333, df = 3, p-value = 3.441e-05
Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat preferensi yang signifikan terhadap warna mobil di lingkungan kampus, menunjukkan bahwa pemilihan warna mobil tidak terjadi secara seragam.
4. Gunakan data di bawah ini
Gender
Suka_Film_A
Suka_Film_B
Laki-Laki
60
40
Perempuan
50
70
Apakah jenis kelamin berpengaruh terhadap preferensi film?
Jawaban:
Uji yang digunakan: Uji Chi-Square untuk Independensi
Hipotesis:
H₀:Jenis kelamin tidak berpengaruh terhadap preferensi film.
H₁:Jenis kelamin berpengaruh terhadap preferensi film.
# Membuat matriks kontingensitabel <-matrix(c(60, 40, 50, 70), nrow =2, byrow =TRUE)colnames(tabel) <-c("Suka Film A", "Suka Film B")rownames(tabel) <-c("Laki-Laki", "Perempuan")# Menampilkan tabeltabel
Suka Film A Suka Film B
Laki-Laki 60 40
Perempuan 50 70
chisq.test(tabel)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel
X-squared = 6.6183, df = 1, p-value = 0.01009
Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa jenis kelamin berpengaruh terhadap preferensi film.
5. Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:
Prodi
Kost
Rumah_Orang_Tua
Asrama
Statistik
20
10
5
Komputer
15
20
10
Ekonomi
10
25
10
Jawaban:
Uji yang digunakan: Uji Chi-Square untuk Independensi
Hipotesis:
H₀:Tidak ada hubungan antara program studi dan tempat tinggal mahasiswa.
H₁:Ada hubungan antara program studi dan tempat tinggal mahasiswa.
Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat hubungan antara program studi dan tempat tinggal mahasiswa.
6. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Sign Test
Jawaban:
Diketahui:
• Jumlah meningkat (positif) = 24
• Jumlah menurun (negatif) = 8
• (yang tetap = 3, diabaikan)
• Jadi total n = 32.
Hipotesis:
H₀:Tidak ada perbedaan signifikan dalam nilai setelah kursus.
H₁:Ada perbedaan signifikan dalam nilai setelah kursus.
library(BSDA)SIGN.test(x =24, n =32, alternative ="two.sided")
One-sample Sign-Test
data: 24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
24 24
sample estimates:
median of x
24
Karena p-value = 1, maka tidak ada bukti statistik yang cukup untuk menyimpulkan bahwa terdapat perbedaan signifikan dalam nilai siswa sebelum dan sesudah mengikuti kursus.
7. Gunakan Wilcoxon:
• Skor sebelum pelatihan: 75, 70, 68, 72, 69
• Skor sesudah: 78, 74, 70, 75, 72
Jawaban:
Hipotesis:
H₀:Tidak ada perbedaan signifikan antara skor sebelum dan sesudah pelatihan.
H₁:Ada perbedaan signifikan antara skor sebelum dan sesudah pelatihan.
Wilcoxon signed rank test with continuity correction
data: sebelum and sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
Nilai p-value > 0.05, maka gagal menolak hipotesis nol. Artinya, tidak terdapat perbedaan signifikan antara data “sebelum” dan “sesudah”. Dengan kata lain, tidak ada perbedaan yang secara statistik signifikan antara kedua set data tersebut.
8. Gunakan Mann-Whitney:
• Kelompok A: 62, 65, 66, 70, 68
• Kelompok B: 58, 60, 59, 63, 61
Jawaban:
Hipotesis:
H₀:Kedua kelompok berasal dari distribusi yang sama.
H₁:Kedua kelompok berasal dari distribusi yang berbeda.
Wilcoxon rank sum exact test
data: kelompok_A and kelompok_B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0
Karena p-value < 0.05, maka ada cukup bukti untuk menolak hipotesis nol (H₀). Dengan demikian, dapat disimpulkan bahwa kedua kelompok berasal dari distribusi yang berbeda secara signifikan. Perbedaan ini menunjukkan bahwa ada perbedaan yang nyata antara kelompok A dan kelompok B, yang tidak bisa dijelaskan hanya oleh variasi acak.
9. Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.
• Are European Union membership variable and development variable independent from each other?
Jawaban:
Uji yang digunakan: Uji Chi-Square untuk Independensi
Hipotesis:
H₀:Keanggotaan Uni Eropa dan tingkat pembangunan negara saling independen (tidak berhubungan).
H₁:Keanggotaan Uni Eropa dan tingkat pembangunan negara tidak independen (ada hubungan).
library(readxl)
Warning: package 'readxl' was built under R version 4.4.3
Dataset3 <-read_excel("C:\\Users\\MyBook Z Series\\Downloads\\Dataset3.xlsx")str(Dataset3)
tibble [51 × 9] (S3: tbl_df/tbl/data.frame)
$ No : num [1:51] 4 6 17 18 19 20 22 28 30 34 ...
$ Country : chr [1:51] "Austria" "Belgium" "Estonia" "Finland" ...
$ Level of development : chr [1:51] "Developed" "Developed" "Developed" "Developed" ...
$ European Union Membership : chr [1:51] "Member" "Member" "Member" "Member" ...
$ Currency : chr [1:51] "Euro" "Euro" "Euro" "Euro" ...
$ Women Entrepreneurship Index : num [1:51] 54.9 63.6 55.4 66.4 68.8 63.6 43 64.3 51.4 56.6 ...
$ Entrepreneurship Index : num [1:51] 64.9 65.5 60.2 65.7 67.3 67.4 42 65.3 41.3 54.5 ...
$ Inflation rate : num [1:51] 0.9 0.6 -0.88 -0.2 0 0.5 -1.7 -0.3 0 0.2 ...
$ Female Labor Force Participation Rate: num [1:51] 67.1 58 68.5 67.7 60.6 69.9 42.5 59.4 47.2 66.4 ...
data_subset <- Dataset3[, c("European Union Membership", "Level of development")]data_subset <-na.omit(data_subset)tabel_kontingensi <-table(data_subset$`European Union Membership`, data_subset$`Level of development`)print(tabel_kontingensi)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel_kontingensi
X-squared = 26.222, df = 1, p-value = 3.043e-07
Nilai p-value < 0,05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat hubungan antara keanggotaan Uni Eropa dan tingkat pembangunan negara.
• Do the Women Entrepreneurship Index and Global Entrepreneurship Index values show a statistically significant difference between the countries that are members of the European Union and not? (Method Mann-Whitney U)
Jawaban:
Untuk Women Entrepreneurship Index (WEI)
Hipotesis:
H₀:Tidak ada perbedaan Women Entrepreneurship Index yang signifikan antara negara Uni Eropa dan non Uni Eropa.
H₁:Ada perbedaan Women Entrepreneurship Index yang signifikan antara negara Uni Eropa dan non Uni Eropa.
library(readxl)Dataset3 <-read_excel("C:\\Users\\MyBook Z Series\\Downloads\\Dataset3.xlsx")WEI_EU <- Dataset3$`Women Entrepreneurship Index`[Dataset3$`European Union Membership`=="Member"]WEI_nonEU <- Dataset3$`Women Entrepreneurship Index`[Dataset3$`European Union Membership`=="Not Member"]wilcox.test(WEI_EU, WEI_nonEU)
Warning in wilcox.test.default(WEI_EU, WEI_nonEU): cannot compute exact p-value
with ties
Wilcoxon rank sum test with continuity correction
data: WEI_EU and WEI_nonEU
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
Karena p-value < 0.05, maka terdapat cukup bukti untuk menolak hipotesis nol (H₀). Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam Women Entrepreneurship Index antara negara Uni Eropa dan non-Uni Eropa. Perbedaan ini tidak dapat dijelaskan hanya oleh variasi acak, yang berarti bahwa nilai Women Entrepreneurship Index dari kedua kelompok berasal dari distribusi yang berbeda secara statistik.
Global Entrepreneurship Index (GEI)
Hipotesis:
H₀:Tidak ada perbedaan Global Entrepreneurship Index yang signifikan antara negara Uni Eropa dan non-Uni Eropa.
H₁:Ada perbedaan Global Entrepreneurship Index yang signifikan antara negara Uni Eropa dan non-Uni Eropa.
library(readxl)Dataset3 <-read_excel("C:\\Users\\MyBook Z Series\\Downloads\\Dataset3.xlsx")GEI_EU <- Dataset3$`Entrepreneurship Index`[Dataset3$`European Union Membership`=="Member"]GEI_nonEU <- Dataset3$`Entrepreneurship Index`[Dataset3$`European Union Membership`=="Not Member"]wilcox.test(GEI_EU, GEI_nonEU)
Warning in wilcox.test.default(GEI_EU, GEI_nonEU): cannot compute exact p-value
with ties
Wilcoxon rank sum test with continuity correction
data: GEI_EU and GEI_nonEU
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
Karena p-value < 0.05, maka terdapat cukup bukti untuk menolak hipotesis nol (H₀). Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam Global Entrepreneurship Index antara negara Uni Eropa dan non-Uni Eropa. Perbedaan ini tidak dapat dijelaskan hanya oleh variasi acak, yang berarti bahwa nilai Global Entrepreneurship Index dari kedua kelompok berasal dari distribusi yang berbeda secara statistik.
• Is there a statistically significant relationship between Women’s Entrepreneurship Index and Global Entrepreneurship Index values?
Jawaban:
Data dianalisis menggunakan uji korelasi Spearman.
Hipotesis:
H₀:Tidak terdapat hubungan yang signifikan antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index.
H₁:Terdapat hubungan yang signifikan antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index.
library(readxl)# 1. Membaca dataDataset3 <-read_excel("C:\\Users\\MyBook Z Series\\Downloads\\Dataset3.xlsx")# 2. Mengubah kolom menjadi numerik (jika belum)Dataset3$`Women Entrepreneurship Index`<-as.numeric(Dataset3$`Women Entrepreneurship Index`)Dataset3$`Entrepreneurship Index`<-as.numeric(Dataset3$`Entrepreneurship Index`)# 3. Uji korelasi Spearman dengan penanganan NAhasil_korelasi <-cor.test(Dataset3$`Women Entrepreneurship Index`, Dataset3$`Entrepreneurship Index`, method ="spearman", use ="complete.obs")
Warning in cor.test.default(Dataset3$`Women Entrepreneurship Index`,
Dataset3$`Entrepreneurship Index`, : Cannot compute exact p-value with ties
# 4. Menampilkan hasil uji korelasiprint(hasil_korelasi)
Spearman's rank correlation rho
data: Dataset3$`Women Entrepreneurship Index` and Dataset3$`Entrepreneurship Index`
S = 2038.6, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.9077539
Nilai p-value < 0.05, maka terdapat cukup bukti untuk menolak hipotesis nol (H₀), Dengan demikian, hal tersebut menunjukkan bahwa terdapat hubungan yang signifikan secara statistik antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index. Artinya, hubungan ini tidak terjadi secara kebetulan.
Selain itu, nilai koefisien korelasi rho sebesar 0,9078 mengindikasikan adanya hubungan yang sangat kuat dan positif antara kedua variabel. Hal ini berarti bahwa semakin tinggi nilai Women’s Entrepreneurship Index, maka cenderung diikuti oleh peningkatan pada nilai Global Entrepreneurship Index.
SOAL EKSPLORASI
Apakah terdapat perbedaan yang signifikan secara statistik antara Women Entrepreneurship Index dan Global Entrepreneurship Index pada negara-negara anggota Uni Eropa? (Metode: Uji Wilcoxon Signed-Rank)
Jawaban:
Hipotesis:
H₀:Tidak ada perbedaan yang signifikan antara Women Entrepreneurship Index dan Global Entrepreneurship Index pada negara-negara anggota Uni Eropa.
H₁:Ada perbedaan yang signifikan antara Women Entrepreneurship Index dan Global Entrepreneurship Index pada negara-negara anggota Uni Eropa.
library(readxl)Dataset3 <-read_excel("C:\\Users\\MyBook Z Series\\Downloads\\Dataset3.xlsx")EU_data <- Dataset3[Dataset3$`European Union Membership`=="Member", ]WEI <- EU_data$`Women Entrepreneurship Index`GEI <- EU_data$`Entrepreneurship Index`wilcox.test(WEI, GEI, paired =TRUE)
Warning in wilcox.test.default(WEI, GEI, paired = TRUE): cannot compute exact
p-value with ties
Wilcoxon signed rank test with continuity correction
data: WEI and GEI
V = 141.5, p-value = 0.1789
alternative hypothesis: true location shift is not equal to 0
Nilai p-value > 0.05, maka gagal menolak hipotesis nol. Artinya, tidak terdapat perbedaan signifikan antara data Women Entrepreneurship Index dan Global Entrepreneurship Index. Dengan kata lain, tidak ada perbedaan yang secara statistik signifikan antara kedua set data tersebut.
Apakah terdapat perbedaan yang signifikan antara Women Entrepreneurship Index dan Entrepreneurship Index pada negara anggota uni eropa berdasarkan arah selisih nilainya?
diketahui dari 20 negara anggota Uni Eropa bahwa: 13 negara memiliki nilai Women Entrepreneurship Index > Entrepreneurship Index 7 negara memiliki nilai Entrepreneurship Index > Women Entrepreneurship Index
Jawaban:
Hipotesis:
H₀:Tidak ada perbedaan yang signifikan antara Women Entrepreneurship Index dan Entrepreneurship Index berdasarkan arah selisih nilainya pada negara-negara Uni Eropa.
H₁: Ada perbedaan yang signifikan antara Women Entrepreneurship Index dan Entrepreneurship Index berdasarkan arah selisih nilainya pada negara-negara Uni Eropa.
library(BSDA)SIGN.test(x =13, n =20, alternative ="two.sided")
One-sample Sign-Test
data: 13
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
13 13
sample estimates:
median of x
13
Karena p-value = 1, maka gagal untuk menolak hipotesis nol. Artinya, tidak ada bukti statistik yang cukup untuk menyimpulkan bahwa terdapat perbedaan arah selisih yang signifikan antara Women Entrepreneurship Index dan Entrepreneurship Index pada negara-negara Uni Eropa.