Latihan Uji Chi-Square dan Analisis Non Parametrik
Latihan 1
Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.
Hipotesis
H₀ : Distribusi kelahiran per hari seragam.
H₁ : Distribusi kelahiran per hari tidak seragam.
# Data jumlah kelahiran per hari selama satu mingguobserved <-c(345, 370, 360, 342, 356, 330, 310)# Uji chi-square dengan asumsi distribusi seragamchisq.test(x = observed, p =rep(1/length(observed), length(observed)))
Chi-squared test for given probabilities
data: observed
X-squared = 7.0477, df = 6, p-value = 0.3165
Interpretasi
Karena p-value = 0.3165 > 0.05, maka gagal menolak H₀. Artinya, jumlah kelahiran per hari selama satu minggu terdistribusi seragam secara statistik.
Latihan 2
Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?
Hipotesis
H₀ : Pemilih memilih keempat kandidat secara merata.
H₁ : Pemilih memilih keempat kandidat secara tidak merata.
# Data jumlah pemilih untuk masing-masing kandidatpemilih <-c(260, 240, 300, 200)# Uji chi-square dengan asumsi distribusi merata (equal probability)chisq.test(x = pemilih, p =rep(1/length(pemilih), length(pemilih)))
Chi-squared test for given probabilities
data: pemilih
X-squared = 20.8, df = 3, p-value = 0.0001158
Interpretasi
Karena p-value = 0.0001158 < 0.05, maka tolak H₀. Artinya, pemilih untuk keempat kandidat tidak memilih secara merata. Terdapat perbedaan signifikan dalam preferensi pemilih.
Latihan 3
Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?
Hipotesis
H₀ : Warna mobil di kampus terdistridusi secara merata (tidak ada preferensi warna).
H₁ : Warna mobil di kampus tidak terdistribusi secara merata (ada preferensi warna).
# Data jumlah mobil per warnawarna_mobil <-c(90, 60, 50, 40)# Uji chi-square dengan asumsi distribusi meratachisq.test(x = warna_mobil, p =rep(1/length(warna_mobil), length(warna_mobil)))
Chi-squared test for given probabilities
data: warna_mobil
X-squared = 23.333, df = 3, p-value = 3.441e-05
Interpretasi
Karena p-value =3.441e-05 < 0.05, maka tolak H₀. Artinya, terdapat preferensi warna yang signifikan sehingga warna mobil dikampus tidak didistribusikan secara merata.
Latihan 4
Gunakan data di bawah ini
Suka Film A
Suka Film B
Laki-Laki
60
40
Perempuan
50
70
Apakah jenis kelamin berpengaruh terhadap preferensi film?
Hipotesis
H₀ : Tidak ada hubungan antara jenis kelamin dan preferensi film.
H₁ : Ada hubungan antara jenis kelamin dan preferensi film.
# Membuat matriks kontingensitabel <-matrix(c(60, 40, 50, 70), nrow =2, byrow =TRUE)colnames(tabel) <-c("Suka Film A", "Suka Film B")rownames(tabel) <-c("Laki-Laki", "Perempuan")tabel
Suka Film A Suka Film B
Laki-Laki 60 40
Perempuan 50 70
# Uji chi-square independensichisq.test(tabel)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel
X-squared = 6.6183, df = 1, p-value = 0.01009
Interpretasi
Karena p-value = 0.01009 < 0.05, maka tolak H₀. Dapat disimpulkan bahwa terdapat hubungan antara jenis kelamin dan preferensi film. Laki-laki dan perempuan memiliki kecenderungan yang berbeda dalam menyukai Film A atau Film B.
Latihan 5
Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut ini data kontingensi untuk digunakan:
Hipotesis
Prodi
Kost
Rumah Orang Tua
Asrama
Statistik
20
10
5
Komputer
15
20
10
Ekonomi
10
25
10
H₀ : Tidak ada hubungan antara program studi dan tempat tinggal.
H₁ : Ada hubungan antara program studi dan tempat tinggal.
# Membuat tabel kontingensitabel_tempat <-matrix(c(20, 10, 5,15, 20, 10,10, 25, 10),nrow =3,byrow =TRUE)# Menambahkan nama baris dan kolomdimnames(tabel_tempat) <-list(Program_Studi =c("Statistik", "Komputer", "Ekonomi"),Tempat_Tinggal =c("Kost", "Rumah Orang Tua", "Asrama"))# Tampilkan tabeltabel_tempat
Tempat_Tinggal
Program_Studi Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10
# Uji chi-square of independencechisq.test(tabel_tempat)
Karena p-value = 0.02815 < 0.05, maka tolak H₀. Artinya, terdapat hubungan signifikan antara program studi dan tempat tinggal. Misalnya, mahasiswa Ekonomi lebih banyak tinggal di rumah orang tua dibandingkan mahasiswa statistik.
Latihan 6
24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Analisis menggunakan Sign Test
Hipotesis
H₀: Tidak ada perbedaan yang signifikan sebelum dengan setelah kursus.
H₁: Terdapat perbedaan signifikan sebelum dengan setelah kursus.
# Install dan muat paket BSDAinstall.packages("BSDA", repos ="https://cloud.r-project.org/")
Installing package into 'C:/Users/Dhea Dasa Cendekia Z/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'BSDA' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\Dhea Dasa Cendekia Z\AppData\Local\Temp\Rtmpe0gi5S\downloaded_packages
library (BSDA)
Warning: package 'BSDA' was built under R version 4.4.3
Loading required package: lattice
Attaching package: 'BSDA'
The following object is masked from 'package:datasets':
Orange
# Menggunakan fungsi SIGN.test# x = jumlah peningkatan# n = total yang tidak sama (24 + 8)SIGN.test(x =24, n =32, alternative ="two.sided")
One-sample Sign-Test
data: 24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
24 24
sample estimates:
median of x
24
Interpretasi
karena p-value = 1 > 0,05, maka gagal menolakH₀. Artinya, tidak terdapat perbedaan arah perubahan yang signifikan antara dua kondisi yang diuji, nilai sebelum dan setelah kursus.
Latihan 7
Gunakan Wilcoxon untuk menganalisis data berikut ini:
Skor sebelum pelatihan: 75, 70, 68, 72, 69
Skor sesudah pelatihan: 78, 74, 70, 75, 72
Hipotesis
H₀: Tidak ada perbedaan skor sebelum dan sesudah pelatihan.
H₁: Ada perbedaan signifikan setelah pelatihan.
# Skor sebelum dan sesudah pelatihansebelum <-c(75, 70, 68, 72, 69)sesudah <-c(78, 74, 70, 75, 72)# Wilcoxon signed-rank test (paired)wilcox.test(sesudah, sebelum, paired =TRUE)
Warning in wilcox.test.default(sesudah, sebelum, paired = TRUE): cannot compute
exact p-value with ties
Wilcoxon signed rank test with continuity correction
data: sesudah and sebelum
V = 15, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
Interpretasi
Karena p-value = 0.05447 > 0.05, maka gagal menolak H₀. Artinya, tidak terdapat cukup bukti statistik untuk menyatakan bahwa terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan.
Latihan 8
Gunakan Mann-Whitney untuk menganalisis data berikut ini :
Kelompok A: 62, 65, 66, 70, 68
Kelompok B: 58, 60, 59, 63, 61
Hipotesis
H₀: Tidak ada perbedaan signifikan distribusi antara kelompok A dan B.
H₁: Ada perbedaan signifikan distribusi antara kelompok A dan B.
# Kelompok A dan BkelompokA <-c(62, 65, 66, 70, 68)kelompokB <-c(58, 60, 59, 63, 61)# Uji Mann-Whitney (non-paired)wilcox.test(kelompokA, kelompokB)
Wilcoxon rank sum exact test
data: kelompokA and kelompokB
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0
Interpretasi
Karena p-value = 0.01587 < 0.05, maka tolak H₀. Artinya, terdapat perbedaan yang signifikan secara statistik antara distribusi nilai di kelompok A dan kelompok B. Hal ini menunjukkan bahwa nilai-nilai yang terdapat pada kedua kelompok tidak berasal dari distribusi yang sama, dan kemungkinan terdapat faktor tertentu yang menyebabkan perbedaan tersebut.
Latihan 9
Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.
Are European Union membership variable and development variable independent from each other?
Do the Women Entrepreneurship Index and Global Entrepreneurship Index values show a statistically significant difference between the countries that are members of the European Union and not? (Method Mann-Whitney U)
Is there a statistically significant relationship between Women’s Entrepreneurship Index and Global Entrepreneurship Index values?
# Memuat library yang diperlukanlibrary(readr)
Warning: package 'readr' was built under R version 4.4.3
library(dplyr)
Warning: package 'dplyr' was built under R version 4.4.3
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
data <-read_csv("D:/DHEA/S2/Kuliah dan Praktikum/2nd Semester/Statistika untuk Ilmu Sosial dan Perilaku/Tugas/Dhea Dasa Cendekia Zairin_Tugas Praktikum 12 Statistika_files/Dataset3.csv")
Rows: 51 Columns: 1
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (1): No;Country;Level of development;European Union Membership;Currency;...
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
str(data)
spc_tbl_ [51 × 1] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate: chr [1:51] "4;Austria;Developed;Member;Euro;54.9;64.9;0.9;67.1" "6;Belgium;Developed;Member;Euro;63.6;65.5;0.6;58" "17;Estonia;Developed;Member;Euro;55.4;60.2;-0.88;68.5" "18;Finland;Developed;Member;Euro;66.4;65.7;-0.2;67.7" ...
- attr(*, "spec")=
.. cols(
.. `No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate` = col_character()
.. )
- attr(*, "problems")=<externalptr>
head(data)
# A tibble: 6 × 1
No;Country;Level of development;European Union Membership;Currency;Women Ent…¹
<chr>
1 4;Austria;Developed;Member;Euro;54.9;64.9;0.9;67.1
2 6;Belgium;Developed;Member;Euro;63.6;65.5;0.6;58
3 17;Estonia;Developed;Member;Euro;55.4;60.2;-0.88;68.5
4 18;Finland;Developed;Member;Euro;66.4;65.7;-0.2;67.7
5 19;France;Developed;Member;Euro;68.8;67.3;0;60.6
6 20;Germany;Developed;Member;Euro;63.6;67.4;0.5;69.9
# ℹ abbreviated name:
# ¹`No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate`
summary(data)
No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate
Length:51
Class :character
Mode :character
Pertanyaan 1 : Apakah variabel European Union membership dan development independen?
Uji Chi-Square of Independence digunakan untuk menguji apakah terdapat hubungan (dependensi) antara dua variabel kategorik pada soal ini
Hipotesis
H₀ : Keanggotaan Uni Eropa dan status pembangunan negara adalah independen (tidak saling terkait).
H₁ : Keanggotaan Uni Eropa dan status pembangunan negara tidak independen (ada hubungan).
data <-read_delim("D:/DHEA/S2/Kuliah dan Praktikum/2nd Semester/Statistika untuk Ilmu Sosial dan Perilaku/Tugas/Dhea Dasa Cendekia Zairin_Tugas Praktikum 12 Statistika_files/Dataset3.csv")
Rows: 51 Columns: 9
── Column specification ────────────────────────────────────────────────────────
Delimiter: ";"
chr (4): Country, Level of development, European Union Membership, Currency
dbl (5): No, Women Entrepreneurship Index, Entrepreneurship Index, Inflation...
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
colnames(data)
[1] "No"
[2] "Country"
[3] "Level of development"
[4] "European Union Membership"
[5] "Currency"
[6] "Women Entrepreneurship Index"
[7] "Entrepreneurship Index"
[8] "Inflation rate"
[9] "Female Labor Force Participation Rate"
# Membuat tabel kontingensitable_indep <-table(data$`European Union Membership`, data$`Level of development`)# Uji Chi-Squarechi_result <-chisq.test(table_indep)chi_result
Pearson's Chi-squared test with Yates' continuity correction
data: table_indep
X-squared = 26.222, df = 1, p-value = 3.043e-07
Interpretasi
Karena p-value = 3.043e-07 < 0.05, maka tolak H₀. Terdapat hubungan yang signifikan secara statistik antara status keanggotaan Uni Eropa dan tingkat pembangunan negara. Artinya, keanggotaan Uni Eropa tidak terjadi secara acak terhadap tingkat pembangunan; ada pola keterkaitan yang jelas.
Pertanyaan 2 : Apakah terdapat perbedaan signifikan nilai Women Entrepreneurship Index (WEI) dan Global Entrepreneurship Index (GEI) antara anggota dan non-anggota EU?
Uji Mann-Whitney U (Wilcoxon Rank Sum Test) digunakan untuk membandingkan dua kelompok independen pada soal ini
Hipotesis
H₀: Tidak ada perbedaan median nilai WEI antara negara anggota Uni Eropa dan non-anggota (distribusi WEI di kedua grup sama).
H₁: Ada perbedaan median nilai WEI antara negara anggota Uni Eropa dan non-anggota (distribusi WEI di kedua grup berbeda).
# Uji perbedaan Women Entrepreneurship Index (WEI)wilcox.test(data$`Women Entrepreneurship Index`~ data$`European Union Membership`)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: data$`Women Entrepreneurship Index` by data$`European Union Membership`
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
Interpretasi
Karena nilai p-value = 1.358e-05 < 0.05, maka tolak H₀. Artinya, negara-negara anggota EU memiliki nilai indeks kewirausahaan perempuan yang berbeda signifikan dibandingkan negara non-EU.
Hipotesis
H₀: Tidak ada perbedaan median nilai GEI antara negara anggota Uni Eropa dan non-anggota.
H₁: Ada perbedaan median nilai GEI antara negara anggota Uni Eropa dan non-anggota.
# Uji perbedaan Global Entrepreneurship Index (GEI)wilcox.test(data$`Entrepreneurship Index`~ data$`European Union Membership`)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: data$`Entrepreneurship Index` by data$`European Union Membership`
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
Interpretasi
Karena nilai p-value = 0.0005338 < 0.05, maka tolak H₀. Artinya, tidak ditemukan perbedaan signifikan pada indeks kewirausahaan global antara negara EU dan non-EU.
Pertanyaan 3 :Apakah ada hubungan yang signifikan secara statistik antara nilai Women’s Entrepreneurship Index (WEI) and Global Entrepreneurship Index (GEI)?
Adapun Jenis Uji Korelasi yang digunakan adalah :
Pearson correlation → untuk data yang normal
Spearman correlation → untuk data tidak normal / ordinal
Warning in cor.test.default(data$`Women Entrepreneurship Index`,
data$`Entrepreneurship Index`, : Cannot compute exact p-value with ties
Spearman's rank correlation rho
data: data$`Women Entrepreneurship Index` and data$`Entrepreneurship Index`
S = 2038.6, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.9077539
Interpretasi
Nilai rho = 0.9077539 menunjukkan korelasi positif sangat kuat. Nilai p-value < 2.2e-16 menunjukkan tolak H₀ dan sangat signifikan. Artinya, terdapat hubungan yang sangat kuat dan signifikan antara Women Entrepreneurship Index (WEI) dengan Global Entrepreneurship Index (GEI). Hal ini mengindikasikan bahwa semakin tinggi partisipasi dan dukungan perempuan dalam kewirausahaan, semakin baik pula iklim kewirausahaan secara umum di suatu negara. Hubungan yang sangat kuat ini menegaskan bahwa pemberdayaan perempuan dalam kewirausahaan sangat penting dalam membangun ekosistem kewirausahaan nasional yang sehat dan produktif.