Tugas Individu Latihan Uji Chi Square dan Non-Parametrik
Latihan terdiri dari 9 soal, pengerjaan dilakukan setelah soal di tulis. Berikut latihan soal uji chi square dan Non-parametrik yang telah saya kerjakan.
Soal dan Jawaban
Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah pendistribusiannya seragam.
#Frekuensi distribusidistribution <-c(345, 370, 360, 342, 356, 330, 310)# Uji chi-square dengan asumsi distribusi seragamchisq.test(x = distribution, p =rep(1/length(distribution), length(distribution)))
Chi-squared test for given probabilities
data: distribution
X-squared = 7.0477, df = 6, p-value = 0.3165
Chi-squared test for given probabilities
data: distribution
X-squared = 7.0477, df = 6, p-value = 0.3165
Nilai p-value (0.316) > 0.05 maka Gagal Menolak H0. dapat disimpulkan bahwa ditribusi jumlah kelahiran selama satu minggu merata.
Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² = 7.05 dengan derajat bebas 6 dan p-value sebesar 0.3165. Karena p-value lebih besar dari taraf signifikansi 0.05, maka tidak terdapat cukup bukti untuk menolak hipotesis nol. Dengan demikian, distribusi yang diamati tidak berbeda secara signifikan dari distribusi yang diharapkan. Hal ini menunjukkan bahwa data dapat dianggap menyebar secara merata atau sesuai dengan proporsi yang ditentukan.
Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?
#Frekuensi pemilihanvote <-c(260,240,300,200)# Uji chi-square dengan asumsi distribusi seragamchisq.test(x = vote, p =rep(1/length(vote), length(vote)))
Chi-squared test for given probabilities
data: vote
X-squared = 20.8, df = 3, p-value = 0.0001158
Chi-squared test for given probabilities
data: vote
X-squared = 20.8, df = 3, p-value = 0.0001158
Nilai p-value (0.0001158) < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat.
Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 20.8 dengan derajat bebas 3 dan p-value sebesar 0.00012. Karena nilai p jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pemilih tidak memilih secara merata keempat kandidat. Terdapat perbedaan signifikan dalam jumlah pemilih yang memilih masing-masing kandidat.
Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?
#Frekuensi warna mobilcolor <-c(90,60,50,40)# Uji chi-square dengan asumsi distribusi seragamchisq.test(x=color, p =rep(1/length(color), length(color)))
Chi-squared test for given probabilities
data: color
X-squared = 23.333, df = 3, p-value = 3.441e-05
Chi-squared test for given probabilities
data: color
X-squared = 23.333, df = 3, p-value = 3.441e-05
Nilai p-value (3.441e-05) < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa mahasiswa memiliki preferensi khusus terhadap warna mobil.
Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 23.333 dengan derajat bebas 3 dan p-value sebesar 0.00003441. Karena p-value jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan signifikan dalam distribusi warna mobil di kampus. Artinya, mahasiswa memiliki preferensi warna tertentu terhadap mobil yang mereka gunakan.
Gunakan data di bawah ini
Apakah jenis kelamin berpengaruh terhadap preferensi film?
Suka Film A
Suka Film B
Laki-laki
60
40
Perempuan
50
70
# Membuat tabel kontingensitabel1 <-matrix(c(60,40,50,70), nrow =2, byrow =TRUE)colnames(tabel1) <-c("Suka Film A", "Suka Film B")rownames(tabel1) <-c("Laki-laki", "Perempuan")tabel1
Suka Film A Suka Film B
Laki-laki 60 40
Perempuan 50 70
Suka Film A Suka Film B
Laki-laki 60 40
Perempuan 50 70
# Uji Chi-square untuk independensichisq.test(tabel1)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel1
X-squared = 6.6183, df = 1, p-value = 0.01009
Pearson's Chi-squared test with Yates' continuity correction
data: tabel1
X-squared = 6.6183, df = 1, p-value = 0.01009
nilai p-value (0.01009) < 0.05 maka Tolak H0. Sehinga ada hubungan antara jenis kelamin dan preferensi film A dan film B.
Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:
Prodi
Kost
Rumah Orang Tua
Asrama
Statistik
20
10
5
Komputer
15
20
10
Ekonomi
10
25
10
# Membuat tabel kontingensitabel2 <-matrix(c(20,10,5,15,20,10,10,25,10), nrow =3, byrow =TRUE)colnames(tabel2) <-c("Kost", "Rumah Orang Tua", "Asrama")rownames(tabel2) <-c("Statistik", "Komputer", "Ekonomi")tabel2
Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10
Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10
# Uji Chi-square untuk independensichisq.test(tabel2)
Nilai p-value (0.02815) < 0.05 maka Tolak H0. Sehingga ada hubungan antara program studi dan tempat tinggal.
24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan yang signifikan? Tes Tanda Tangan
# Install dan muat paket BSDAinstall.packages("BSDA", repos ="https://cloud.r-project.org/")
Installing package into 'C:/Users/MyBook Hype AMD/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'BSDA' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\MyBook Hype AMD\AppData\Local\Temp\RtmpmWMbys\downloaded_packages
library (BSDA)
Warning: package 'BSDA' was built under R version 4.4.3
Loading required package: lattice
Attaching package: 'BSDA'
The following object is masked from 'package:datasets':
Orange
# Menggunakan fungsi SIGN.test# x = jumlah peningkatan# n = total yang tidak sama (24 + 8)SIGN.test(x=24, n=32, alternative ="two.sided")
One-sample Sign-Test
data: 24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
24 24
sample estimates:
median of x
24
Nilai p-value = 1, maka tidak ada bukti statistik untuk menyimpulkan bahwa terdapat perbedaan arah perubahan yang signifikan kelompok yang diuji.
Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
exact p-value with ties
Wilcoxon signed rank test with continuity correction
data: Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
Wilcoxon signed rank test with continuity correction
data: Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
Warning message: In wilcox.test.default(Sebelum, Sesudah, paired = TRUE) : cannot compute exact p-value with ties
Nilai p-value (0.05447) > 0.05, maka tidak cukup bukti untuk menolak H0. tidak terdapat perbedaan yang signifikan secara statistik antara kondisi “Sebelum” dan “Sesudah” pelatihan.
Wilcoxon rank sum exact test
data: A and B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0
Wilcoxon rank sum exact test
data: A and B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0
Nilai p-value (0.01587) < 0.05, maka tolak H0. Artinya terdapat perbedaan yang signifikan secara statistik antara kelompok A dan kelompok B.
Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.
A. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?
B. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)
C. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Wanita dan Indeks Kewirausahaan Global?
Lakukan impor Dasatset.csv pada R studio agar data dapat digunakan.
data <-read.csv("C:\\Users\\MyBook Hype AMD\\Downloads\\Dataset3.csv", sep =";")
A. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?
# Membuat tabel kontingensitabel_idn <-table (data$European.Union.Membership, data$Level.of.development)# Uji Chi-square untuk independensi chisq.test(tabel_idn)
Pearson's Chi-squared test with Yates' continuity correction
data: tabel_idn
X-squared = 26.222, df = 1, p-value = 3.043e-07
Pearson's Chi-squared test with Yates'continuity correction
data: tabel_idn
X-squared = 26.222, df = 1, p-value = 3.043e-07
Nilai p-value (3.043e-07) < 0.05 maka menolak H0. Dapat disimpulkan bahwa ada hubungan yang signifikan secara statistik antara keanggotaan Uni Eropa dan tingkat pembangunan suatu negara.
B. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)
# Uji Mann-Whitney untuk Women Entrepreneurship Indexwilcox.test(data$Women.Entrepreneurship.Index ~ data$European.Union.Membership)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: data$Women.Entrepreneurship.Index by data$European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
Wilcoxon rank sum test with continuity correction
data: data$Women.Entrepreneurship.Index by data$European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
Warning message: In wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...) : cannot compute exact p-value with ties
# Uji Mann-Whitney untuk Global Entrepreneurship Indexwilcox.test(data$Entrepreneurship.Index ~ data$European.Union.Membership)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: data$Entrepreneurship.Index by data$European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
Wilcoxon rank sum test with continuity correction
data: data$Entrepreneurship.Index by data$European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
Warning message: In wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...) : cannot compute exact p-value with ties
Women Entrepreneurship Index:
P-value (1.358e-05) < 0.05, maka menolak H0. Terdapat perbedaan yang signifikan secara statistik antara kelompok negara yang menjadi anggota UE dan yang bukan anggota UE dalam hal Woman Entrepreneurship Index.
Global Entrepreneurhip Index:
W= 490, nilai statistik uji wilcoxon untuk indeks kewirausahaan global
P Value (0.0005338) <0.05, maka tolak H0. artinya terdapat perbedaan signifikan antara negara anggota UE dan non UE dalam hal Global Entrepreneurship Index.
Kedua Uji (Uji Mann-Whitney untuk Global Entrepreneurship Index dan Uji Mann-Whitney untuk Global Entrepreneurship Index) menunjukkan bahwa ada perbedaan nilai indeks kewirausahaan antara kedua kelompok tersebut.
C. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Wanita dan Indeks Kewirausahaan Global?
# Menghitung korelasi antara Women Entrepreneurship Index dan Entrepreneurship IndexKorelasi <-cor(data$Women.Entrepreneurship.Index, data$Entrepreneurship.Index)print(Korelasi)
[1] 0.9145797
[1] 0.9145797
Nilai koefisien korelasi sebesar 0.9145797 menunjukkan adanya hubungan yang sangat kuat dan positif antara Women Entrepreneurship index dan Entrepreneurship Index.
Didapatkan bahwa skor korelasi sebesar 0.9145797, yang mana nilai ini sangat mendekati +1. Dengan demikian, kita dapat menyimpulkan bahwa terdapat hubungan yang kuat antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index. Artinya, semakin tinggi tingkat kewirausahaan perempuan di suatu negara, cenderung semakin tinggi pula tingkat kewirausahaan secara keseluruhan di negara tersebut.