Tugas Individu Statistik

Author

Konselia D. Verra

Tugas Individu Latihan Uji Chi Square dan Non-Parametrik

Latihan terdiri dari 9 soal, pengerjaan dilakukan setelah soal di tulis. Berikut latihan soal uji chi square dan Non-parametrik yang telah saya kerjakan.

Soal dan Jawaban

  1. Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah pendistribusiannya seragam.

    #Frekuensi distribusi
    distribution <- c(345, 370, 360, 342, 356, 330, 310)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x = distribution, p = rep(1/length(distribution), length(distribution)))
    
        Chi-squared test for given probabilities
    
    data:  distribution
    X-squared = 7.0477, df = 6, p-value = 0.3165
Chi-squared test for given probabilities    

data:  distribution  
X-squared = 7.0477, df = 6, p-value = 0.3165

Nilai p-value (0.316) > 0.05 maka Gagal Menolak H0. dapat disimpulkan bahwa ditribusi jumlah kelahiran selama satu minggu merata.

Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² = 7.05 dengan derajat bebas 6 dan p-value sebesar 0.3165. Karena p-value lebih besar dari taraf signifikansi 0.05, maka tidak terdapat cukup bukti untuk menolak hipotesis nol. Dengan demikian, distribusi yang diamati tidak berbeda secara signifikan dari distribusi yang diharapkan. Hal ini menunjukkan bahwa data dapat dianggap menyebar secara merata atau sesuai dengan proporsi yang ditentukan.

  1. Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?
#Frekuensi pemilihan
vote <- c(260,240,300,200)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = vote, p = rep(1/length(vote), length(vote)))

    Chi-squared test for given probabilities

data:  vote
X-squared = 20.8, df = 3, p-value = 0.0001158
    Chi-squared test for given probabilities      

data:  vote      
X-squared = 20.8, df = 3, p-value = 0.0001158

Nilai p-value (0.0001158) < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat.

Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 20.8 dengan derajat bebas 3 dan p-value sebesar 0.00012. Karena nilai p jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pemilih tidak memilih secara merata keempat kandidat. Terdapat perbedaan signifikan dalam jumlah pemilih yang memilih masing-masing kandidat.

  1. Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?
#Frekuensi warna mobil
color <- c(90,60,50,40)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x=color, p = rep(1/length(color), length(color)))

    Chi-squared test for given probabilities

data:  color
X-squared = 23.333, df = 3, p-value = 3.441e-05
Chi-squared test for given probabilities    

data:  color  
X-squared = 23.333, df = 3, p-value = 3.441e-05

Nilai p-value (3.441e-05) < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa mahasiswa memiliki preferensi khusus terhadap warna mobil.

Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 23.333 dengan derajat bebas 3 dan p-value sebesar 0.00003441. Karena p-value jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan signifikan dalam distribusi warna mobil di kampus. Artinya, mahasiswa memiliki preferensi warna tertentu terhadap mobil yang mereka gunakan.

  1. Gunakan data di bawah ini
Apakah jenis kelamin berpengaruh terhadap preferensi film?
Suka Film A Suka Film B
Laki-laki 60 40
Perempuan 50 70
# Membuat tabel kontingensi
tabel1 <- matrix(c(60,40,50,70), nrow = 2, byrow = TRUE)
colnames(tabel1) <- c("Suka Film A", "Suka Film B")
rownames(tabel1) <- c("Laki-laki", "Perempuan")
tabel1
          Suka Film A Suka Film B
Laki-laki          60          40
Perempuan          50          70
        Suka Film A Suka Film B  
Laki-laki         60          40   
Perempuan         50          70
# Uji Chi-square untuk independensi
chisq.test(tabel1)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel1
X-squared = 6.6183, df = 1, p-value = 0.01009
Pearson's Chi-squared test with Yates' continuity correction
    
data:  tabel1
X-squared = 6.6183, df = 1, p-value = 0.01009

nilai p-value (0.01009) < 0.05 maka Tolak H0. Sehinga ada hubungan antara jenis kelamin dan preferensi film A dan film B.

  1. Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:
Prodi Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10
# Membuat tabel kontingensi
tabel2 <- matrix(c(20,10,5,15,20,10,10,25,10), nrow = 3, byrow = TRUE)
colnames(tabel2) <- c("Kost", "Rumah Orang Tua", "Asrama")
rownames(tabel2) <- c("Statistik", "Komputer", "Ekonomi")
tabel2
          Kost Rumah Orang Tua Asrama
Statistik   20              10      5
Komputer    15              20     10
Ekonomi     10              25     10
            Kost  Rumah Orang Tua Asrama  
Statistik   20              10      5  
Komputer    15              20     10  
Ekonomi     10              25     10
# Uji Chi-square untuk independensi
chisq.test(tabel2)

    Pearson's Chi-squared test

data:  tabel2
X-squared = 10.863, df = 4, p-value = 0.02815
      Pearson's Chi-squared test   
      
data:  tabel2  
X-squared = 10.863, df = 4, p-value = 0.02815 

Nilai p-value (0.02815) < 0.05 maka Tolak H0. Sehingga ada hubungan antara program studi dan tempat tinggal.

  1. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan yang signifikan? Tes Tanda Tangan
# Install dan muat paket BSDA
install.packages("BSDA", repos = "https://cloud.r-project.org/")
Installing package into 'C:/Users/MyBook Hype AMD/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'BSDA' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\MyBook Hype AMD\AppData\Local\Temp\RtmpmWMbys\downloaded_packages
library (BSDA)
Warning: package 'BSDA' was built under R version 4.4.3
Loading required package: lattice

Attaching package: 'BSDA'
The following object is masked from 'package:datasets':

    Orange
# Menggunakan fungsi SIGN.test
# x = jumlah peningkatan
# n = total yang tidak sama (24 + 8)
SIGN.test(x=24, n=32, alternative = "two.sided")

    One-sample Sign-Test

data:  24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
 24 24
sample estimates:
median of x 
         24 

Nilai p-value = 1, maka tidak ada bukti statistik untuk menyimpulkan bahwa terdapat perbedaan arah perubahan yang signifikan kelompok yang diuji.

  1. Gunakan Wilcoxon:
  • Skor sebelum pelatihan: 75, 70, 68, 72, 69

  • Skor sesudahnya: 78, 74, 70, 75, 72

#Skor pelatihan
Sebelum <- c(75, 70, 68, 72, 69)
Sesudah <- c(78, 74, 70, 75, 72)
wilcox.test(Sebelum, Sesudah, paired = TRUE)
Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
exact p-value with ties

    Wilcoxon signed rank test with continuity correction

data:  Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
    Wilcoxon signed rank test with continuity correction
    
data:  Sebelum and Sesudah  
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0
Warning message: In wilcox.test.default(Sebelum, Sesudah, paired = TRUE) :   cannot compute exact p-value with ties

Nilai p-value (0.05447) > 0.05, maka tidak cukup bukti untuk menolak H0. tidak terdapat perbedaan yang signifikan secara statistik antara kondisi “Sebelum” dan “Sesudah” pelatihan.

  1. Gunakan Mann-Whitney:
  • Kelompok A: 62, 65, 66, 70, 68

  • Kelompok B: 58, 60, 59, 63, 61

    A <- c(62, 65, 66, 70, 68)
    B <- c(58, 60, 59, 63, 61)
    wilcox.test(A,B)
    
        Wilcoxon rank sum exact test
    
    data:  A and B
    W = 24, p-value = 0.01587
    alternative hypothesis: true location shift is not equal to 0
    Wilcoxon rank sum exact test

data:  A and B  
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0

Nilai p-value (0.01587) < 0.05, maka tolak H0. Artinya terdapat perbedaan yang signifikan secara statistik antara kelompok A dan kelompok B.

  1. Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.

    A. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?

    B. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)

    C. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Wanita dan Indeks Kewirausahaan Global?

Lakukan impor Dasatset.csv pada R studio agar data dapat digunakan.

data <- read.csv("C:\\Users\\MyBook Hype AMD\\Downloads\\Dataset3.csv", sep = ";")

A. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?

# Membuat tabel kontingensi
tabel_idn <- table (data$European.Union.Membership, data$Level.of.development)

# Uji Chi-square untuk independensi 
chisq.test(tabel_idn)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel_idn
X-squared = 26.222, df = 1, p-value = 3.043e-07
    Pearson's Chi-squared test with Yates'continuity correction   
    
data:  tabel_idn  
X-squared = 26.222, df = 1, p-value = 3.043e-07

Nilai p-value (3.043e-07) < 0.05 maka menolak H0. Dapat disimpulkan bahwa ada hubungan yang signifikan secara statistik antara keanggotaan Uni Eropa dan tingkat pembangunan suatu negara.

B. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)

# Uji Mann-Whitney untuk Women Entrepreneurship Index
wilcox.test(data$Women.Entrepreneurship.Index ~ data$European.Union.Membership)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  data$Women.Entrepreneurship.Index by data$European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
      Wilcoxon rank sum test with continuity correction
      
data:  data$Women.Entrepreneurship.Index by data$European.Union.Membership  
W = 536, p-value = 1.358e-05  
alternative hypothesis: true location shift is not equal to 0    

Warning message: In wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...) :   cannot compute exact p-value with ties
# Uji Mann-Whitney untuk Global Entrepreneurship Index
wilcox.test(data$Entrepreneurship.Index ~ data$European.Union.Membership)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  data$Entrepreneurship.Index by data$European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
        Wilcoxon rank sum test with continuity correction
        
data:  data$Entrepreneurship.Index by data$European.Union.Membership  
W = 490, p-value = 0.0005338  
alternative hypothesis: true location shift is not equal to 0   

Warning message: In wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...) :   cannot compute exact p-value with ties

Women Entrepreneurship Index:

P-value (1.358e-05) < 0.05, maka menolak H0. Terdapat perbedaan yang signifikan secara statistik antara kelompok negara yang menjadi anggota UE dan yang bukan anggota UE dalam hal Woman Entrepreneurship Index.

Global Entrepreneurhip Index:

W= 490, nilai statistik uji wilcoxon untuk indeks kewirausahaan global

P Value (0.0005338) <0.05, maka tolak H0. artinya terdapat perbedaan signifikan antara negara anggota UE dan non UE dalam hal Global Entrepreneurship Index.

Kedua Uji (Uji Mann-Whitney untuk Global Entrepreneurship Index dan Uji Mann-Whitney untuk Global Entrepreneurship Index) menunjukkan bahwa ada perbedaan nilai indeks kewirausahaan antara kedua kelompok tersebut.

C. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Wanita dan Indeks Kewirausahaan Global?

# Menghitung korelasi antara Women Entrepreneurship Index dan Entrepreneurship Index
Korelasi <- cor(data$Women.Entrepreneurship.Index, data$Entrepreneurship.Index)
print(Korelasi)
[1] 0.9145797
[1] 0.9145797

Nilai koefisien korelasi sebesar 0.9145797 menunjukkan adanya hubungan yang sangat kuat dan positif antara Women Entrepreneurship index dan Entrepreneurship Index.

Didapatkan bahwa skor korelasi sebesar 0.9145797, yang mana nilai ini sangat mendekati +1. Dengan demikian, kita dapat menyimpulkan bahwa terdapat hubungan yang kuat antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index. Artinya, semakin tinggi tingkat kewirausahaan perempuan di suatu negara, cenderung semakin tinggi pula tingkat kewirausahaan secara keseluruhan di negara tersebut.