Tugas Individu Statistik

Author

Konselia D. Vera

Tugas Individu Latihan Uji Chi Square dan Non-Parametrik

Latihan terdiri dari 9 soal, pengerjaan dilakukan setelah soal di tulis. Berikut latihan soal uji chi square dan Non-parametrik yang telah saya kerjakan.

Soal dan Jawaban

  1. Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah pendistribusiannya seragam.

```{#Frekuensi distribusi} distribution <- c(345, 370, 360, 342, 356, 330, 310)

Uji chi-square dengan asumsi distribusi seragam

chisq.test(x = distribution, p = rep(1/length(distribution), length(distribution)))

Chi-squared test for given probabilities  

data:  distribution 
X-squared = 7.0477, df = 6, p-value = 0.3165

Nilai p-value (0.316) \> 0.05 maka Gagal Menolak H0. Sehingga dapat disimpulkan bahwa Tidak terdapat bukti yang cukup untuk menyatakan bahwa distribusi yang diamati berbeda secara signifikan dari distribusi yang diharapkan.

Berdasarkan uji Chi-Square Goodness of Fit, diperoleh nilai χ² = 7.05 dengan derajat bebas 6 dan p-value sebesar 0.3165. Karena p-value lebih besar dari taraf signifikansi 0.05, maka tidak terdapat cukup bukti untuk menolak hipotesis nol. Dengan demikian, distribusi yang diamati tidak berbeda secara signifikan dari distribusi yang diharapkan. Hal ini menunjukkan bahwa data dapat dianggap menyebar secara merata atau sesuai dengan proporsi yang ditentukan.

2.  Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

    ```{#Frekuensi pemilihan}
    vote <- c(260,240,300,200)

    # Uji chi-square dengan asumsi distribusi seragam 
    chisq.test(x = vote, p = rep(1/length(vote), length(vote)))
    ```

    ```         
    Chi-squared test for given probabilities  

    data:  vote 
    X-squared = 20.8, df = 3, p-value = 0.0001158
    ```

    Nilai p-value (0.0001158) \< 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat.

    Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 20.8 dengan derajat bebas 3 dan p-value sebesar 0.00012. Karena nilai p jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pemilih tidak memilih secara merata keempat kandidat. Terdapat perbedaan signifikan dalam jumlah pemilih yang memilih masing-masing kandidat.

2.  Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

    ```{#Frekuensi warna mobil}
    color <- c(90,60,50,40)

    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x=color, p = rep(1/length(color), length(color)))
    ```

    ```         
    Chi-squared test for given probabilities

    data:  color 
    X-squared = 23.333, df = 3, p-value = 3.441e-05
    ```

Nilai p-value (3.441e-05) \< 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa mahasiswa memiliki preferensi khusus terhadap warna mobil.

Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 23.333 dengan derajat bebas 3 dan p-value sebesar 0.00003441. Karena p-value jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan signifikan dalam distribusi warna mobil di kampus. Artinya, mahasiswa memiliki preferensi warna tertentu terhadap mobil yang mereka gunakan.

4.   Gunakan data di bawah ini

|           | Suka Film A | Suka Film B |
|-----------|-------------|-------------|
| Laki-laki | 60          | 40          |
| Perempuan | 50          | 70          |

Apakah jenis kelamin berpengaruh terhadap preferensi film?

```{# Membuat tabel kontingensi}
tabel1 <- matrix(c(60,40,50,70), nrow = 2, byrow = TRUE)
colnames(tabel1) <- c("Suka Film A", "Suka Film B")
rownames(tabel1) <- c("Laki-laki", "Perempuan")
tabel1
            Suka Film A Suka Film B
  Laki-laki          60          40 
 Perempuan          50          70

{# Uji Chi-square untuk independensi} chisq.test(tabel1)

    Pearson's Chi-squared test with Yates' continuity correction  
    
    data:  tabel1
    X-squared = 6.6183, df = 1, p-value = 0.01009

nilai p-value (0.01009) < 0.05 maka Tolak H0. Sehinga ada hubungan antara jenis kelamin dan preferensi film A dan film B.

  1. Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:
Prodi Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10

{# Membuat tabel kontingensi} tabel2 <- matrix(c(20,10,5,15,20,10,10,25,10), nrow = 3, byrow = TRUE) colnames(tabel2) <- c("Kost", "Rumah Orang Tua", "Asrama") rownames(tabel2) <- c("Statistik", "Komputer", "Ekonomi") tabel2

            Kost  Rumah Orang Tua Asrama 
Statistik   20              10      5 
Komputer    15              20     10 
Ekonomi     10              25     10

{# Uji Chi-square untuk independensi} chisq.test(tabel2)

      Pearson's Chi-squared test  
data:  tabel2 
X-squared = 10.863, df = 4, p-value = 0.02815 

nilai p-value (0.02815) < 0.05 maka Tolak H0. Sehingga ada hubungan antara program studi dan tempat tinggal.

  1. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan yang signifikan? Tes Tanda Tangan

{install.packages("BSDA")}

library(BSDA)
Loading required package: lattice  

Attaching package: ‘BSDA’  

The following object is masked from ‘package:datasets’:  

    Orange 
    
Warning message: 
package ‘BSDA’ was built under R version 4.4.3 

```{library(BSDA)}

SIGN.test(x=24, n=33, alternative = “two.sided”)

  One-sample Sign-Test  

data: 24 s = 1, p-value = 1 alternative hypothesis: true median is not equal to 0 0 percent confidence interval:
24 24 sample estimates: median of x 24


karena p-value = 1, maka tidak ada bukti statistik untuk menyimpulkan bahwa terdapat perbedaan arah perubahan yang signifikan kelompok yang diuji.

7.  Gunakan Wilcoxon:

-   Skor sebelum pelatihan: 75, 70, 68, 72, 69

-   Skor sesudahnya: 78, 74, 70, 75, 72

```{#Skor pelatihan}
Sebelum <- c(75, 70, 68, 72, 69)
Sesudah <- c(78, 74, 70, 75, 72)
wilcox.test(Sebelum, Sesudah, paired = TRUE)
Wilcoxon signed rank test with continuity correction  

data:  Sebelum and Sesudah 
V = 0, p-value = 0.05447 
alternative hypothesis: true location shift is not equal to 0
 Warning message: In wilcox.test.default(Sebelum, Sesudah, paired = TRUE) :   cannot compute exact p-value with ties

nilai p-value (0.05447) > 0.05, maka tidak cukup bukti untuk menolak H0. tidak terdapat perbedaan yang signifikan secara statistik antara kondisi “Sebelum” dan “Sesudah” pelatihan.

  1. Gunakan Mann-Whitney:
  • Kelompok A: 62, 65, 66, 70, 68

  • Kelompok B: 58, 60, 59, 63, 61

B <- c(58, 60, 59, 63, 61)
wilcox.test(A,B)
    Wilcoxon rank sum exact test
    
data:  A and B 
W = 24, p-value = 0.01587 
alternative hypothesis: true location shift is not equal to 0

nilai p-value (0.01587) > 0.05, maka tolak H0. artinya terdapat perbedaan yang signifikan antara kelompok A dan kelompok B.

  1. Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.

    A. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?

    B. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)

    C. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Wanita dan Indeks Kewirausahaan Global?

Lakukan impor Dasatset.csv pada R studio agar data dapat digunakan.

data <- read.csv("C:\\Users\\MyBook Hype AMD\\Downloads\\Dataset3.csv", sep = ";")

A. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?

# Membuat tabel kontingensi
tabel_idn <- table (data$European.Union.Membership, data$Level.of.development)

# Uji Chi-square untuk independensi 
chisq.test(tabel_idn)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel_idn
X-squared = 26.222, df = 1, p-value = 3.043e-07
    Pearson's Chi-squared test with Yates'continuity correction  

data:  tabel_idn 
X-squared = 26.222, df = 1, p-value = 3.043e-07

nilai p-value (3.043e-07) < 0.05 maka menolak H0. Dapat disimpulkan bahwa ada hubungan yang signifikan secara statistik antara keanggotaan Uni Eropa dan tingkat pembangunan suatu negara.

B. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)

# Uji Mann-Whitney untuk Women Entrepreneurship Index
wilcox.test(data$Women.Entrepreneurship.Index ~ data$European.Union.Membership)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  data$Women.Entrepreneurship.Index by data$European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0
      Wilcoxon rank sum test with continuity correction  

data:  data$Women.Entrepreneurship.Index by data$European.Union.Membership 
W = 536, p-value = 1.358e-05 
alternative hypothesis: true location shift is not equal to 0  

Warning message: In wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...) :   cannot compute exact p-value with ties
# Uji Mann-Whitney untuk Global Entrepreneurship Index
wilcox.test(data$Entrepreneurship.Index ~ data$European.Union.Membership)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  data$Entrepreneurship.Index by data$European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0
        Wilcoxon rank sum test with continuity correction  
        
data:  data$Entrepreneurship.Index by data$European.Union.Membership 
W = 490, p-value = 0.0005338 
alternative hypothesis: true location shift is not equal to 0  

Warning message: In wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...) :   cannot compute exact p-value with ties

Women Entrepreneurship Index:

P-value (1.358e-05) < 0.05, maka menolak H0. Terdapat perbedaan yang signifikan secara statistik antara kelompok negara yang menjadi anggota UE dan yang bukan anggota UE dalam hal Woman Entrepreneurship Index.

Global Entrepreneurhip Index:

W= 490, nilai statistik uji wilcoxon untuk indeks kewirausahaan global

P Value (0.0005338) <0.05, maka tolak H0. artinya terdapat perbedaan signifikan antara negara anggota UE dan non UE dalam hal Global Entrepreneurship Index.

Kedua Uji (Uji Mann-Whitney untuk Global Entrepreneurship Index dan Uji Mann-Whitney untuk Global Entrepreneurship Index) menunjukkan bahwa ada perbedaan nilai indeks kewirausahaan antara kedua kelompok tersebut.

C. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Wanita dan Indeks Kewirausahaan Global?

# Menghitung korelasi antara Women Entrepreneurship Index dan Entrepreneurship Index
Korelasi <- cor(data$Women.Entrepreneurship.Index, data$Entrepreneurship.Index)
print(Korelasi)
[1] 0.9145797
[1] 0.9145797

Nilai koefisien korelasi sebesar 0.9145797 menunjukkan adanya hubungan yang sangat kuat dan positif antara Women Entrepreneurship index dan Entrepreneurship Index.

Didapatkan bahwa skor korelasi sebesar 0.9145797, yang mana nilai ini sangat mendekati +1. Dengan demikian, kita dapat menyimpulkan bahwa terdapat hubungan yang kuat antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index. Artinya, semakin tinggi tingkat kewirausahaan perempuan di suatu negara, cenderung semakin tinggi pula tingkat kewirausahaan secara keseluruhan di negara tersebut.