Asy Khofsah_Tugas UAS-Individu

Author

Asy Khofsah

Tugas Individu : Latihan Analisis Non-Parametrik

  1. Gunakan data berikut : Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

    H0 : Distribusi jumlah kelahiran per hari selama satu minggu seragam

    H1 : Distribusi jumlah kelahiran per hari tidak seragam

    #Frekuensi distribusi
    distribution <- c(345, 370, 360, 342, 356, 330, 310)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x = distribution, p = rep(1/length(distribution), length(distribution)))
    
        Chi-squared test for given probabilities
    
    data:  distribution
    X-squared = 7.0477, df = 6, p-value = 0.3165

    Nilai p-value > 0.05 maka Gagal Menolak H0. Sehingga dapat disimpulkan bahwa Tidak terdapat bukti yang cukup untuk menyatakan bahwa distribusi yang diamati berbeda secara signifikan dari distribusi yang diharapkan.

    Berdasarkan uji Chi-Square Goodness of Fit, diperoleh nilai χ² = 7.05 dengan derajat bebas 6 dan p-value sebesar 0.3165. Karena p-value lebih besar dari taraf signifikansi 0.05, maka tidak terdapat cukup bukti untuk menolak hipotesis nol. Dengan demikian, distribusi yang diamati tidak berbeda secara signifikan dari distribusi yang diharapkan. Hal ini menunjukkan bahwa data dapat dianggap menyebar secara merata atau sesuai dengan proporsi yang ditentukan.

  2. Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

    H0 : Pilihan pemilih sama untuk keempat kandidat

    H1 : Pilihan pemilih tidak merata

    #Frekuensi pemilihan
    vote <- c(260,240,300,200)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x = vote, p = rep(1/length(vote), length(vote)))
    
        Chi-squared test for given probabilities
    
    data:  vote
    X-squared = 20.8, df = 3, p-value = 0.0001158

    Nilai p-value < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat.

    Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 20.8 dengan derajat bebas 3 dan p-value sebesar 0.00012. Karena nilai p jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pemilih tidak memilih secara merata keempat kandidat. Terdapat perbedaan signifikan dalam jumlah pemilih yang memilih masing-masing kandidat.

  3. Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

    H0 : Mahasiswa tidak memiliki preferensi khusus terhadap warna mobil

    H1 : Mahasiswa memiliki preferensi khusus terhadap warna mobil

    #Frekuensi warna mobil
    color <- c(90,60,50,40)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x=color, p = rep(1/length(color), length(color)))
    
        Chi-squared test for given probabilities
    
    data:  color
    X-squared = 23.333, df = 3, p-value = 3.441e-05

    Nilai p-value < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa mahasiswa memiliki preferensi khusus terhadap warna mobil.

    Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 23.333 dengan derajat bebas 3 dan p-value sebesar 0.00003441. Karena p-value jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak.
    Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan signifikan dalam distribusi warna mobil di kampus. Artinya, mahasiswa memiliki preferensi warna tertentu terhadap mobil yang mereka gunakan.

  4. Uji pengaruh jenis kelamin terhadap preferensi film

    H0 : Tidak ada hubungan antara jenis kelamin dan preferesni film

    H1 : Ada hubungan antara jenis kelamin dan preferensi film

    # Membuat tabel kontingensi
    tabel1 <- matrix(c(60,40,50,70), nrow = 2, byrow = TRUE)
    colnames(tabel1) <- c("Suka Film A", "Suka Film B")
    rownames(tabel1) <- c("Laki-laki", "Perempuan")
    tabel1
              Suka Film A Suka Film B
    Laki-laki          60          40
    Perempuan          50          70
    # Uji Chi-square untuk independensi
    chisq.test(tabel1)
    
        Pearson's Chi-squared test with Yates' continuity correction
    
    data:  tabel1
    X-squared = 6.6183, df = 1, p-value = 0.01009

    nilai p-value < 0.05 maka Tolak H0. Sehinga ada hubungan antara jenis kelamin dan preferensi film A dan film B.

  5. Uji hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama)

    H0 : Tidak ada hubungan antara program studi dan tempat tinggal

    H1 : Ada hubungan antara program studi dan tempat tinggal

    # Membuat tabel kontingensi
    tabel2 <- matrix(c(20,10,5,15,20,10,10,25,10), nrow = 3, byrow = TRUE)
    colnames(tabel2) <- c("Kost", "Rumah Orang Tua", "Asrama")
    rownames(tabel2) <- c("Statistik", "Komputer", "Ekonomi")
    tabel2
              Kost Rumah Orang Tua Asrama
    Statistik   20              10      5
    Komputer    15              20     10
    Ekonomi     10              25     10
    # Uji Chi-square untuk independensi
    chisq.test(tabel2)
    
        Pearson's Chi-squared test
    
    data:  tabel2
    X-squared = 10.863, df = 4, p-value = 0.02815

    nilai p-value < 0.05 maka Tolak H0. Sehingga ada hubungan antara program studi dan tempat tinggal.

  6. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan dan 3 sama. Apakah ada perbedaan signifikan? (Menggunakan Sign Test)

    Note :

    a. Perlu melakukan instal package “BSDA” untuk memanggil library BSDA dan menjalankan SIGN.test

    b. Karena terdapat 3 peserta yang tidak mengalami perubahan (nol), maka dihilangkan dari perhitungan, sehingga total n adalah 32

    library(BSDA)
    Loading required package: lattice
    
    Attaching package: 'BSDA'
    The following object is masked from 'package:datasets':
    
        Orange
    SIGN.test(x=24, n=32, alternative = "two.sided")
    
        One-sample Sign-Test
    
    data:  24
    s = 1, p-value = 1
    alternative hypothesis: true median is not equal to 0
    0 percent confidence interval:
     24 24
    sample estimates:
    median of x 
             24 

    karena p-value = 1, maka tidak ada bukti statistik untuk menyimpulkan bahwa terdapat perbedaan arah perubahan yang signifikan kelompok yang diuji.

  7. Uji Wilcoxon

    #Skor pelatihan
    Sebelum <- c(75, 70, 68, 72, 69)
    Sesudah <- c(78, 74, 70, 75, 72)
    wilcox.test(Sebelum, Sesudah, paired = TRUE)
    Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
    exact p-value with ties
    
        Wilcoxon signed rank test with continuity correction
    
    data:  Sebelum and Sesudah
    V = 0, p-value = 0.05447
    alternative hypothesis: true location shift is not equal to 0

    nilai p-value > 0.05, maka gagal tolak H0. Artinya, tidak ada bukti yang cukup untuk mengatakan bahwa terdapat perbedaan yang signifikan antara kondisi “Sebelum” dan “Sesudah” pelatihan.

    Note :

    menggunakan fungsi exact = FALSE karena terdapat nilai yang sama (ties) pada data sebelum dan sesudah pelatihan.

  8. Uji Mann-Whitney

    A <- c(62, 65, 66, 70, 68)
    B <- c(58, 60, 59, 63, 61)
    wilcox.test(A,B)
    
        Wilcoxon rank sum exact test
    
    data:  A and B
    W = 24, p-value = 0.01587
    alternative hypothesis: true location shift is not equal to 0

    nilai p-value < 0.05, maka tolak H0. Sehingga, ada perbedaan yang signifikan antara kelompok A dan kelompok B.

  9. Dataset

    Note :

    Perlu dilakukan impor Dasatset.csv pada R studio agar data dapat digunakan

     my_data <- read.csv("~/Documents/STS/Dataset3.csv", sep = ";")
     str(my_data)
    'data.frame':   51 obs. of  9 variables:
     $ No                                   : int  4 6 17 18 19 20 22 28 30 34 ...
     $ Country                              : chr  "Austria" "Belgium" "Estonia" "Finland" ...
     $ Level.of.development                 : chr  "Developed" "Developed" "Developed" "Developed" ...
     $ European.Union.Membership            : chr  "Member" "Member" "Member" "Member" ...
     $ Currency                             : chr  "Euro" "Euro" "Euro" "Euro" ...
     $ Women.Entrepreneurship.Index         : num  54.9 63.6 55.4 66.4 68.8 63.6 43 64.3 51.4 56.6 ...
     $ Entrepreneurship.Index               : num  64.9 65.5 60.2 65.7 67.3 67.4 42 65.3 41.3 54.5 ...
     $ Inflation.rate                       : num  0.9 0.6 -0.88 -0.2 0 0.5 -1.7 -0.3 0 0.2 ...
     $ Female.Labor.Force.Participation.Rate: num  67.1 58 68.5 67.7 60.6 69.9 42.5 59.4 47.2 66.4 ...
     names(my_data)
    [1] "No"                                   
    [2] "Country"                              
    [3] "Level.of.development"                 
    [4] "European.Union.Membership"            
    [5] "Currency"                             
    [6] "Women.Entrepreneurship.Index"         
    [7] "Entrepreneurship.Index"               
    [8] "Inflation.rate"                       
    [9] "Female.Labor.Force.Participation.Rate"

    a. Uji hubungan variabel European Union membership variable dan variabel development

    # Membuat tabel kontingensi
    tabel_idn <- table (my_data$European.Union.Membership, my_data$Level.of.development)
    
    # Uji Chi-square untuk independensi 
    chisq.test(tabel_idn)
    
        Pearson's Chi-squared test with Yates' continuity correction
    
    data:  tabel_idn
    X-squared = 26.222, df = 1, p-value = 3.043e-07

    nilai p-value < 0.05 maka Tolak H0. Sehingga terdapat hubungan yang signifikan secara statistik antara keanggotaan Uni Eropa dan tingkat pembangunan suatu negara.

    b. Uji signifikasi perbedaan nilai Women Entrepreneurship Index dan Entrepreneurship Index pada member European Union dan bukan member

    # Uji Mann-Whitney untuk Women Entrepreneurship Index
    wilcox.test(my_data$Women.Entrepreneurship.Index ~ my_data$European.Union.Membership)
    Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
    compute exact p-value with ties
    
        Wilcoxon rank sum test with continuity correction
    
    data:  my_data$Women.Entrepreneurship.Index by my_data$European.Union.Membership
    W = 536, p-value = 1.358e-05
    alternative hypothesis: true location shift is not equal to 0
    # Uji Mann-Whitney untuk Global Entrepreneurship Index
    wilcox.test(my_data$Entrepreneurship.Index ~ my_data$European.Union.Membership)
    Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
    compute exact p-value with ties
    
        Wilcoxon rank sum test with continuity correction
    
    data:  my_data$Entrepreneurship.Index by my_data$European.Union.Membership
    W = 490, p-value = 0.0005338
    alternative hypothesis: true location shift is not equal to 0

    nilai p-value > 0.05 untuk kedua uji, maka Gagal Tolak H0. Sehingga member European Union dan bukan member baik pada Women Entrepreneurship Index dan Entrepreneurship Index memiliki perbedaan yang siginifikan.

    c. Hubungan nilai Women’s Entrepreneurship Index and Global Entrepreneurship Index

    # Menghitung korelasi antara Women Entrepreneurship Index dan Entrepreneurship Index
    Korelasi <- cor(my_data$Women.Entrepreneurship.Index, my_data$Entrepreneurship.Index)
    print(Korelasi)
    [1] 0.9145797

    Nilai koefisien korelasi sebesar menunjukkan

    0.9145797

    Didapatkan bahwa skor korelasi sebesar 0.9145797, yang mana nilai ini sangat mendekati +1. Dengan demikian, kita dapat menyimpulkan bahwa terdapat hubungan yang kuat antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index. Artinya, semakin tinggi tingkat kewirausahaan perempuan di suatu negara, cenderung semakin tinggi pula tingkat kewirausahaan secara keseluruhan di negara tersebut.