Tugas Mandiri Praktikum STK1517 Tahun 2025

Author

Nabila An Nadjib I3502241004

Statistika untuk Ilmu Sosial dan Perilaku (STK1517)

Latihan Uji Chi-Square dan Non-Parametrik

  1. Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

    Jawab:

    Jumlah kelahiran per hari selama satu minggu

    Hari Jumlah Kelahiran
    Senin 345
    Selasa 370
    Rabu 360
    Kamis 342
    Jumat 356
    Sabtu 330
    Minggu 310

    Hipotesis:
    H0 : Jumlah kelahiran per hari selama seminggu merata
    H1 : Jumlah kelahiran per hari selama seminggu tidak merata

    # Frekuensi observasi
    observed <- c(345, 370, 360, 342, 356, 330, 310)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x = observed, p = rep(1/length(observed), length(observed)))
    
        Chi-squared test for given probabilities
    
    data:  observed
    X-squared = 7.0477, df = 6, p-value = 0.3165

    Kesimpulan:
    Nilai p-value (0.3165) > 0.05, maka gagal menolak H0. Sehingga tidak ada cukup bukti untuk menyimpulkan bahwa distribusi jumlah kelahiran per hari selama seminggu tidak merata.

  2. Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

    Jawab:

    Jumlah pemilih 4 kandidat
    Kandidat Jumlah
    A 260
    B 240
    C 300
    D 200

    Hipotesis:
    H0 : Jumlah pemilih yang memilih 4 kandidat merata
    H1 : Jumlah pemilih yang memilih 4 kandidat tidak merata

    # Frekuensi observasi
    observed <- c(260, 240, 300, 200)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x = observed, p = rep(1/length(observed), length(observed)))
    
        Chi-squared test for given probabilities
    
    data:  observed
    X-squared = 20.8, df = 3, p-value = 0.0001158

    Kesimpulan:
    Nilai p-value (0.0001158) < 0.05, maka tolak H0. Sehingga dapat disimpulkan bahwa distribusi jumlah pemilih yang memilih 4 kandidat tidak merata.

  3. Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

    Jawab:

    Distribusi warna mobil di kampus
    Warna Mobil Jumlah
    Hitam 90
    Putih 60
    Abu-Abu 50
    Merah 40

    Hipotesis :
    H0 : Tidak ada preferensi warna (semua warna dipilih secara merata)
    H1 : Ada preferensi warna (setidaknya satu warna dipilih secara signifikan berbeda)

    # Frekuensi observasi
    observed <- c(90, 60, 50, 40)
    
    # Uji chi-square dengan asumsi distribusi seragam
    chisq.test(x = observed, p = rep(1/length(observed), length(observed)))
    
        Chi-squared test for given probabilities
    
    data:  observed
    X-squared = 23.333, df = 3, p-value = 3.441e-05

    Kesimpulan:
    Nilai p-value < 0.05, maka tolak H0. Sehingga dapat disimpulkan bahwa ada preferensi warna mobil di kampus. Dengan kata lain, warna mobil tidak terdistribusi merata, ada warna yang lebih disukai daripada yang lain.

  4. Gunakan data di bawah ini

Suka Film A Suka Film B
Laki-Laki 60 40
Perempuan 50 70

Apakah jenis kelamin berpengaruh terhadap preferensi film?

Jawab:

Hipotesis:

H0 : Tidak ada hubungan (independen) antara jenis kelamin dengan preferensi film
H1 : Ada hubungan (tidak independen) antara jenis kelamin dengan preferensi film

# Membuat matriks kontingensi
tabel <- matrix(c(60, 40, 50, 70), nrow = 2, byrow = TRUE)
colnames(tabel) <- c("Suka Film A", "Suka Film B")
rownames(tabel) <- c("Laki-Laki", "Perempuan")
tabel
          Suka Film A Suka Film B
Laki-Laki          60          40
Perempuan          50          70
# Uji Chi-square untuk independensi
chisq.test(tabel)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel
X-squared = 6.6183, df = 1, p-value = 0.01009

Kesimpulan:
Nilai p-value (0.01009) < 0.05, maka tolak H0. Sehingga dapat disimpulkan bahwa ada hubungan yang signifikan antara jenis kelamin dengan preferensi film.

  1. Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:
Jawab:
Prodi Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10

Hipotesis:

H0 : Tidak ada hubungan (independen) antara program studi dengan tempat tinggal
H1 : Ada hubungan (tidak independen) antara program studi dengan tempat tinggal

# Membuat matriks kontingensi
tabel <- matrix(c(20,10,5,15,20,10,10,25,10), nrow = 3, byrow = TRUE)
colnames(tabel) <- c("Kost", "Rumah Orang Tua", "Asrama")
rownames(tabel) <- c("Statistik", "Komputer", "Ekonomi")
tabel
          Kost Rumah Orang Tua Asrama
Statistik   20              10      5
Komputer    15              20     10
Ekonomi     10              25     10
# Uji Chi-square untuk independensi
chisq.test(tabel)

    Pearson's Chi-squared test

data:  tabel
X-squared = 10.863, df = 4, p-value = 0.02815

Kesimpulan:
Nilai p-value (0.02815) < 0.05, maka tolak H0. Sehingga dapat disimpulkan bahwa ada hubungan yang signifikan antara program studi dengan tempat tinggal.

  1. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Sign Test

    Jawab:

    Hipotesis:

    H0 : Tidak ada perbedaan signifikan
    H1 : Ada perbedaan signifikan

    Dalam kasus ini digunakan fungsi binom.test(), bukan SIGN.test() karena data yang tersedia bukan berupa pasangan nilai individual (sebelum dan sesudah), melainkan hanya berupa jumlah siswa yang mengalami peningkatan, penurunan, dan tidak berubah. Fungsi SIGN.test() memerlukan input data dalam bentuk vektor nilai berpasangan, sedangkan binom.test() lebih tepat digunakan untuk menguji proporsi dua kemungkinan (misalnya, naik vs turun) ketika hanya diketahui jumlah kasusnya, sebagaimana dalam uji sign berbasis frekuensi.

    # Jumlah siswa dengan nilai naik dan turun
    successes <- 24  # nilai meningkat
    n <- 32          # total perubahan (tidak termasuk yang nilainya tetap)
    
    # Sign test: uji binomial (dua arah)
    binom.test(successes, n, p = 0.5, alternative = "two.sided")
    
        Exact binomial test
    
    data:  successes and n
    number of successes = 24, number of trials = 32, p-value = 0.007
    alternative hypothesis: true probability of success is not equal to 0.5
    95 percent confidence interval:
     0.5659506 0.8853840
    sample estimates:
    probability of success 
                      0.75 

    Kesimpulan:

    Karena p value (0.007) < 0.05, maka tolak H0. Maka terdapat bukti statistik secara signifikan antara nilai sebelum dan sesudah kursus.

  2. Gunakan Wilcoxon:

    Skor sebelum pelatihan: 75, 70, 68, 72, 69
    Skor sesudah: 78, 74, 70, 75, 72

    Jawab:

    Hipotesis:

    H0 : Tidak ada perbedaan yang signifikan antara skor sebelum dan sesudah pelatihan
    H1 : Ada perbedaan yang signifikan antara skor sebelum dan sesudah pelatihan

    # Data skor sebelum dan sesudah pelatihan
    sebelum <- c(75,70,68,72,69)
    sesudah <- c(78,74,70,75,72)
    
    wilcox.test(sebelum, sesudah, paired = TRUE)
    Warning in wilcox.test.default(sebelum, sesudah, paired = TRUE): cannot compute
    exact p-value with ties
    
        Wilcoxon signed rank test with continuity correction
    
    data:  sebelum and sesudah
    V = 0, p-value = 0.05447
    alternative hypothesis: true location shift is not equal to 0
    wilcox.test(sebelum, sesudah, paired = TRUE, correct=FALSE)
    Warning in wilcox.test.default(sebelum, sesudah, paired = TRUE, correct =
    FALSE): cannot compute exact p-value with ties
    
        Wilcoxon signed rank test
    
    data:  sebelum and sesudah
    V = 0, p-value = 0.03936
    alternative hypothesis: true location shift is not equal to 0

    Kesimpulan:

    Dengan continuity correction, nilai p-value (0.05447) > 0.05, maka gagal menolak H0. sehingga tidak ada cukup bukti untuk menyimpulkan bahwa ada perbedaan yang signifikan antara skor sebelum dan sesudah pelatihan.

    Namun, tanpa koreksi kontinuitas, nilai p-value (0.03936) < 0.05, tolak H0. Hasil menjadi signifikan yang menunjukkan adanya perbedaan yang signifikan antara skor sebelum dan sesudah pelatihan.

  3. Gunakan Mann-Whitney:

  • Kelompok A: 62, 65, 66, 70, 68

  • Kelompok B: 58, 60, 59, 63, 61

    Jawab:

    Hipotesis:

    H0 : Tidak ada perbedaan yang signifikan antara Kelompok A dan Kelompok B
    H1 : Ada perbedaan yang signifikan antara Kelompok A dan Kelompok B

    KelompokA <- c(62,65,66,70,68)
    KelompokB <- c(58,60,59,63,61)
    
    wilcox.test(KelompokA, KelompokB)
    
        Wilcoxon rank sum exact test
    
    data:  KelompokA and KelompokB
    W = 24, p-value = 0.01587
    alternative hypothesis: true location shift is not equal to 0

    Kesimpulan:

    Nilai p-value (0.01587) < 0.05, tolak H0. Ada perbedaan yang signifikan antara Kelompok A dan Kelompok B.

  1. Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.
  • Are European Union membership variable and development variable independent from each other?

  • Do the Women Entrepreneurship Index and Global Entrepreneurship Index values show a statistically significant difference between the countries that are members of the European Union and not? (Method Mann-Whitney U)

  • Is there a statistically significant relationship between Women’s Entrepreneurship Index and Global Entrepreneurship Index values?

Jawab:

# membaca dataset
dataset <- read.csv2("D:\\Kuliah S2\\Semester 2\\MK. Statistika Ilmu Sosial\\Praktikum\\Latihan Uji Chi-Square dan Nonparametrik\\Dataset3.csv")
  • Are European Union membership variable and development variable independent from each other?

    Hipotesis:

    H0 : Tidak ada hubungan (independen) antara European Union membership dengan Level of Development
    H1 : Terdapat hubungan (tidak independen) antara European Union membership dengan Level of Development

    # melihat nama kolom dan mengecek isinya
    names(dataset)
    [1] "No"                                   
    [2] "Country"                              
    [3] "Level.of.development"                 
    [4] "European.Union.Membership"            
    [5] "Currency"                             
    [6] "Women.Entrepreneurship.Index"         
    [7] "Entrepreneurship.Index"               
    [8] "Inflation.rate"                       
    [9] "Female.Labor.Force.Participation.Rate"
    table(dataset$European.Union.Membership)
    
        Member Not Member 
            20         31 
    table(dataset$Level.of.development)
    
     Developed Developing 
            27         24 
    # membuat tabel kontingensi
    table_EU_Dev <- table(dataset$European.Union.Membership, dataset$Level.of.development)
    print(table_EU_Dev)
    
                 Developed Developing
      Member            20          0
      Not Member         7         24
    # melakukan uji chi-square
    chisq.test(table_EU_Dev)
    
        Pearson's Chi-squared test with Yates' continuity correction
    
    data:  table_EU_Dev
    X-squared = 26.222, df = 1, p-value = 3.043e-07

    Kesimpulan:

    Karena nilai p-value < 0.05, maka kita menolak H₀. Terdapat hubungan yang signifikan secara statistik antara European Union membership dengan Level of Development. Negara anggota Uni Eropa cenderung memiliki status pembangunan yang berbeda dibandingkan dengan non-anggota.

  • Do the Women Entrepreneurship Index and Global Entrepreneurship Index values show a statistically significant difference between the countries that are members of the European Union and not? (Method Mann-Whitney U)

    Hipotesis:

    a) Women Entrepreneurship Index (WEI)

    H0: Tidak ada perbedaan signifikan nilai WEI antara member EU dan non-member EU
    H1: Ada perbedaan signifikan nilai WEI antara member EU dan non-member EU

    b) Global Entrepreneurship Index (GEI)

    H0: Tidak ada perbedaan signifikan nilai GEI antara member EU dan non-member EU
    H1: Ada perbedaan signifikan nilai WEI antara member EU dan non-member EU

    # Load data
    data <- read.csv2("D:\\Kuliah S2\\Semester 2\\MK. Statistika Ilmu Sosial\\Praktikum\\Latihan Uji Chi-Square dan Nonparametrik\\Dataset3.csv")
    
    # Ubah kolom EU menjadi faktor
    data$European.Union.Membership <- as.factor(data$European.Union.Membership)
    
    # Ubah WEI menjadi numerik
    data$Women.Entrepreneurship.Index <- as.numeric(data$Women.Entrepreneurship.Index)
    
    # Ubah GEI menjadi numerik
    data$Entrepreneurship.Index <- as.numeric(data$Entrepreneurship.Index)
    
    # Uji Mann-Whitney untuk WEI
    wilcox.test(Women.Entrepreneurship.Index ~ European.Union.Membership, data = data)
    Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
    compute exact p-value with ties
    
        Wilcoxon rank sum test with continuity correction
    
    data:  Women.Entrepreneurship.Index by European.Union.Membership
    W = 536, p-value = 1.358e-05
    alternative hypothesis: true location shift is not equal to 0
    # Uji Mann-Whitney untuk GEI
    wilcox.test(Entrepreneurship.Index ~ European.Union.Membership, data = data)
    Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
    compute exact p-value with ties
    
        Wilcoxon rank sum test with continuity correction
    
    data:  Entrepreneurship.Index by European.Union.Membership
    W = 490, p-value = 0.0005338
    alternative hypothesis: true location shift is not equal to 0

    Kesimpulan:

    Karena p-value WEI = 0.00001358 < 0.05, maka Tolak H₀. Ada perbedaan signifikan antara member EU dan non-EU dalam hal Women Entrepreneurship Index.

    Karena p-value GEI = 0.0005338 < 0.05, maka Tolak H₀. Ada perbedaan signifikan antara member EU dan non-EU dalam hal Global Entrepreneurship Index.

  • Is there a statistically significant relationship between Women’s Entrepreneurship Index and Global Entrepreneurship Index values?

    H0 : Tidak ada hubungan yang signifikan antara WEI dan GEI
    H1 : Ada hubungan yang signifikan antara WEI dan GEI

    # Load data
    data <- read.csv2("D:\\Kuliah S2\\Semester 2\\MK. Statistika Ilmu Sosial\\Praktikum\\Latihan Uji Chi-Square dan Nonparametrik\\Dataset3.csv")
    
    data$Women.Entrepreneurship.Index <- as.numeric(data$Women.Entrepreneurship.Index)
    
    # uji normalitas data WEI
    shapiro.test(data$Women.Entrepreneurship.Index)
    
        Shapiro-Wilk normality test
    
    data:  data$Women.Entrepreneurship.Index
    W = 0.94077, p-value = 0.01318

    Berdasarkan hasil uji normalitas, diketahui bahwa p-Value 0.01 < 0.05 yang menyimpulkan bahwa sebaran WEI tidak menyebar normal.

    data$Entrepreneurship.Index <- as.numeric(data$Entrepreneurship.Index)
    
    # uji normalitas data GEI
    shapiro.test(data$Entrepreneurship.Index)
    
        Shapiro-Wilk normality test
    
    data:  data$Entrepreneurship.Index
    W = 0.91004, p-value = 0.0009261

    Berdasarkan hasil uji normalitas, diketahui bahwa p-Value 0.0009 < 0.05 yang menyimpulkan bahwa sebaran GEI tidak menyebar normal.

    Karena sebaran WEI dan GEI tidak menyebar normal, maka dilakukan Uji Spearman.

    cor.test(data$Women.Entrepreneurship.Index, data$Entrepreneurship.Index, method = "spearman")
    Warning in cor.test.default(data$Women.Entrepreneurship.Index,
    data$Entrepreneurship.Index, : Cannot compute exact p-value with ties
    
        Spearman's rank correlation rho
    
    data:  data$Women.Entrepreneurship.Index and data$Entrepreneurship.Index
    S = 2038.6, p-value < 2.2e-16
    alternative hypothesis: true rho is not equal to 0
    sample estimates:
          rho 
    0.9077539 

    Kesimpulan:
    Nilai p-value < 0.05, maka tolak H0. Terdapat hubungan yang signifikan secara statistik antara WEI dan GEI. Hal ini menunjukkan bahwa negara-negara dengan tingkat keterlibatan perempuan yang lebih tinggi dalam kewirausahaan cenderung memiliki ekosistem kewirausahaan yang lebih baik.