Tugas Mandiri Praktikum STK1517 Tahun 2025

Author

Elfrida Oktaviani I3502241005

Statistika untuk Ilmu Sosial dan Perilaku (STK1517)

Uji Chi-Square dan Non-Parametrik

Latihan

Soal 1

Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

Jawab:

Penerapannya dalam R

Jumlah kelahiran per hari selama satu minggu

Hari Jumlah Kelahiran
Senin 345
Selasa 370
Rabu 360
Kamis 342
Jumat 356
Sabtu 330
Minggu 310
Total 2,413
# Frekuensi observasi
observed <- c(345, 370, 360, 342, 356, 330, 310)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed)))

    Chi-squared test for given probabilities

data:  observed
X-squared = 7.0477, df = 6, p-value = 0.3165

Hipotesis:

H0 : distribusi jumlah kelahiran per hari selama seminggu merata

H1 : distribusi jumlah kelahiran per hari selama seminggu tidak merata

Nilai p-value > 0.05, maka gagal menolak Hipotesis nol. Sehingga tidak terdapat cukup bukti statistik yang menyatakan bahwa distribusi jumlah kelahiran per hari selama seminggu tidak merata.


Soal 2

Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

Jawab:

Penerapannya dalam R

Jumlah pemilih 4 kandidat

Kandidat Jumlah Pemilih
A 260
B 240
C 300
D 200
Total 1,000
# Frekuensi observasi
observed <- c(260, 240, 300, 200)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed)))

    Chi-squared test for given probabilities

data:  observed
X-squared = 20.8, df = 3, p-value = 0.0001158

Hipotesis:

H0 : distribusi jumlah pemilih 4 kandidat merata

H1 : distribusi umlah pemilih 4 kandidat tidak merata

Nilai p-value < 0.05, maka tolak Hipotesis nol. Sehingga dapat disimpulkan bahwa distribusi jumlah pemilih 4 kandidat tidak merata.


Soal 3

Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

Jawab:

Penerapannya dalam R

Distribusi warna mobil di kampus

Warna Mobil Jumlah
Hitam 90
Putih 60
Abu-abu 50
Merah 40
Total 240
# Frekuensi observasi
observed <- c(90, 60, 50, 40)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed)))

    Chi-squared test for given probabilities

data:  observed
X-squared = 23.333, df = 3, p-value = 3.441e-05

Hipotesis:

H0 : Distribusi warna mobil merata (tidak ada preferensi warna yang sigfinikan)

H1 : Distribusi warna mobil tidak merata (ada preferensi warna yang signifikan)

Nilai p-value < 0.05, maka tolak Hipotesis nol. Sehingga dapat disimpulkan bahwa distribusi warna mobil di kampus tidak merata atau ada preferensi warna mobil yang signifikan.


Soal 4

Gunakan data di bawah ini

Suka Film A Suka Film B
Laki-laki 60 40
Perempuan 50 70

Apakah jenis kelamin berpengaruh terhadap preferensi film?

Jawab:

# Membuat matriks kontingensi
tabel <- matrix(c(60, 40, 50, 70), nrow = 2, byrow = TRUE)
colnames(tabel) <- c("Suka Film A", "Suka Film B")
rownames(tabel) <- c("Laki-laki", "Perempuan")
tabel
          Suka Film A Suka Film B
Laki-laki          60          40
Perempuan          50          70
# Uji Chi-square untuk independensi
chisq.test(tabel)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel
X-squared = 6.6183, df = 1, p-value = 0.01009

Hipotesis:

H0: Jenis kelamin tidak berpengaruh signifikan terhadap preferensi film

H1: Jenis kelamin berpengaruh signifikan terhadap preferensi film

Nilai p value < 0.05, maka tolak Hipotesis nol. Sehingga dapat disimpulkan bahwa jenis kelamin berpengaruh signifikan terhadap preferensi film.


Soal 5

Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:

Prodi Kost Rumah Orang Tua Asrama
Statistik 20 10 5
Komputer 15 20 10
Ekonomi 10 25 10

Jawab:

# Membuat matriks kontingensi
tabel <- matrix(c(20, 10, 5, 15, 20, 10, 10, 25, 10), nrow = 3, byrow = TRUE)
colnames(tabel) <- c("Kost", "Rumah Orang Tua", "Asrama")
rownames(tabel) <- c("Statistik", "Komputer", "Ekonomi")
tabel
          Kost Rumah Orang Tua Asrama
Statistik   20              10      5
Komputer    15              20     10
Ekonomi     10              25     10
# Uji Chi-square untuk independensi
chisq.test(tabel)

    Pearson's Chi-squared test

data:  tabel
X-squared = 10.863, df = 4, p-value = 0.02815

Hipotesis:

H0: Program Studi tidak berhubungan signifikan dengan tempat tinggal

H1: Program Studi berhubungan signifikan dengan tempat tinggal

Nilai p value < 0.05, maka tolak H0. Sehingga dapat disimpulkan bahwa Program Studi berhubungan signifikan dengan tempat tinggal.


Soal 6

24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Sign Test

Jawab:

#Uji awal menggunakan uji sign test
library(BSDA)
Warning: package 'BSDA' was built under R version 4.4.3
Loading required package: lattice

Attaching package: 'BSDA'
The following object is masked from 'package:datasets':

    Orange
SIGN.test(x=24, n=32, alternative = "two.sided")

    One-sample Sign-Test

data:  24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
 24 24
sample estimates:
median of x 
         24 

Hipotesis:

H0: Tidak ada perbedaan perubahan arah yang signifikan antara nilai sebelum dan sesudah kursus

H1: Ada perbedaan perubahan arah yang signifikan antara nilai sebelum dan sesudah kursus

Nilai p value = 1 atau lebih besar dari 0.05 (p value > 0.05), maka gagal tolak H0. Sehingga dapat disimpulkan bahwa tidak ada cukup bukti statistik yang menyatakan bahwa ada perbedaan perubahaan arah signifikan antara nilai sebelum dan sesudah kursus jika diuji menggunakan uji sign test.

Namun, untuk memastikan hasil tersebut, dilakukan uji binomial dua arah:

#Uji binomial (dua arah)
binom.test(24, 32, p = 0.5, alternative = "two.sided")

    Exact binomial test

data:  24 and 32
number of successes = 24, number of trials = 32, p-value = 0.007
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.5659506 0.8853840
sample estimates:
probability of success 
                  0.75 

Berbeda dengan uji sign test, hasil dari uji binomial dua arah menunjukkan p-value < 0.05, artinya tolak H0. hasil uji ini memberikan bukti statistik yang signifikan bahwa ada perbedaan perubahan arah yang signifikan antara nilai sebelum dan setelah mengikuti kursus jika diuji menggunakan binomial test.


Soal 7

Gunakan Wilcoxon:

  • Skor sebelum pelatihan: 75, 70, 68, 72, 69

  • Skor sesudah: 78, 74, 70, 75, 72

Jawab:

# Data sebelum dan sesudah pelatihan
Sebelum = c(75, 70, 68, 72, 69)
Sesudah = c(78, 74, 70, 75, 72)

wilcox.test(Sebelum, Sesudah, paired = TRUE)
Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
exact p-value with ties

    Wilcoxon signed rank test with continuity correction

data:  Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0

Hipotesis:

H0: Tidak ada perbedaan yang signifikan antara sebelum dan sesudah pelatihan

H1: Ada perbedaan yang signifikan antara sebelum dan sesudah pelatihan

Nilai p-value > 0.05, maka gagal menolak H0. Artinya, tidak ada cukup bukti yang menyatakan bahwa terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan.


Soal 8

Gunakan Mann-Whitney:

  • Kelompok A: 62, 65, 66, 70, 68

  • Kelompok B: 58, 60, 59, 63, 61

Jawab:

#Uji menggunakan Mann-Whitney
A = c(62, 65, 66, 70, 68)
B = c(58, 60, 59, 63, 61)

wilcox.test(A, B)

    Wilcoxon rank sum exact test

data:  A and B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0

Hipotesis:

H0: Tidak terdapat perbedaan yang signifikan antara kelompok A dan kelompok B

H1: Terdapat perbedaan yang signifikan antara kelompok A dan kelompok B

Nilai p-value < 0.05, maka tolak H0. Sehingga dapat disimpulkan terdapat perbedaan yang signifikan secara statistik antara kelompok A dan kelompok B.


Soal 9

Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.

  • Are European Union membership variable and development variable independent from each other?

Jawab:

#Load dataset
dataset3 = read.csv2("D:/ELFRIDA/KULIAH/SEMESTER 2/STATISTIKA UNTUK ILMU SOSIAL/Dataset3.csv")

#Melihat nama kolom
names(dataset3)
[1] "No"                                   
[2] "Country"                              
[3] "Level.of.development"                 
[4] "European.Union.Membership"            
[5] "Currency"                             
[6] "Women.Entrepreneurship.Index"         
[7] "Entrepreneurship.Index"               
[8] "Inflation.rate"                       
[9] "Female.Labor.Force.Participation.Rate"
#Melihat isi data
str(dataset3)
'data.frame':   51 obs. of  9 variables:
 $ No                                   : int  4 6 17 18 19 20 22 28 30 34 ...
 $ Country                              : chr  "Austria" "Belgium" "Estonia" "Finland" ...
 $ Level.of.development                 : chr  "Developed" "Developed" "Developed" "Developed" ...
 $ European.Union.Membership            : chr  "Member" "Member" "Member" "Member" ...
 $ Currency                             : chr  "Euro" "Euro" "Euro" "Euro" ...
 $ Women.Entrepreneurship.Index         : chr  "54.9" "63.6" "55.4" "66.4" ...
 $ Entrepreneurship.Index               : chr  "64.9" "65.5" "60.2" "65.7" ...
 $ Inflation.rate                       : chr  "0.9" "0.6" "-0.88" "-0.2" ...
 $ Female.Labor.Force.Participation.Rate: chr  "67.1" "58" "68.5" "67.7" ...
#Membuat tabel kontingensi
table_EU_Dev <- table(dataset3$European.Union.Membership, dataset3$Level.of.development)
print(table_EU_Dev)
            
             Developed Developing
  Member            20          0
  Not Member         7         24
#Uji Chi-Square
chisq.test(table_EU_Dev)

    Pearson's Chi-squared test with Yates' continuity correction

data:  table_EU_Dev
X-squared = 26.222, df = 1, p-value = 3.043e-07

Hipotesis:

H0: Tidak ada hubungan signifikan antara variabel European Union membership dengam variabel Development

H1: Ada hubungan signifikan antara variabel European Union membership dengan variabel Development

Nilai p-value < 0.05, sehingga tolak H0. Dapat disimpulkan bahwa terdapat hubungan yang signifikan antara ariabel European Union membership dengan variabel Development.


  • Do the Women Entrepreneurship Index and Global Entrepreneurship Index values show a statistically significant difference between the countries that are members of the European Union and not? (Method Mann-Whitney U)

Jawab:

Mengubah data menjadi data numerik

#Ubah WEI menjadi numerik
dataset3$Women.Entrepreneurship.Index = as.numeric(dataset3$Women.Entrepreneurship.Index)
#Ubah GEI menjadi numerik
dataset3$Entrepreneurship.Index = as.numeric(dataset3$Entrepreneurship.Index)

Melakukan Uji Mann-Whitney untuk variabel Women Entrepreneurship Index dengan Europian Union Membership

#Uji Women Entrepreneurship Index menggunakan Mann-Whitney
wilcox.test(`Women.Entrepreneurship.Index` ~ `European.Union.Membership`, data = dataset3)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  Women.Entrepreneurship.Index by European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0

Hasil Uji Mann-Whitney untuk variabel Women Entrepreneurship Index dengan Europian Union Membership

Hipotesis:

H0: Tidak terdapat perbedaan yang signifikan antara Women Entrepreneurship Index dengan Europian Union Membership

H1: Terdapat perbedaan yang signifikan antara Women Entrepreneurship Index dengan Europian Union Membership

Nilai p-value < 0.05, sehingga tolak H0. Dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara Women Entrepreneurship Index dengan Europian Union Membership

.

Melakukan Uji Mann-Whitney untuk variabel Entrepreneurship Index dengan Europian Union Membership

#Uji Entrepreneurship Index menggunakan Mann-Whitney
wilcox.test(`Entrepreneurship.Index` ~ `European.Union.Membership`, data = dataset3)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  Entrepreneurship.Index by European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0

Hasil Uji Mann-Whitney untuk variabel Entrepreneurship Index dengan Europian Union Membership

Hipotesis:

H0: Tidak terdapat perbedaan yang signifikan antara Global Entrepreneurship Index dengan Europian Union Membership

H1: Terdapat perbedaan yang signifikan antara Global Entrepreneurship Index dengan Europian Union Membership

Nilai p-value < 0.05, sehingga tolak H0. Dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara Global Entrepreneurship Index dengan Europian Union Membership.


  • Is there a statistically significant relationship between Women’s Entrepreneurship Index and Global Entrepreneurship Index values?

Jawab:

#Load dataset
dataset4 = read.csv2("D:/ELFRIDA/KULIAH/SEMESTER 2/STATISTIKA UNTUK ILMU SOSIAL/Dataset3.csv")

#ubah WEI menjadi numeric
dataset4$Women.Entrepreneurship.Index = as.numeric(dataset4$Women.Entrepreneurship.Index)

#uji normalitas data WEI
shapiro.test(dataset4$Women.Entrepreneurship.Index)

    Shapiro-Wilk normality test

data:  dataset4$Women.Entrepreneurship.Index
W = 0.94077, p-value = 0.01318

Berdasarkan hasil uji normalitas diketahui nilai p-value < 0.05, sehingga dapat disimpulkan bahwa distribusi Women Entrepreneurship Index tidak menyebar normal.

#ubah EI menjadi numeric
dataset4$Entrepreneurship.Index = as.numeric(dataset4$Entrepreneurship.Index)

#uji normalitas data EI
shapiro.test(dataset4$Entrepreneurship.Index)

    Shapiro-Wilk normality test

data:  dataset4$Entrepreneurship.Index
W = 0.91004, p-value = 0.0009261

Berdasarkan hasil uji normalitas diketahui nilai p-value < 0.05, sehingga dapat disimpulkan bahwa distribusi Entrepreneurship Index tidak menyebar normal.

.

Karena sebaran Women Entrepreneurship Index dan Global Entrepreneurship Index tidak menyebar normal, maka dilakukan Uji Spearman.

#Uji korelasi Spearman
cor.test(dataset4$Women.Entrepreneurship.Index, dataset4$Entrepreneurship.Index, method = "spearman")
Warning in cor.test.default(dataset4$Women.Entrepreneurship.Index,
dataset4$Entrepreneurship.Index, : Cannot compute exact p-value with ties

    Spearman's rank correlation rho

data:  dataset4$Women.Entrepreneurship.Index and dataset4$Entrepreneurship.Index
S = 2038.6, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.9077539 

Hipotesis:

H0: Tidak terdapat hubungan yang signifikan antara Women Entrepreneurship Index dan Global Entrepreneurship Index

H1: Terdapat hubungan yang signifikan antara Women Entrepreneurship Index dan Global Entrepreneurship Index

Hasil menunjukkan p-value < 0.05, sehingga tolak H0. Dapat disimpulkan bahwa terdapat hubungan yang signifikan secara statistik antara Women Entrepreneurship Index dan Global Entrepreneurship Index. Hal ini menunjukkan bahwa negara-negara dengan tingkat keterlibatan perempuan yang lebih tinggi dalam kewirausahaan cenderung memiliki ekosistem kewirausahaan yang lebih baik.