Tugas Mandiri Praktikum STK1517 Tahun 2025

Author

Rizki Aditya Putra I3502241011

Statistika untuk Ilmu Sosial dan Perilaku (STK1517)

Uji Chi-Square dan Non-Parametrik

Latihan

  1. Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

    Jawab:

    Jumlah kelahiran per hari selama seminggu

    Hari Jumlah Kelahiran
    Senin 345
    Selasa 370
    Rabu 360
    Kamis 342
    Jumat 356
    Sabtu 330
    Minggu 310
    Total 2413
# Frekuensi observasi
observed = c(345,370,360,342,356,330,310) 

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed))) 

    Chi-squared test for given probabilities

data:  observed
X-squared = 7.0477, df = 6, p-value = 0.3165

Hipotesis:

H0 : Jumlah kelahiran per hari selama seminggu merata
H1 : Jumlah kelahiran per hari selama seminggu tidak merata

nilai p-value > 0.05, maka gagal menolak H0. Sehingga tidak cukup bukti untuk menyimpulkan bahwa distribusi jumlah kelahiran per hari selama seminggu tidak merata.

  1. Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

    Jawab:

    Jumlah pemilih empat kandidat

    Kandidat Jumlah Pemilih
    A 260
    B 240
    C 300
    D 200
    Total 1000
# frekuensi observasi
observed = c(260,240,300,200)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed)))

    Chi-squared test for given probabilities

data:  observed
X-squared = 20.8, df = 3, p-value = 0.0001158

Hipotesis:

H0 : Jumlah pemilih empat kandidat merata
H1 : Jumlah pemilih empat kandidat tidak merata

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa distribusi jumlah pemilih empat kandidat tidak merata.

  1. Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

    Jawab:

    Distribusi warna mobil di kampus

    Warna Mobil Jumlah
    Hitam 90
    Putih 60
    Abu-abu 50
    Merah 40
    Total 240
# Frekuensi observasi
observed = c(90,60,50,40)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed)))

    Chi-squared test for given probabilities

data:  observed
X-squared = 23.333, df = 3, p-value = 3.441e-05

Hipotesis:

H0 : preverensi warna mobil merata (tidak ada warna yang signifikan)
H1 : preverensi warna mobil tidak merata (ada warna yang signifikan)

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa distribusi warna mobil tidak merata atau terdapat preverensi warna mobil yang signifikan.

  1. Gunakan data di bawah ini

    Suka Film A Suka Film B
    Laki-laki 60 40
    Perempuan 50 70

Apakah jenis kelamin berpengaruh terhadap preferensi film?

Jawab:

# Buat matriks kontingensi
tabel <- matrix(c(60, 40, 50, 70), nrow = 2, byrow = TRUE)
colnames(tabel) <- c("Suka Film A", "Suka Film B")
rownames(tabel) <- c("Laki-laki", "Perempuan")
tabel
          Suka Film A Suka Film B
Laki-laki          60          40
Perempuan          50          70
# Uji Chi-square untuk independensi
chisq.test(tabel)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel
X-squared = 6.6183, df = 1, p-value = 0.01009

Hipotesis:

H0 : jenis kelamin tidak berpengaruh signifikan terhadap preferensi film
H1 : jenis kelamin berpengaruh signifikan terhadap preferensi film

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa jenis kelamin berpengaruh signifikan terhadap preferensi film.

  1. Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut data kontingensi untuk digunakan:

    Prodi Kost Rumah Orang Tua Asrama
    Statistik 20 10 5
    Komputer 15 20 10
    Ekonomi 10 25 10

Jawab:

# Buat matriks kontingensi
tabel <- matrix(c(20,10,5,15,20,10,10,25,10), nrow = 3, byrow = TRUE)
colnames(tabel) <- c("Kost", "Rumah orang tua", "Asrama")
rownames(tabel) <- c("Statistik", "Komputer", "Ekonomi")
tabel
          Kost Rumah orang tua Asrama
Statistik   20              10      5
Komputer    15              20     10
Ekonomi     10              25     10
# Uji Chi-square untuk independensi
chisq.test(tabel)

    Pearson's Chi-squared test

data:  tabel
X-squared = 10.863, df = 4, p-value = 0.02815

Hipotesis:

H0 : Program studi tidak berhubungan signifikan dengan tempat tinggal
H1 : Program studi berhubungan signifikan dengan tempat tinggal

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa program studi berhubungan signifikan dengan tempat tinggal.

  1. 24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Sign Test

    Jawab:

    Dalam kasus ini digunakan fungsi binom.test(), bukan SIGN.test() karena data yang tersedia bukan berupa pasangan nilai individual (sebelum dan sesudah), melainkan hanya berupa jumlah siswa yang mengalami peningkatan, penurunan, dan tidak berubah. Fungsi SIGN.test() memerlukan input data dalam bentuk vektor nilai berpasangan, sedangkan binom.test() lebih tepat digunakan untuk menguji proporsi dua kemungkinan (misalnya, naik vs turun) ketika hanya diketahui jumlah kasusnya, sebagaimana dalam uji sign berbasis frekuensi.

# Jumlah siswa dengan nilai naik dan turun
successes <- 24  

# nilai meningkat
n <- 32          

# total perubahan (tidak termasuk yang nilainya tetap)

# Sign test: uji binomial (dua arah)
binom.test(successes, n, p = 0.5, alternative = "two.sided")

    Exact binomial test

data:  successes and n
number of successes = 24, number of trials = 32, p-value = 0.007
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.5659506 0.8853840
sample estimates:
probability of success 
                  0.75 

H0 : Tidak ada perbedaan signifikan
H1 : Ada perbedaan signifikan

karena p-value < 0,05, maka tolak H0, Sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara nilai sebelum dan setelah kursus.

  1. Gunakan Wilcoxon:
  • Skor sebelum pelatihan: 75, 70, 68, 72, 69

  • Skor sesudah: 78, 74, 70, 75, 72

Jawab:

# Skor sebelum dan sesudah pelatihan
Sebelum = c(75,70,68,72,69)
Sesudah = c(78,74,70,75,72)

wilcox.test(Sebelum, Sesudah, paired = TRUE)
Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
exact p-value with ties

    Wilcoxon signed rank test with continuity correction

data:  Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0

Hipotesis:

H0 : Tidak ada perbedaan signifikan antara skor sebelum dan sesudah pelatihan
H1 : Terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan

nilai p-value > 0.05, maka gagal tolak H0, sehingga tidak cukup bukti untuk dapat menyimpulkan bahwa terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan.

  1. Gunakan Mann-Whitney:
  • Kelompok A: 62, 65, 66, 70, 68

  • Kelompok B: 58, 60, 59, 63, 61

    Jawab:

Kelompok_A=c(62,65,66,70,68)
Kelompok_B=c(58,60,59,63,61)

wilcox.test(Kelompok_A, Kelompok_B)

    Wilcoxon rank sum exact test

data:  Kelompok_A and Kelompok_B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0

Hipotesis:

H0 : Tidak ada perbedaan signifikan antara skor kelompok A dan kelompok B
H1 : Terdapat perbedaan signifikan antara skor kelompok A dan kelompok B

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara skor kelompok A dan kelompok B.

  1. Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.
  • Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?

  • Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)

  • Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global?

Jawab:

# panggil data terlebih dahulu

savi=read.csv2("C:/Users/ACER/Downloads/Dataset3.csv") 

9a. Apakah variabel keanggotaan Uni Eropa dan variabel pembangunan bersifat independen satu sama lain?

Jawab:

# melihat nama kolom dan mengecek isinya
names(savi)
[1] "No"                                   
[2] "Country"                              
[3] "Level.of.development"                 
[4] "European.Union.Membership"            
[5] "Currency"                             
[6] "Women.Entrepreneurship.Index"         
[7] "Entrepreneurship.Index"               
[8] "Inflation.rate"                       
[9] "Female.Labor.Force.Participation.Rate"
table(savi$European.Union.Membership)

    Member Not Member 
        20         31 
table(savi$Level.of.development)

 Developed Developing 
        27         24 
# membuat tabel kontingensi
table= table(savi$European.Union.Membership, savi$Level.of.development)
print(table)
            
             Developed Developing
  Member            20          0
  Not Member         7         24
# melakukan uji chi-square
chisq.test(table)

    Pearson's Chi-squared test with Yates' continuity correction

data:  table
X-squared = 26.222, df = 1, p-value = 3.043e-07

Hipotesis:

H0 : Tidak ada hubungan signifikan antara keanggotaan Uni Eropa dengan level pembangunan
H1 : Terdapat hubungan signifikan antara keanggotaan Uni Eropa dengan level pembangunan

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat hubungan yang signifikan antara keanggotaan Uni Eropa dengan level pembangunan.

9b. Apakah nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global menunjukkan perbedaan yang signifikan secara statistik antara negara-negara yang menjadi anggota Uni Eropa dan bukan? (Metode Mann-Whitney U)

Jawab:

# Load data
data <- read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")

# Ubah kolom EU menjadi faktor
data$European.Union.Membership <- as.factor(data$European.Union.Membership)

# Ubah WEI menjadi numerik
data$Women.Entrepreneurship.Index <- as.numeric(data$Women.Entrepreneurship.Index)

# Ubah GEI menjadi numerik
data$Entrepreneurship.Index <- as.numeric(data$Entrepreneurship.Index)
# Uji Mann-Whitney untuk GEI
wilcox.test(Entrepreneurship.Index ~ European.Union.Membership, data = data)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  Entrepreneurship.Index by European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0

Hipotesis:
H0 : Tidak ada perbedaan signifikan antara nilai GEI antara member EU dan non member EU
H1 : Terdapat perbedaan signifikan antara nilai GEI antara member EU dan non member EU

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara nilai GEI member EU dan non member EU.

# Uji Mann-Whitney untuk WEI
wilcox.test(Women.Entrepreneurship.Index ~ European.Union.Membership, data = data)
Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  Women.Entrepreneurship.Index by European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0

Hipotesis:
H0 : Tidak ada perbedaan signifikan antara nilai WEI antara member EU dan non member EU
H1 : Terdapat perbedaan signifikan antara nilai WEI antara member EU dan non member EU

nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat perbedaan signifikan antara nilai WEI member EU dan non member EU.

9c. Apakah ada hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global?

# Load data
data2 <- read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")

data2$Women.Entrepreneurship.Index <- as.numeric(data2$Women.Entrepreneurship.Index)

# uji normalitas data WEI
shapiro.test(data2$Women.Entrepreneurship.Index)

    Shapiro-Wilk normality test

data:  data2$Women.Entrepreneurship.Index
W = 0.94077, p-value = 0.01318

berdasarkan hasil uji normalitas, diketahui bahwa P-Value 0,01 < 0,05 yang menyimpulkan bahwa sebaran WEI tidak menyebar normal.

# Load data
data2 <- read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")

data2$Entrepreneurship.Index <- as.numeric(data2$Entrepreneurship.Index)

# uji normalitas data GEI
shapiro.test(data2$Entrepreneurship.Index)

    Shapiro-Wilk normality test

data:  data2$Entrepreneurship.Index
W = 0.91004, p-value = 0.0009261

berdasarkan hasil uji normalitas, diketahui bahwa P-Value 0,000 < 0,05 yang menyimpulkan bahwa sebaran GEI juga tidak menyebar normal.

Karena kedua variabel memiliki sebaran tidak normal, maka uji yang dilakukan adalah uji non parametrik, yaitu Uji Rank Spearman.

# Load data
data2 <- read.csv2("C:/Users/ACER/Downloads/Dataset3.csv")

data2$Women.Entrepreneurship.Index <- as.numeric(data2$Women.Entrepreneurship.Index)

data2$Entrepreneurship.Index <- as.numeric(data2$Entrepreneurship.Index)

# Uji Spearman
cor.test(data2$Women.Entrepreneurship.Index, data2$Entrepreneurship.Index, method = "spearman")
Warning in cor.test.default(data2$Women.Entrepreneurship.Index,
data2$Entrepreneurship.Index, : Cannot compute exact p-value with ties

    Spearman's rank correlation rho

data:  data2$Women.Entrepreneurship.Index and data2$Entrepreneurship.Index
S = 2038.6, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.9077539 

H0 : Tidak terdapat hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global

H1 : Terdapat hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global

Berdasarkan luaran statistik di atas, nilai p-value < 0.05, maka tolak H0, sehingga dapat disimpulkan bahwa terdapat hubungan yang signifikan secara statistik antara nilai Indeks Kewirausahaan Perempuan dan Indeks Kewirausahaan Global.