Latihan Soal Praktikum 12 Statistika (STA1517)

Author

Dhea Dasa Cendekia Zairin

Latihan Uji Chi-Square dan Analisis Non Parametrik

Latihan 1

Gunakan data berikut: Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

Hipotesis

H₀ : Distribusi kelahiran per hari seragam.

H₁ : Distribusi kelahiran per hari tidak seragam.

# Data jumlah kelahiran per hari selama satu minggu
observed <- c(345, 370, 360, 342, 356, 330, 310)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = observed, p = rep(1/length(observed), length(observed)))


    Chi-squared test for given probabilities

data:  observed
X-squared = 7.0477, df = 6, p-value = 0.3165

Interpretasi

Karena p-value = 0.3165 > 0.05, maka gagal menolak H₀. Artinya, jumlah kelahiran per hari selama satu minggu terdistribusi seragam secara statistik.

Latihan 2

Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

Hipotesis

H₀ : Pemilih memilih keempat kandidat secara merata.

H₁ : Pemilih memilih keempat kandidat secara tidak merata.

# Data jumlah pemilih untuk masing-masing kandidat
pemilih <- c(260, 240, 300, 200)

# Uji chi-square dengan asumsi distribusi merata (equal probability)
chisq.test(x = pemilih, p = rep(1/length(pemilih), length(pemilih)))


    Chi-squared test for given probabilities

data:  pemilih
X-squared = 20.8, df = 3, p-value = 0.0001158

Interpretasi

Karena p-value = 0.0001158 < 0.05, maka tolak H₀. Artinya, pemilih untuk keempat kandidat tidak memilih secara merata. Terdapat perbedaan signifikan dalam preferensi pemilih.

Latihan 3

Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

Hipotesis

H₀ : Warna mobil di kampus terdistridusi secara merata (tidak ada preferensi warna).

H₁ : Warna mobil di kampus tidak terdistribusi secara merata (ada preferensi warna).

# Data jumlah mobil per warna
warna_mobil <- c(90, 60, 50, 40)

# Uji chi-square dengan asumsi distribusi merata
chisq.test(x = warna_mobil, p = rep(1/length(warna_mobil), length(warna_mobil)))


    Chi-squared test for given probabilities

data:  warna_mobil
X-squared = 23.333, df = 3, p-value = 3.441e-05

Interpretasi

Karena p-value =3.441e-05 < 0.05, maka tolak H₀. Artinya, terdapat preferensi warna yang signifikan sehingga warna mobil dikampus tidak didistribusikan secara merata.

Latihan 4

Gunakan data di bawah ini

	Suka Film A	Suka Film B
Laki-Laki	60	40
Perempuan	50	70

Apakah jenis kelamin berpengaruh terhadap preferensi film?

Hipotesis

H₀ : Tidak ada hubungan antara jenis kelamin dan preferensi film.

H₁ : Ada hubungan antara jenis kelamin dan preferensi film.

# Membuat matriks kontingensi
tabel <- matrix(c(60, 40, 50, 70), nrow = 2, byrow = TRUE)
colnames(tabel) <- c("Suka Film A", "Suka Film B")
rownames(tabel) <- c("Laki-Laki", "Perempuan")
tabel

          Suka Film A Suka Film B
Laki-Laki          60          40
Perempuan          50          70

# Uji chi-square independensi
chisq.test(tabel)


    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel
X-squared = 6.6183, df = 1, p-value = 0.01009

Interpretasi

Karena p-value = 0.01009 < 0.05, maka tolak H₀. Dapat disimpulkan bahwa terdapat hubungan antara jenis kelamin dan preferensi film. Laki-laki dan perempuan memiliki kecenderungan yang berbeda dalam menyukai Film A atau Film B.

Latihan 5

Hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama). Berikut ini data kontingensi untuk digunakan:

**Hipotesis**
Prodi	Kost	Rumah Orang Tua	Asrama
Statistik	20	10	5
Komputer	15	20	10
Ekonomi	10	25	10

H₀ : Tidak ada hubungan antara program studi dan tempat tinggal.

H₁ : Ada hubungan antara program studi dan tempat tinggal.

# Membuat tabel kontingensi
tabel_tempat <- matrix(c(20, 10, 5,
                         15, 20, 10,
                         10, 25, 10),
                       nrow = 3,
                       byrow = TRUE)

# Menambahkan nama baris dan kolom
dimnames(tabel_tempat) <- list(
  Program_Studi = c("Statistik", "Komputer", "Ekonomi"),
  Tempat_Tinggal = c("Kost", "Rumah Orang Tua", "Asrama")
)

# Tampilkan tabel
tabel_tempat

             Tempat_Tinggal
Program_Studi Kost Rumah Orang Tua Asrama
    Statistik   20              10      5
    Komputer    15              20     10
    Ekonomi     10              25     10

# Uji chi-square of independence
chisq.test(tabel_tempat)


    Pearson's Chi-squared test

data:  tabel_tempat
X-squared = 10.863, df = 4, p-value = 0.02815

Interpretasi

Karena p-value = 0.02815 < 0.05, maka tolak H₀. Artinya, terdapat hubungan signifikan antara program studi dan tempat tinggal. Misalnya, mahasiswa Ekonomi lebih banyak tinggal di rumah orang tua dibandingkan mahasiswa statistik.

Latihan 6

24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan, 3 sama. Apakah ada perbedaan signifikan? Analisis menggunakan Sign Test

Hipotesis

H₀: Tidak ada perbedaan yang signifikan sebelum dengan setelah kursus.

H₁: Terdapat perbedaan signifikan sebelum dengan setelah kursus.

# Install dan muat paket BSDA
install.packages("BSDA", repos = "https://cloud.r-project.org/")

Installing package into 'C:/Users/Dhea Dasa Cendekia Z/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)

package 'BSDA' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\Dhea Dasa Cendekia Z\AppData\Local\Temp\Rtmpe0gi5S\downloaded_packages

library (BSDA)

Warning: package 'BSDA' was built under R version 4.4.3

Loading required package: lattice


Attaching package: 'BSDA'

The following object is masked from 'package:datasets':

    Orange

# Menggunakan fungsi SIGN.test
# x = jumlah peningkatan
# n = total yang tidak sama (24 + 8)
SIGN.test(x = 24, n = 32, alternative = "two.sided")


    One-sample Sign-Test

data:  24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
 24 24
sample estimates:
median of x 
         24

Interpretasi

karena p-value = 1 > 0,05, maka gagal menolak H₀. Artinya, tidak terdapat perbedaan arah perubahan yang signifikan antara dua kondisi yang diuji, nilai sebelum dan setelah kursus.

Latihan 7

Gunakan Wilcoxon untuk menganalisis data berikut ini:

Skor sebelum pelatihan: 75, 70, 68, 72, 69
Skor sesudah pelatihan: 78, 74, 70, 75, 72

Hipotesis

H₀: Tidak ada perbedaan skor sebelum dan sesudah pelatihan.

H₁: Ada perbedaan signifikan setelah pelatihan.

# Skor sebelum dan sesudah pelatihan
sebelum <- c(75, 70, 68, 72, 69)
sesudah <- c(78, 74, 70, 75, 72)

# Wilcoxon signed-rank test (paired)
wilcox.test(sesudah, sebelum, paired = TRUE)

Warning in wilcox.test.default(sesudah, sebelum, paired = TRUE): cannot compute
exact p-value with ties


    Wilcoxon signed rank test with continuity correction

data:  sesudah and sebelum
V = 15, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0

Interpretasi

Karena p-value = 0.05447 > 0.05, maka gagal menolak H₀. Artinya, tidak terdapat cukup bukti statistik untuk menyatakan bahwa terdapat perbedaan signifikan antara skor sebelum dan sesudah pelatihan.

Latihan 8

Gunakan Mann-Whitney untuk menganalisis data berikut ini :

Kelompok A: 62, 65, 66, 70, 68
Kelompok B: 58, 60, 59, 63, 61

Hipotesis

H₀: Tidak ada perbedaan signifikan distribusi antara kelompok A dan B.

H₁: Ada perbedaan signifikan distribusi antara kelompok A dan B.

# Kelompok A dan B
kelompokA <- c(62, 65, 66, 70, 68)
kelompokB <- c(58, 60, 59, 63, 61)

# Uji Mann-Whitney (non-paired)
wilcox.test(kelompokA, kelompokB)


    Wilcoxon rank sum exact test

data:  kelompokA and kelompokB
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0

Interpretasi

Karena p-value = 0.01587 < 0.05, maka tolak H₀. Artinya, terdapat perbedaan yang signifikan secara statistik antara distribusi nilai di kelompok A dan kelompok B. Hal ini menunjukkan bahwa nilai-nilai yang terdapat pada kedua kelompok tidak berasal dari distribusi yang sama, dan kemungkinan terdapat faktor tertentu yang menyebabkan perbedaan tersebut.

Latihan 9

Gunakanlah dataset pada link berikut untuk menjawab pertanyaan di bawah ini.

Are European Union membership variable and development variable independent from each other?
Do the Women Entrepreneurship Index and Global Entrepreneurship Index values show a statistically significant difference between the countries that are members of the European Union and not? (Method Mann-Whitney U)
Is there a statistically significant relationship between Women’s Entrepreneurship Index and Global Entrepreneurship Index values?

# Memuat library yang diperlukan
library(readr)

Warning: package 'readr' was built under R version 4.4.3

library(dplyr)

Warning: package 'dplyr' was built under R version 4.4.3


Attaching package: 'dplyr'

The following objects are masked from 'package:stats':

    filter, lag

The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union

data <- read_csv("D:/DHEA/S2/Kuliah dan Praktikum/2nd Semester/Statistika untuk Ilmu Sosial dan Perilaku/Tugas/Dhea Dasa Cendekia Zairin_Tugas Praktikum 12 Statistika_files/Dataset3.csv")

Rows: 51 Columns: 1

── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (1): No;Country;Level of development;European Union Membership;Currency;...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

str(data)

spc_tbl_ [51 × 1] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate: chr [1:51] "4;Austria;Developed;Member;Euro;54.9;64.9;0.9;67.1" "6;Belgium;Developed;Member;Euro;63.6;65.5;0.6;58" "17;Estonia;Developed;Member;Euro;55.4;60.2;-0.88;68.5" "18;Finland;Developed;Member;Euro;66.4;65.7;-0.2;67.7" ...
 - attr(*, "spec")=
  .. cols(
  ..   `No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate` = col_character()
  .. )
 - attr(*, "problems")=<externalptr>

head(data)

# A tibble: 6 × 1
  No;Country;Level of development;European Union Membership;Currency;Women Ent…¹
  <chr>                                                                         
1 4;Austria;Developed;Member;Euro;54.9;64.9;0.9;67.1                            
2 6;Belgium;Developed;Member;Euro;63.6;65.5;0.6;58                              
3 17;Estonia;Developed;Member;Euro;55.4;60.2;-0.88;68.5                         
4 18;Finland;Developed;Member;Euro;66.4;65.7;-0.2;67.7                          
5 19;France;Developed;Member;Euro;68.8;67.3;0;60.6                              
6 20;Germany;Developed;Member;Euro;63.6;67.4;0.5;69.9                           
# ℹ abbreviated name:
#   ¹`No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate`

summary(data)

 No;Country;Level of development;European Union Membership;Currency;Women Entrepreneurship Index;Entrepreneurship Index;Inflation rate;Female Labor Force Participation Rate
 Length:51                                                                                                                                                                  
 Class :character                                                                                                                                                           
 Mode  :character

Pertanyaan 1 : Apakah variabel European Union membership dan development independen?

Uji Chi-Square of Independence digunakan untuk menguji apakah terdapat hubungan (dependensi) antara dua variabel kategorik pada soal ini

Hipotesis

H₀ : Keanggotaan Uni Eropa dan status pembangunan negara adalah independen (tidak saling terkait).

H₁ : Keanggotaan Uni Eropa dan status pembangunan negara tidak independen (ada hubungan).

data <- read_delim("D:/DHEA/S2/Kuliah dan Praktikum/2nd Semester/Statistika untuk Ilmu Sosial dan Perilaku/Tugas/Dhea Dasa Cendekia Zairin_Tugas Praktikum 12 Statistika_files/Dataset3.csv")

Rows: 51 Columns: 9
── Column specification ────────────────────────────────────────────────────────
Delimiter: ";"
chr (4): Country, Level of development, European Union Membership, Currency
dbl (5): No, Women Entrepreneurship Index, Entrepreneurship Index, Inflation...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

colnames(data)

[1] "No"                                   
[2] "Country"                              
[3] "Level of development"                 
[4] "European Union Membership"            
[5] "Currency"                             
[6] "Women Entrepreneurship Index"         
[7] "Entrepreneurship Index"               
[8] "Inflation rate"                       
[9] "Female Labor Force Participation Rate"

# Membuat tabel kontingensi
table_indep <- table(data$`European Union Membership`, data$`Level of development`)

# Uji Chi-Square
chi_result <- chisq.test(table_indep)
chi_result


    Pearson's Chi-squared test with Yates' continuity correction

data:  table_indep
X-squared = 26.222, df = 1, p-value = 3.043e-07

Interpretasi

Karena p-value = 3.043e-07 < 0.05, maka tolak H₀. Terdapat hubungan yang signifikan secara statistik antara status keanggotaan Uni Eropa dan tingkat pembangunan negara. Artinya, keanggotaan Uni Eropa tidak terjadi secara acak terhadap tingkat pembangunan; ada pola keterkaitan yang jelas.

Pertanyaan 2 : Apakah terdapat perbedaan signifikan nilai Women Entrepreneurship Index (WEI) dan Global Entrepreneurship Index (GEI) antara anggota dan non-anggota EU?

Uji Mann-Whitney U (Wilcoxon Rank Sum Test) digunakan untuk membandingkan dua kelompok independen pada soal ini

Hipotesis

H₀: Tidak ada perbedaan median nilai WEI antara negara anggota Uni Eropa dan non-anggota (distribusi WEI di kedua grup sama).

H₁: Ada perbedaan median nilai WEI antara negara anggota Uni Eropa dan non-anggota (distribusi WEI di kedua grup berbeda).

# Uji perbedaan Women Entrepreneurship Index (WEI)
wilcox.test(data$`Women Entrepreneurship Index` ~ data$`European Union Membership`)

Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties


    Wilcoxon rank sum test with continuity correction

data:  data$`Women Entrepreneurship Index` by data$`European Union Membership`
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0

Interpretasi

Karena nilai p-value = 1.358e-05 < 0.05, maka tolak H₀. Artinya, negara-negara anggota EU memiliki nilai indeks kewirausahaan perempuan yang berbeda signifikan dibandingkan negara non-EU.

Hipotesis

H₀: Tidak ada perbedaan median nilai GEI antara negara anggota Uni Eropa dan non-anggota.

H₁: Ada perbedaan median nilai GEI antara negara anggota Uni Eropa dan non-anggota.

# Uji perbedaan Global Entrepreneurship Index (GEI)
wilcox.test(data$`Entrepreneurship Index` ~ data$`European Union Membership`)

Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties


    Wilcoxon rank sum test with continuity correction

data:  data$`Entrepreneurship Index` by data$`European Union Membership`
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0

Interpretasi

Karena nilai p-value = 0.0005338 < 0.05, maka tolak H₀. Artinya, tidak ditemukan perbedaan signifikan pada indeks kewirausahaan global antara negara EU dan non-EU.

Pertanyaan 3 : Apakah ada hubungan yang signifikan secara statistik antara nilai Women’s Entrepreneurship Index (WEI) and Global Entrepreneurship Index (GEI)?

Adapun Jenis Uji Korelasi yang digunakan adalah :

Pearson correlation → untuk data yang normal
Spearman correlation → untuk data tidak normal / ordinal

# Cek Distribusi (Normalitas)
shapiro.test(data$`Women Entrepreneurship Index`)


    Shapiro-Wilk normality test

data:  data$`Women Entrepreneurship Index`
W = 0.94077, p-value = 0.01318

# Cek Distribusi (Normalitas)
shapiro.test(data$`Entrepreneurship Index`)


    Shapiro-Wilk normality test

data:  data$`Entrepreneurship Index`
W = 0.91004, p-value = 0.0009261

Karena nilai p-value keduanya bernilai < 0.05, maka artinya data tidak normal. Maka, untuk uji selanjutnya dapat menggunakan uji Spearman Correlation.

Uji Spearman Correlation

Hipotesis

H₀ : Tidak terdapat hubungan monotonic yang signifikan antara WEI dan GEI (H0:ρ=0)

H₁ : Terdapat hubungan monotonic yang signifikan antara WEI dan GEI (H1:ρ≠0)

#Uji Spearman Correlation
cor.test(data$`Women Entrepreneurship Index`, data$`Entrepreneurship Index`, method = "spearman")

Warning in cor.test.default(data$`Women Entrepreneurship Index`,
data$`Entrepreneurship Index`, : Cannot compute exact p-value with ties


    Spearman's rank correlation rho

data:  data$`Women Entrepreneurship Index` and data$`Entrepreneurship Index`
S = 2038.6, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.9077539

Interpretasi

Nilai rho = 0.9077539 menunjukkan korelasi positif sangat kuat. Nilai p-value < 2.2e-16 menunjukkan tolak H₀ dan sangat signifikan. Artinya, terdapat hubungan yang sangat kuat dan signifikan antara Women Entrepreneurship Index (WEI) dengan Global Entrepreneurship Index (GEI). Hal ini mengindikasikan bahwa semakin tinggi partisipasi dan dukungan perempuan dalam kewirausahaan, semakin baik pula iklim kewirausahaan secara umum di suatu negara. Hubungan yang sangat kuat ini menegaskan bahwa pemberdayaan perempuan dalam kewirausahaan sangat penting dalam membangun ekosistem kewirausahaan nasional yang sehat dan produktif.