Asy Khofsah_Tugas UAS-Individu

Author

Asy Khofsah

Tugas Individu : Latihan Analisis Non-Parametrik

Gunakan data berikut : Jumlah kelahiran per hari selama satu minggu (345, 370, 360, 342, 356, 330, 310). Uji apakah distribusinya seragam.

H0 : Distribusi jumlah kelahiran per hari selama satu minggu seragam

H1 : Distribusi jumlah kelahiran per hari tidak seragam
```
#Frekuensi distribusi
distribution <- c(345, 370, 360, 342, 356, 330, 310)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = distribution, p = rep(1/length(distribution), length(distribution)))
```
```
    Chi-squared test for given probabilities

data:  distribution
X-squared = 7.0477, df = 6, p-value = 0.3165
```
Nilai p-value > 0.05 maka Gagal Menolak H0. Sehingga dapat disimpulkan bahwa Tidak terdapat bukti yang cukup untuk menyatakan bahwa distribusi yang diamati berbeda secara signifikan dari distribusi yang diharapkan.

Berdasarkan uji Chi-Square Goodness of Fit, diperoleh nilai χ² = 7.05 dengan derajat bebas 6 dan p-value sebesar 0.3165. Karena p-value lebih besar dari taraf signifikansi 0.05, maka tidak terdapat cukup bukti untuk menolak hipotesis nol. Dengan demikian, distribusi yang diamati tidak berbeda secara signifikan dari distribusi yang diharapkan. Hal ini menunjukkan bahwa data dapat dianggap menyebar secara merata atau sesuai dengan proporsi yang ditentukan.
Jumlah pemilih yang memilih 4 kandidat: A (260), B (240), C (300), D (200). Apakah pilihan pemilih merata?

H0 : Pilihan pemilih sama untuk keempat kandidat

H1 : Pilihan pemilih tidak merata
```
#Frekuensi pemilihan
vote <- c(260,240,300,200)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x = vote, p = rep(1/length(vote), length(vote)))
```
```
    Chi-squared test for given probabilities

data:  vote
X-squared = 20.8, df = 3, p-value = 0.0001158
```
Nilai p-value < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa pilihan pemilih tidak merata untuk keempat kandidat.

Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 20.8 dengan derajat bebas 3 dan p-value sebesar 0.00012. Karena nilai p jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak. Dengan demikian, dapat disimpulkan bahwa pemilih tidak memilih secara merata keempat kandidat. Terdapat perbedaan signifikan dalam jumlah pemilih yang memilih masing-masing kandidat.
Distribusi warna mobil di kampus: Hitam (90), Putih (60), Abu-abu (50), Merah (40). Apakah ada preferensi warna yang signifikan?

H0 : Mahasiswa tidak memiliki preferensi khusus terhadap warna mobil

H1 : Mahasiswa memiliki preferensi khusus terhadap warna mobil
```
#Frekuensi warna mobil
color <- c(90,60,50,40)

# Uji chi-square dengan asumsi distribusi seragam
chisq.test(x=color, p = rep(1/length(color), length(color)))
```
```
    Chi-squared test for given probabilities

data:  color
X-squared = 23.333, df = 3, p-value = 3.441e-05
```
Nilai p-value < 0.05 maka Tolak H0. Sehingga dapat disimpulkan bahwa mahasiswa memiliki preferensi khusus terhadap warna mobil.

Berdasarkan hasil uji Chi-Square Goodness of Fit, diperoleh nilai χ² sebesar 23.333 dengan derajat bebas 3 dan p-value sebesar 0.00003441. Karena p-value jauh lebih kecil dari taraf signifikansi 0.05, maka hipotesis nol ditolak.
Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan signifikan dalam distribusi warna mobil di kampus. Artinya, mahasiswa memiliki preferensi warna tertentu terhadap mobil yang mereka gunakan.

Uji pengaruh jenis kelamin terhadap preferensi film

H0 : Tidak ada hubungan antara jenis kelamin dan preferesni film

H1 : Ada hubungan antara jenis kelamin dan preferensi film

# Membuat tabel kontingensi
tabel1 <- matrix(c(60,40,50,70), nrow = 2, byrow = TRUE)
colnames(tabel1) <- c("Suka Film A", "Suka Film B")
rownames(tabel1) <- c("Laki-laki", "Perempuan")
tabel1

          Suka Film A Suka Film B
Laki-laki          60          40
Perempuan          50          70

# Uji Chi-square untuk independensi
chisq.test(tabel1)


    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel1
X-squared = 6.6183, df = 1, p-value = 0.01009

nilai p-value < 0.05 maka Tolak H0. Sehinga ada hubungan antara jenis kelamin dan preferensi film A dan film B.

Uji hubungan antara program studi (Statistik, Komputer, Ekonomi) dan tempat tinggal (Kost, Rumah Orang Tua, Asrama)

H0 : Tidak ada hubungan antara program studi dan tempat tinggal

H1 : Ada hubungan antara program studi dan tempat tinggal

# Membuat tabel kontingensi
tabel2 <- matrix(c(20,10,5,15,20,10,10,25,10), nrow = 3, byrow = TRUE)
colnames(tabel2) <- c("Kost", "Rumah Orang Tua", "Asrama")
rownames(tabel2) <- c("Statistik", "Komputer", "Ekonomi")
tabel2

          Kost Rumah Orang Tua Asrama
Statistik   20              10      5
Komputer    15              20     10
Ekonomi     10              25     10

# Uji Chi-square untuk independensi
chisq.test(tabel2)


    Pearson's Chi-squared test

data:  tabel2
X-squared = 10.863, df = 4, p-value = 0.02815

nilai p-value < 0.05 maka Tolak H0. Sehingga ada hubungan antara program studi dan tempat tinggal.

24 siswa menunjukkan peningkatan nilai setelah kursus, 8 penurunan dan 3 sama. Apakah ada perbedaan signifikan? (Menggunakan Sign Test)

Note :

a. Perlu melakukan instal package “BSDA” untuk memanggil library BSDA dan menjalankan SIGN.test

b. Karena terdapat 3 peserta yang tidak mengalami perubahan (nol), maka dihilangkan dari perhitungan, sehingga total n adalah 32
```
library(BSDA)
```
```
Loading required package: lattice
```
```
Attaching package: 'BSDA'
```
```
The following object is masked from 'package:datasets':

    Orange
```
```
SIGN.test(x=24, n=32, alternative = "two.sided")
```
```
    One-sample Sign-Test

data:  24
s = 1, p-value = 1
alternative hypothesis: true median is not equal to 0
0 percent confidence interval:
 24 24
sample estimates:
median of x 
         24 
```
karena p-value = 1, maka tidak ada bukti statistik untuk menyimpulkan bahwa terdapat perbedaan arah perubahan yang signifikan kelompok yang diuji.

Uji Wilcoxon

#Skor pelatihan
Sebelum <- c(75, 70, 68, 72, 69)
Sesudah <- c(78, 74, 70, 75, 72)
wilcox.test(Sebelum, Sesudah, paired = TRUE)

Warning in wilcox.test.default(Sebelum, Sesudah, paired = TRUE): cannot compute
exact p-value with ties


    Wilcoxon signed rank test with continuity correction

data:  Sebelum and Sesudah
V = 0, p-value = 0.05447
alternative hypothesis: true location shift is not equal to 0

nilai p-value > 0.05, maka gagal tolak H0. Artinya, tidak ada bukti yang cukup untuk mengatakan bahwa terdapat perbedaan yang signifikan antara kondisi “Sebelum” dan “Sesudah” pelatihan.

Note :

menggunakan fungsi exact = FALSE karena terdapat nilai yang sama (ties) pada data sebelum dan sesudah pelatihan.

Uji Mann-Whitney

A <- c(62, 65, 66, 70, 68)
B <- c(58, 60, 59, 63, 61)
wilcox.test(A,B)


    Wilcoxon rank sum exact test

data:  A and B
W = 24, p-value = 0.01587
alternative hypothesis: true location shift is not equal to 0

nilai p-value < 0.05, maka tolak H0. Sehingga, ada perbedaan yang signifikan antara kelompok A dan kelompok B.

Dataset

Note :

Perlu dilakukan impor Dasatset.csv pada R studio agar data dapat digunakan

 my_data <- read.csv("~/Documents/STS/Dataset3.csv", sep = ";")
 str(my_data)

'data.frame':   51 obs. of  9 variables:
 $ No                                   : int  4 6 17 18 19 20 22 28 30 34 ...
 $ Country                              : chr  "Austria" "Belgium" "Estonia" "Finland" ...
 $ Level.of.development                 : chr  "Developed" "Developed" "Developed" "Developed" ...
 $ European.Union.Membership            : chr  "Member" "Member" "Member" "Member" ...
 $ Currency                             : chr  "Euro" "Euro" "Euro" "Euro" ...
 $ Women.Entrepreneurship.Index         : num  54.9 63.6 55.4 66.4 68.8 63.6 43 64.3 51.4 56.6 ...
 $ Entrepreneurship.Index               : num  64.9 65.5 60.2 65.7 67.3 67.4 42 65.3 41.3 54.5 ...
 $ Inflation.rate                       : num  0.9 0.6 -0.88 -0.2 0 0.5 -1.7 -0.3 0 0.2 ...
 $ Female.Labor.Force.Participation.Rate: num  67.1 58 68.5 67.7 60.6 69.9 42.5 59.4 47.2 66.4 ...

 names(my_data)

[1] "No"                                   
[2] "Country"                              
[3] "Level.of.development"                 
[4] "European.Union.Membership"            
[5] "Currency"                             
[6] "Women.Entrepreneurship.Index"         
[7] "Entrepreneurship.Index"               
[8] "Inflation.rate"                       
[9] "Female.Labor.Force.Participation.Rate"

a. Uji hubungan variabel European Union membership variable dan variabel development

# Membuat tabel kontingensi
tabel_idn <- table (my_data$European.Union.Membership, my_data$Level.of.development)

# Uji Chi-square untuk independensi 
chisq.test(tabel_idn)


    Pearson's Chi-squared test with Yates' continuity correction

data:  tabel_idn
X-squared = 26.222, df = 1, p-value = 3.043e-07

nilai p-value < 0.05 maka Tolak H0. Sehingga terdapat hubungan yang signifikan secara statistik antara keanggotaan Uni Eropa dan tingkat pembangunan suatu negara.

b. Uji signifikasi perbedaan nilai Women Entrepreneurship Index dan Entrepreneurship Index pada member European Union dan bukan member

# Uji Mann-Whitney untuk Women Entrepreneurship Index
wilcox.test(my_data$Women.Entrepreneurship.Index ~ my_data$European.Union.Membership)

Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties


    Wilcoxon rank sum test with continuity correction

data:  my_data$Women.Entrepreneurship.Index by my_data$European.Union.Membership
W = 536, p-value = 1.358e-05
alternative hypothesis: true location shift is not equal to 0

# Uji Mann-Whitney untuk Global Entrepreneurship Index
wilcox.test(my_data$Entrepreneurship.Index ~ my_data$European.Union.Membership)

Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
compute exact p-value with ties


    Wilcoxon rank sum test with continuity correction

data:  my_data$Entrepreneurship.Index by my_data$European.Union.Membership
W = 490, p-value = 0.0005338
alternative hypothesis: true location shift is not equal to 0

nilai p-value > 0.05 untuk kedua uji, maka Gagal Tolak H0. Sehingga member European Union dan bukan member baik pada Women Entrepreneurship Index dan Entrepreneurship Index memiliki perbedaan yang siginifikan.

c. Hubungan nilai Women’s Entrepreneurship Index and Global Entrepreneurship Index

# Menghitung korelasi antara Women Entrepreneurship Index dan Entrepreneurship Index
Korelasi <- cor(my_data$Women.Entrepreneurship.Index, my_data$Entrepreneurship.Index)
print(Korelasi)

[1] 0.9145797

Nilai koefisien korelasi sebesar menunjukkan

0.9145797

Didapatkan bahwa skor korelasi sebesar 0.9145797, yang mana nilai ini sangat mendekati +1. Dengan demikian, kita dapat menyimpulkan bahwa terdapat hubungan yang kuat antara Women’s Entrepreneurship Index dan Global Entrepreneurship Index. Artinya, semakin tinggi tingkat kewirausahaan perempuan di suatu negara, cenderung semakin tinggi pula tingkat kewirausahaan secara keseluruhan di negara tersebut.