Responsi 1 STA543 Analisis Data Kategorik

PROPORTION, ESTIMATION, AND GOODNESS OF FIT

Soal Latihan dari Buku Azen Bab 3

Soal 3.1

setwd("D:\\Kuliah S2 IPB\\Bahan Kuliah\\Semester 2 SSD 2020\\STA543 ADK\\Responsi\\R\\UTS\\")

##soal no 3.1
# diketahui: x=13, n=20, phi=0,4
#bagian a
p<-13/20 #proporsi=x/n
p
## [1] 0.65
a<-pbinom(13,20,prob=p)-pbinom(12,20,prob=p)
a
## [1] 0.1844012
dbinom(13,20,13/20)
## [1] 0.1844012
#bagian b
#Ho: p=0.4 vs H1: p>0.4
#Distribusi Binomial: x=13, n=20,p=13/20, phi=0.4
#digunakan alpha 0.05

stats::binom.test(13,20,0.4,alternative = "great",conf.level=0.95)
## 
##  Exact binomial test
## 
## data:  13 and 20
## number of successes = 13, number of trials = 20, p-value = 0.02103
## alternative hypothesis: true probability of success is greater than 0.4
## 95 percent confidence interval:
##  0.4419655 1.0000000
## sample estimates:
## probability of success 
##                   0.65

p value=0.02103 lebih kecil dari alfa=0.05 sehingga tolak H0 dengan kata lain cukup bukti untuk menyatakan bahwa teknik pembelajaran baru lebih baik dalam meningkatkan pemahaman siswa terhadap matematika.

Soal 3.3 : Repeat Problem 3.1 using score test (didekati dengan sebaran normal)

##soal nomor3.3
prop.test(13,20,alternative = "great",conf.level = 0.95, correct=TRUE)
## 
##  1-sample proportions test with continuity correction
## 
## data:  13 out of 20, null probability 0.5
## X-squared = 1.25, df = 1, p-value = 0.1318
## alternative hypothesis: true p is greater than 0.5
## 95 percent confidence interval:
##  0.4423272 1.0000000
## sample estimates:
##    p 
## 0.65

p value=0.1318 lebih besar dari alpha=0.05 sehingga tidak tolak H0 dengan kata lain tidak cukup bukti untuk menyatakan proporsinya lebih dari 0.5

Soal 3.8

##soal nomor 3.8
#bagian a
#H0: p=0.5 vs H1: p>0.5
#bagian b. Score test
#diketahui x=120, n=200, p=0.5, digunakan alpha 0.05

prop.test(120,200,p=0.5,alternative = "great",conf.level=0.95)
## 
##  1-sample proportions test with continuity correction
## 
## data:  120 out of 200, null probability 0.5
## X-squared = 7.605, df = 1, p-value = 0.00291
## alternative hypothesis: true p is greater than 0.5
## 95 percent confidence interval:
##  0.5395277 1.0000000
## sample estimates:
##   p 
## 0.6

p-value=0.00291 kurang dari alpha=0.05 sehinga Tolak H0. Hal ini berarti pada taraf alpha 5%, kita cukup bukti untuk menyatakan bahwa klaim yang menyatakan kandidat X akan mendapatkan suara mayoritas adalah benar

#bagian c. Wald Test
#di R belum tersedia dg menggunakan uji sehingga menggunakan selang kepercayaan

DescTools::BinomCI(120,200,conf.level=0.95,method="wald")
##      est    lwr.ci    upr.ci
## [1,] 0.6 0.5321049 0.6678951

Karena batas bawah selang di atas 0.5 maka klaim bahwa kandidat X akan memperoleh suara mayoritas adalah benar pada alpha 5%.

Soal 3.9

Ho: p = 0.5

H1: p> 0.5

##nomor 3.9
#bagian a
DescTools::BinomCI(120,200,conf.level=0.95,method="wald")
##      est    lwr.ci    upr.ci
## [1,] 0.6 0.5321049 0.6678951
##nomor 3.9
#bagian b
DescTools::BinomCI(120,200,conf.level=0.99,method="wald")
##      est    lwr.ci    upr.ci
## [1,] 0.6 0.5107707 0.6892293

Bagian c:

Baik pada SK 95% maupun 99% menunjukkan bahwa batas bawah lebih dari 0.5.Oleh karena itu, semakin memperkuat bahwa kandidat X akan memperoleh suara mayoritas.

Soal 3.10

##nomor 3.10
#bagian a
new.teach<-c(25,30,30,14,1) #grades sekarang
res<-chisq.test(new.teach,p=c(0.2,0.4,0.2,0.15,0.05))
res
## 
##  Chi-squared test for given probabilities
## 
## data:  new.teach
## X-squared = 12.017, df = 4, p-value = 0.01723

p value = 0.01723 < alfa= 0.05 sehingga Tolak H0. Dengan kata lain, pada taraf alpha 5% metode baru memiliki hasil yang berbeda dengan metode lama.

bagian b: metode baru memberikan nilai yang lebih besar karena jumlah yang mendapat nilai D dan E pada metode baru lebih sedikit jika dibanding metode lama

Soal 3.12 : Repeat Problem 3.10 using the likelihood ratio test.

#nomor 3.12
res2 <- c(new.teach, p=c(20,40,20,15,5))
DescTools::GTest(res2, correct = "none")
## 
##  Log likelihood ratio (G-test) goodness of fit test
## 
## data:  res2
## G = 76.793, X-squared df = 9, p-value = 6.988e-13

Hasil yang diperoleh adalah nilai p value= 6.988e-13 < alpha= 0.05 sehingga dengan kata lain pada alpha 5%, metode baru dan metode lama memiliki hasil yang berbeda.

Tugas

Silahkan dikerjakan secara mandiri soal berikut

3.2

##soal no 3.2
# diketahui: x=2, n=50, phi=0,1
#bagian a
propp<-2/50 #proporsi=x/n
propp
## [1] 0.04
a<-pbinom(2,50,prob=p)-pbinom(1,50,prob=propp)
a
## [1] -0.4004812
dbinom(2,50,propp)
## [1] 0.2762328
#bagian b
#Ho: p=0.1 vs H1: p<0.1
#Distribusi Binomial: x=2, n=50,p=2/50, phi=0.1
#digunakan alpha 0.05

stats::binom.test(2,50,0.1,alternative = "less",conf.level=0.95)
## 
##  Exact binomial test
## 
## data:  2 and 50
## number of successes = 2, number of trials = 50, p-value = 0.1117
## alternative hypothesis: true probability of success is less than 0.1
## 95 percent confidence interval:
##  0.0000000 0.1206142
## sample estimates:
## probability of success 
##                   0.04

p-value=0.1117 lebih besar dari alfa=0.05 sehingga tidak tolak H0 dengan kata lain tidak cukup bukti untuk menyatakan bahwa "heart disease rate is significantly lower in the population of obese men placed on a low-fat diet: pada alpha 5%.

3.4 Repeat Problem 3.2 using the score test.

##soal nomor3.4
prop.test(2,50,alternative = "less",conf.level = 0.95, correct=TRUE)
## 
##  1-sample proportions test with continuity correction
## 
## data:  2 out of 50, null probability 0.5
## X-squared = 40.5, df = 1, p-value = 9.831e-11
## alternative hypothesis: true p is less than 0.5
## 95 percent confidence interval:
##  0.0000000 0.1276154
## sample estimates:
##    p 
## 0.04

p-value=9.831e-11 lebih kecil dari alfa=0.05 sehingga tolak H0.

3.6

Pada distribusi binomial lebih baik dibandingkan dengan menggunakan pendekatan normal karena p yang diketahui sangat kecil dan n x p juga kecil (<10).

3.11

##nomor 3.11
#bagian a
# Ho: Keempat isu memiliki kepentingan yang sama (p masing-masing isu = 1/4)) vs 
# H1: Keempat isu tidak memiliki kepentingan yang sama (p masing2 isu tidak sama dengan 1/4))

#bagian b
l.isu<-c(80,40,65,15) #levels sekarang
tes<-chisq.test(l.isu,p=c(1/4,1/4,1/4,1/4))
tes
## 
##  Chi-squared test for given probabilities
## 
## data:  l.isu
## X-squared = 49, df = 3, p-value = 1.304e-10

p value = 1.304e-10 < alfa= 0.05 sehingga Tolak H0. Dengan kata lain, pada taraf alpha 5% keempat isu memiliki kepentingan yang tidak sama (berbeda) dimata para pemilih (voters).

3.13 Repeat Problem 3.11 using the score test.

#nomor 3.13
tes2 <- c(l.isu, p=c(80,40,65,15))
DescTools::GTest(tes2, correct = "none")
## 
##  Log likelihood ratio (G-test) goodness of fit test
## 
## data:  tes2
## G = 110.67, X-squared df = 7, p-value < 2.2e-16

Hasil yang diperoleh adalah nilai p value= 2.2e-16 < alpha= 0.05 sehingga dengan kata lain pada alpha 5%, keempat isu memiliki kepentingan yang tidak sama (berbeda) dimata para pemilih (voters).

Referensi

Azen M, Walker CM.2011. Categorical data analysis for the behavioral and social sciences. Newyork (US): Taylor & Fracis Group

Rizki, A. 2/9/2021.Praktikum 02 - PROPORTION, ESTIMATION, AND GOODNESS OF FIT. Retrieved From https://rpubs.com/Akbar_rizki/ADK-02


  1. Mahasiswa Pascasarjana Statistika dan Sains Data, IPB University, ↩︎