Responsi 1-2 STA1543-Analisis Data Kategorik

Khusnia Nurul Khikmah (G1501211049)

8/20/2022

Bagian kedua ini memberikan latihan terkait:

  1. Proportion

  2. Estimation

  3. Goodness of Fit

Soal 1

setwd("D:/S2/IPB/BAHAN AJAR STA1543/Minggu 1")

Jawaban Soal 1

Diketahui:

\(x=13\) \(n=20\) \(\phi=0.4\)

Bagian a

p<-13/20 #proporsi=x/n
p
## [1] 0.65
a<-pbinom(13,20,prob=p)-pbinom(12,20,prob=p)
a
## [1] 0.1844012
dbinom(13,20,13/20)
## [1] 0.1844012

Bagian b

\(H_0\): \(p=0.4\) vs \(H_1\): \(p>0.4\)

Distribusi Binomial: \(x=13\) \(n=20\) \(p=13/20\) \(\phi=0.4\) digunakan \(\alpha=0.05\)

stats::binom.test(13,20,0.4,alternative = "great",conf.level=0.95)
## 
##  Exact binomial test
## 
## data:  13 and 20
## number of successes = 13, number of trials = 20, p-value = 0.02103
## alternative hypothesis: true probability of success is greater than 0.4
## 95 percent confidence interval:
##  0.4419655 1.0000000
## sample estimates:
## probability of success 
##                   0.65

Kesimpulan: \(p_{value}=0.02103\) lebih kecil dari \(\alpha=0.05\) sehingga Tolak \(H_0\) dengan kata lain cukup bukti untuk menyatakan bahwa teknik pembelajaran baru lebih baik dalam meningkatkan pemahaman siswa terhadap matematika.

Soal 2

Repeat Problem Soal 1 using score test (didekati dengan sebaran normal)

Jawaban Soal 2

prop.test(13,20,alternative = "great",conf.level = 0.95, correct=TRUE)
## 
##  1-sample proportions test with continuity correction
## 
## data:  13 out of 20, null probability 0.5
## X-squared = 1.25, df = 1, p-value = 0.1318
## alternative hypothesis: true p is greater than 0.5
## 95 percent confidence interval:
##  0.4423272 1.0000000
## sample estimates:
##    p 
## 0.65

Kesimpulan: \(p_{value}=0.1318\) lebih besar dari \(\alpha=0.05\) sehingga Tidak Tolak \(H_0\) dengan kata lain tidak cukup bukti untuk menyatakan proporsinya lebih dari \(0.5\)

Soal 3

Jawaban Soal 3

Bagian a

\(H_0\): \(p=0.5\) vs \(H_1\): \(p>0.5\)

Bagian b

Diketahui:

\(x=120\) \(n=200\) \(p=0.5\) \(\alpha=0.05\)

prop.test(120,200,p=0.5,alternative = "great",conf.level=0.95)
## 
##  1-sample proportions test with continuity correction
## 
## data:  120 out of 200, null probability 0.5
## X-squared = 7.605, df = 1, p-value = 0.00291
## alternative hypothesis: true p is greater than 0.5
## 95 percent confidence interval:
##  0.5395277 1.0000000
## sample estimates:
##   p 
## 0.6

Kesimpulan: \(p_{value}=0.00291\) kurang dari \(\alpha=0.05\) sehinga Tolak \(H_0\). Hal ini berarti pada taraf \(\alpha 5%\), kita cukup bukti untuk menyatakan bahwa klaim yang menyatakan kandidat X akan mendapatkan suara mayoritas adalah benar.

Bagian c

di R belum tersedia dg menggunakan uji sehingga akan digunakan selang kepercayaan

DescTools::BinomCI(120,200,conf.level=0.95,method="wald")
##      est    lwr.ci    upr.ci
## [1,] 0.6 0.5321049 0.6678951

Kesimpulan: Karena batas bawah selang di atas \(0.5\) maka klaim bahwa kandidat X akan memperoleh suara mayoritas adalah benar pada \(\alpha 5%\).

Soal 4

Jawaban Soal 4

\(H_0\): \(p=0.5\) vs \(H_1\): \(p>0.5\)

Bagian a

DescTools::BinomCI(120,200,conf.level=0.95,method="wald")
##      est    lwr.ci    upr.ci
## [1,] 0.6 0.5321049 0.6678951

Bagian b

DescTools::BinomCI(120,200,conf.level=0.99,method="wald")
##      est    lwr.ci    upr.ci
## [1,] 0.6 0.5107707 0.6892293

Bagian c

Baik pada selang kepercayaan \(95%\) maupun \(99%\) menunjukkan bahwa batas bawah lebih dari \(0.5\). Oleh karena itu, semakin memperkuat bahwa kandidat X akan memperoleh suara mayoritas.

Soal 5

Jawaban Soal 5

Bagian a

new.teach<-c(25,30,30,14,1) #grades sekarang
res<-chisq.test(new.teach,p=c(0.2,0.4,0.2,0.15,0.05))
res
## 
##  Chi-squared test for given probabilities
## 
## data:  new.teach
## X-squared = 12.017, df = 4, p-value = 0.01723

\(p_{value} = 0.01723 < \alpha= 0.05\) sehingga Tolak \(H_0\). Dengan kata lain, pada taraf \(\alpha 5%\) metode baru memiliki hasil yang berbeda dengan metode lama.

Bagian b

Metode baru memberikan nilai yang lebih besar karena jumlah yang mendapat nilai D dan E pada metode baru lebih sedikit jika dibanding metode lama

Soal 6

Repeat Problem Soal 5 using the likelihood ratio test.

Jawaban Soal 6

res2 <- c(new.teach, p=c(20,40,20,15,5))
DescTools::GTest(res2, correct = "none")
## 
##  Log likelihood ratio (G-test) goodness of fit test
## 
## data:  res2
## G = 76.793, X-squared df = 9, p-value = 6.988e-13

Hasil yang diperoleh adalah nilai \(p_{value}= 6.988\times e^{-13} < \alpha= 0.05\) sehingga dengan kata lain pada \(\alpha 5%\), metode baru dan metode lama memiliki hasil yang berbeda.

Soal 7

Jawaban Soal 7

Bagian a

Diketahui: \(x=2\) \(n=50\) \(\phi=0.1\)

propp<-2/50 #proporsi=x/n
propp
## [1] 0.04
a<-pbinom(2,50,prob=p)-pbinom(1,50,prob=propp)
a
## [1] -0.4004812
dbinom(2,50,propp)
## [1] 0.2762328

Bagian b

\(H_0\): \(p=0.1\) vs \(H_1\): \(p<0.1\)

Distribusi Binomial: \(x=2\) \(n=50\) \(p=2/50\) \(\phi=0.1\) \(\alpha=0.05\)

stats::binom.test(2,50,0.1,alternative = "less",conf.level=0.95)
## 
##  Exact binomial test
## 
## data:  2 and 50
## number of successes = 2, number of trials = 50, p-value = 0.1117
## alternative hypothesis: true probability of success is less than 0.1
## 95 percent confidence interval:
##  0.0000000 0.1206142
## sample estimates:
## probability of success 
##                   0.04

\(p_{value}=0.1117\) lebih besar dari \(\alpha=0.05\) sehingga **Tidak Tolak \(H_0\) dengan kata lain tidak cukup bukti untuk menyatakan bahwa heart disease rate is significantly lower in the population of obese men placed on a low-fat diet: pada \(\alpha 5%\).

Soal 8

Repeat Problem Soal 7 using the score test.

Jawaban Soal 8

prop.test(2,50,alternative = "less",conf.level = 0.95, correct=TRUE)
## 
##  1-sample proportions test with continuity correction
## 
## data:  2 out of 50, null probability 0.5
## X-squared = 40.5, df = 1, p-value = 9.831e-11
## alternative hypothesis: true p is less than 0.5
## 95 percent confidence interval:
##  0.0000000 0.1276154
## sample estimates:
##    p 
## 0.04

Karena \(p_{value} = 9.831\timese^{-11}\) lebih kecil dari \(\alpha=0.05\) sehingga Tolak \(H_0\).

Soal 9

Jawaban Soal 9

Bagian a

\(H_0\): Keempat isu memiliki kepentingan yang sama (p masing-masing isu = \(1/4\)))

\(H_1\): Keempat isu tidak memiliki kepentingan yang sama (p masing-masing isu tidak sama dengan \(1/4\)))

Bagian b

l.isu<-c(80,40,65,15) #levels sekarang
tes<-chisq.test(l.isu,p=c(1/4,1/4,1/4,1/4))
tes
## 
##  Chi-squared test for given probabilities
## 
## data:  l.isu
## X-squared = 49, df = 3, p-value = 1.304e-10

\(p_{value} = 1.304\times e^{-10} < \alpha= 0.05\) sehingga Tolak \(H_0\). Dengan kata lain, pada taraf \(\alpha 5%\) keempat isu memiliki kepentingan yang tidak sama (berbeda) dimata para pemilih (voters).

Soal 10

Repeat Problem Soal 9 using the score test.

tes2 <- c(l.isu, p=c(80,40,65,15))
DescTools::GTest(tes2, correct = "none")
## 
##  Log likelihood ratio (G-test) goodness of fit test
## 
## data:  tes2
## G = 110.67, X-squared df = 7, p-value < 2.2e-16

Hasil yang diperoleh adalah nilai \(p_{value}= 2.2\times e^{-16} < \alpha= 0.05\) sehingga dengan kata lain pada \(\alpha 5%\), keempat isu memiliki kepentingan yang tidak sama (berbeda) dimata para pemilih (voters).

TERIMAKASIH