A. Pengujian Hipotesis Proporsi Tunggal

Salah satu Analisis Data Kategorik yang penting adalah Analisis tentang Proporsi. Pengujian hipotesis proporsi tunggal berbeda dengan pengujian hipotesis rata-rata. Pengujian hipotesis proporsi tunggal merupakan pengujian pada peubah diskrit. Dimana telah dibahas bahwa peubah tersebut mengikuti distribusi peluang binomial.

Ada dua pendekatan pada pengujian hipotesis proporsi tunggal:

1. Hipotesis Menggunakan Distribusi Binomial (Exact Test)

Pengujian hipotesis proporsi tunggal menggunakan distribusi binomial untuk pengambilan keputusan. Pengambilan keputusan didasarkan pada p-value atau peluang ekstrim dari suatu nilai statistik atau estimator titik.

Berikut adalah contoh kasus Uji Hipotesis Proporsi Tunggal Pendekatan Exact Test:

Soal no 3.2 pada Azen dan Walker (2011)

ilustrasi

ilustrasi

poin a

#Proporsi obesitas yang mengalami penyakit jantung adalah 10%. Dari rs 50 2 orang yang melakukan low fat diet terkena penyakit setelah 6 minggu
#a MLE proporsi obesitas yang melakukan low fat diet yang terkena penyakit jantung
p32<-2/50
p32
## [1] 0.04
#peluang 2 dari 50 orang mengalami penyakit jantung
a32<-pbinom(2,50,prob=p32)-pbinom(1,50,prob=p32)
a32
## [1] 0.2762328

poin b

#hipotesis alternative: p<0.1
stats::binom.test(2,50,p=0.1,alternative = "less",conf.level=0.95)
## 
##  Exact binomial test
## 
## data:  2 and 50
## number of successes = 2, number of trials = 50, p-value = 0.1117
## alternative hypothesis: true probability of success is less than 0.1
## 95 percent confidence interval:
##  0.0000000 0.1206142
## sample estimates:
## probability of success 
##                   0.04
#p value yang diperoleh lebih besar dari alfa=5%
#sehingga tidak tolak H0

2. Hipotesis Menggunakan Pendekatan Normal

Ketika jumlah sampel (n) relatif besar, distribusi normal bisa didekati dengan distribusi normal standar. Pendekatan normal bisa digunakan jika nilai np>=5 dan n(1-p)>=5.

Pendekatan normal pada pengujian hipotesis proporsi tunggal sejenis dengan pengujian statistik rata-rata dimana nilai statistik uji z:

z= (Estimasti-Parameter)/ Standar Error

Pengujian hipotesis proporsi tunggal dibagi menjadi dua yaitu Uji Wald dan Uji Skor. Perbedaan dari Uji Wald dan Uji Skor adalah ada pada penentuan statistik uji z. Pada Uji Wald standar eror menggunakan rumus p hasil estimasi proporsi. Sedangkan pada Uji Skor untuk menghitung standar eror digunakan nilai p0 atau proporsi yang didefinisikan pada hipotesis nol.

Berikut adalah contoh kasus Uji Hipotesis Proporsi Tunggal Pendekatan Normal:

Soal no 3.4 pada Azen dan Walker (2011):

Kasus sama dengan soal no 3.2 (Skor Test)

ilustrasi

ilustrasi

#score test
prop.test(2,50,p=0.1,alternative = "less",conf.level = 0.95, correct=TRUE)
## 
##  1-sample proportions test with continuity correction
## 
## data:  2 out of 50, null probability 0.1
## X-squared = 1.3889, df = 1, p-value = 0.1193
## alternative hypothesis: true p is less than 0.1
## 95 percent confidence interval:
##  0.0000000 0.1276154
## sample estimates:
##    p 
## 0.04
#p value yang diperoleh lebih besar dari alfa=5%
#sehingga tidak tolak H0

Sedangkan Pendekatan Uji Wald

#Wald test
library(mosaic)
## Warning: package 'mosaic' was built under R version 3.6.3
## Registered S3 method overwritten by 'mosaic':
##   method                           from   
##   fortify.SpatialPolygonsDataFrame ggplot2
## 
## The 'mosaic' package masks several functions from core packages in order to add 
## additional features.  The original behavior of these functions should not be affected by this.
## 
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
## 
##     count, do, tally
## The following object is masked from 'package:Matrix':
## 
##     mean
## The following object is masked from 'package:ggplot2':
## 
##     stat
## The following objects are masked from 'package:stats':
## 
##     binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
##     quantile, sd, t.test, var
## The following objects are masked from 'package:base':
## 
##     max, mean, min, prod, range, sample, sum
mosaic::binom.test(2,n = 50,p = 0.1,alternative = c( "less"),conf.level = 0.95,ci.method = c("Wald"),data = NULL,success = NULL)
## 
##  Exact binomial test (Wald CI)
## 
## data:  2 out of 50
## number of successes = 2, number of trials = 50, p-value = 0.1117
## alternative hypothesis: true probability of success is less than 0.1
## 95 percent confidence interval:
##  0.00000000 0.08558352
## sample estimates:
## probability of success 
##                   0.04
#p value yang diperoleh lebih besar dari alfa=5%
#sehingga tidak tolak H0

Soal no 3.6 pada Azen dan Walker (2011)

ilustrasi

ilustrasi

Berdasarkan Uji pada no 3.2 dan 3.4 menghasilkan hasil yang sejalan yaitu dengan taraf uji 5 persen tidak tolak H0 atau tidak cukup bukti untuk menyatakan bahwa peluang orang yang diet low fat terkena penyakit jantung kurang dari 10 persen atau 0.1.

Pada uji Exact (Sebaran Binomial) menghasilkan nilai p-value=0.1117 sedangkan Skor Test menghasilkan p-value=0.1193. Ketika jumlah amatan (n) relatif besar maka hasil Skor Test akan sejalan dengan Exact Test karena sebaran Binomial ketika n relatif besar bisa dihampiri atau didekati dengan sebaran normal.

Berdasarkan Azen dan Walker (2001), Uji Exact (Binomial) bersifat lebih konservatif. Nilai p-value yang diperoleh dari metode ini bernilai lebih tinggi dibandingkan dengan Uji Skor, maksudnya ketika ditentukan taraf uji 0.05 dan hipotesis nol benar, maka untuk tidak menolak H0 batas tolaknya adalah kurang dari 0.05.

Hal ini dikarenakan Uji Exact menggunakan sebaran Binomial yang bersifat diskrit sehingga ketika penentuan keputusan tolak H0 atau tidak tolak H0 dengan bantuan tabel Binomial dicari nilai x yang peluang kumulatifnya kurang dari taraf yang ditentukan. Hal ini menjadikan peluang kumulatif x sebagai statistik uji pada Uji Exact akan lebih kecil dari taraf Uji.

Misal suatu uji berdasarkan tabel Binomial diperoleh akan tolak H0 jika x<=a sehingga P(x<=a)<0.05. Misal ketika a=5 P(x<=5)=0.06 sehingga 5 tidak masuk dalam kriteria dan misal P(x<=4)=0.04 sehingga 4 masuk kriteria sehingga statistik Ujinya menjadi tolak H0 jika x<=4 namun pada saat x=4 akan menghasilkan p-value 0.04 sehingga batas tolak H0 kurang dari 0.05.

B. Uji Kebaikan Suai (Goodnes of Fit)- Chi Square Test

Dalam analisis data kategorik, ketika suatu peubah kategorik terdiri dari dua kemungkinan hasil maka analisis yang tepat adalah analisis proporsi, sedangkan ketika kemungkinan hasil lebih dari dua maka pengujian yang bisa dilakukan adalah dengan Uji Kebaikan Suai. Adapun hipotesis nol dari uji ini adalah distribusi dari kategori mengikuti suatu kondisi yang ditentukan. Lalu dilakukan pengecekan terhadap kondisi data riil apakah sama tidak dengan yang ditentukan tersebut. Ada dua pendekatan untuk Uji kebaikan suai yaitu Uji Chi Square dan Uji Rasio Likelihood.

Berikut merupakan contoh kasus Uji Kebaikan Suai Chi Square:

Soal no 3.11 pada Azen dan Walker (2011)

ilustrasi

ilustrasi

poin a

H0: tidak ada perbedaan distribusi tingkat kepentingan dari suatu isu

H1: ada perbedaan distribusi kepentingan dari suatu isu

poin b

isu<-c(80,40,65,15)
res<-chisq.test(isu,p=c(0.25,0.25,0.25,0.25))
res
## 
##  Chi-squared test for given probabilities
## 
## data:  isu
## X-squared = 49, df = 3, p-value = 1.304e-10
#p value yang dihasilkan <alfa 0.05 sehingga tolak H0
#dengan kata lain terdapat perbedaan distribusi tingkat kepentingan isu

Berikut merupakan contoh kasus Uji Kebaikan Suai dengan Uji Rasio Likelihood:

Soal no 3.13 pada Azen dan Walker (2011)

ilustrasi

ilustrasi

res2 <- c(isu, p=c(50,50,50,50))
DescTools::GTest(res2, correct = "none")
## 
##  Log likelihood ratio (G-test) goodness of fit test
## 
## data:  res2
## G = 55.337, X-squared df = 7, p-value = 1.278e-09
#p value yang dihasilkan <alfa 0.05 sehingga tolak H0
#dengan kata lain terdapat perbedaan distribusi tingkat kepentingan isu

Referensi:

Azen, Razia, dan Cindy M. Walker. 2011. Categorical Data Analysis for The Behavioral and Social Sciences. New York. Routledge.