De vraag is hoeveel participanten met UHR er geincludeerd moeten worden voor behandeling wanneer het effect wordt uitgedrukt in het aantal participanten dat baat heeft bij de behandeling en dus na de behandeling niet meer geclassificeerd wordt als UHR. Er wordt een middelgroot tot groot effect verwacht. Type 1 fout wordt vastgezet op .05 en type 2 fout op .2. De statistische toets die hier van toepassing is, is de Poisson test waarmee twee tellingen kunnen worden vergeleken. De null hypothese bij deze test is dat het aantal UHR geclassificeerden gelijk is gebleven na behandeling. De H0 wordt verworpen wanneer dit aantal significant is afgenomen. De effect size wordt gedefinieerd als 1 minus het aantal mensen met UHR na behandeling gedeeld door het totaal aantal mensen. NB. de MCNemar test kan hier niet worden gebruikt omdat het aantal participanten zonder UHR voor behandeling 0 is. Een 0 in een \(2*2\) kruistabel is problematisch.
H0<-dpois(c(1:150), 100, log = FALSE)
Ha<-dpois(c(1:150), 60, log = FALSE)
plot(c(1:150),H0)
lines(c(1:150),H0)
points(c(1:150),Ha)
lines(c(1:150),Ha)
kw<-qpois(.05, 100, lower.tail = TRUE, log.p = FALSE)
kw
## [1] 84
abline(v=kw,col="red")
Bovenstaand figuur is een voorbeeld van een situatie waarin er 100 UHR participanten zijn voor behandeling en na behandeling zijn dit er nog 60. De effect size is dan .4. De rechter curve laat de kans verdeling zien onder de poisson verdeling van de Hnull hypothese waarbij er 100 UHR participanten zijn. De linker curve laat de alternatieve hypothese zien waarbij het aantal participanten met UHR na behandeling 60 is. De rode verticale lijn laat zien bij welk aantal patienten na behandeling met UHR de Hnull verworpen wordt. Dit aantal is 84. De oppervlakte van de linkercurve totaan de rode lijn is nu de power van dit design.
kw<-qpois(.05, 100, lower.tail = TRUE, log.p = FALSE)
power<-ppois(kw,60, lower.tail = TRUE, log.p = FALSE)
power
## [1] 0.9986412
De power van dit design is vrijwel gelijk aan 1. Het grootste deel van de linkercurve ligt links van de rode lijn. Dit betekent dat als we een effect size hebben van .4, we met 100 deelnemers een zeer grote kans hebben om het effect te vinden.
De vraag is echter hoeveel participanten er moeten worden geincludeerd bij verschillende effect sizes. We berekenen de vereiste sample size bij effect groottes van power voor effect sizes .1,.2,.3,.4,.5,.6,.7,.8.
power.poiss<-function(d,alpha,beta){
q<-seq.int(1,2000)
kw<-rep(NA,length(q))
power<-rep(NA,length(q))
j=1
for(i in q){
kw[j]<-qpois(alpha, i, lower.tail = TRUE, log.p = FALSE) #kritische waarde onder H0
if(kw[j]<2){
power[j]=NA
}else{
power[j]<-ppois(kw[j],round((1-d)*i,0), lower.tail = TRUE, log.p = FALSE) #kans op kritische waarde onder Ha.
}
j=j+1
}
sample.size<-q[which.min(abs(power - (1-beta)))]
res<-list(d,sample.size)
return(res)
}
d<-seq(.1,.8,.1)
results<-list()
for(i in d){
results[[which(d==i)]]<-power.poiss(d=i,alpha=.05,beta=.2)
}
df<-data.frame(t(matrix(unlist(results),2, 8)))
colnames(df)<-c("effectsize","sample size")
datatable(df,options = list(dom = 't'))
De resultaten laten zien dat bij een effect size van .1, er 595 mensen nodig zijn, na behandeling is de verwachting dat er nog 535 (90%) de diagnose UHR hebben. Bij een grotere effect size neemt de benodigde sample size flink af. Bij een middelgrote effect size van .5 zijn er nog maar 18 participanten nodig. Met deze effect size worden er na verwachting na behandeling nog 9 mensen gediagnosticeerd met UHR.