PRUEBAS DE HIPOTESIS PARA COMPARAR DOS PROPORCIONES

Proporcion:

Es una medida que relaciona una parte específica de una población con el total de esa población. Las proporciones son útiles para describir la frecuencia o la prevalencia de un evento o característica particular en un grupo de interés.

Proporción de prevalencia:

Esta proporción compara el número de individuos con una característica específica en un momento dado con el total de individuos en la población en ese mismo momento. Se calcula como:

Prevalencia = (Número de casos con la característica) / (Tamaño total de la población)

Proporción de incidencia:

Esta proporción compara el número de nuevos casos de una enfermedad o evento en un período específico con el tamaño total de la población en riesgo durante ese mismo período. Se calcula como:

Incidencia = (Número de nuevos casos) / (Tamaño total de la población en riesgo)

prevalence

\[\text{proportion}~\hat{p}=\frac{n_{(+)}}{n_(+)+n_(-)}\] incidence

\[ \text{rate} ~\hat{\lambda} = \frac{n_{(+)}~new}{\text{time}} \]

# grid
xy=expand.grid(x=seq(0,77,7),
               y=seq(0,99,9))
dim(xy)
## [1] 144   2
plot(xy,pch=8,col="darkgreen")

# status
set.seed(1077035318)
status= round(runif(144,min = 0,max = 0.65),0)
# New plot
plot(xy,pch=18,col=as.factor(status),cex=2)

table(status)
## status
##   0   1 
## 118  26
table(status)*100/144
## status
##        0        1 
## 81.94444 18.05556
sanos = which(status==0)
status2= status
status2[sanos] =round(runif(length(sanos),min = 0,max = 0.55),0)
plot(xy,pch=18,col=as.factor(status2),cex=2,main="t2")

plot(xy,pch=18,col=as.factor(status),cex=1, main="Casos Nuevos")
points(xy[which(status2==1),],col=as.factor(status2),pch=0,cex=2)

table(status)*100/144
## status
##        0        1 
## 81.94444 18.05556
table(status2)*100/144
## status2
##        0        1 
## 76.38889 23.61111

Ejercicio: Se evaluó la prevalencia de 2 genotipos de arroz relacionada con la enfermedad causada por la novia del arroz.Un muestreo en campo de 40 parcelas con el genotipo 1 y 36 parcelas con el genotipo 2, generó los siguientes resultados:

  1. Calcular la prevalencia de cada genotipo
  2. Los datos evidencian que la prevalencia es mayor en el genotipo 1
p_g1 = 4/40
p_g1
## [1] 0.1
p_g2 = 3/36
p_g2
## [1] 0.08333333

Hipotesis

\[H_0: \pi_{1} = \pi_{2} \\ H_1: \pi_{1} > \pi_{2}\]

# Ctrl + Alt+ i Chunk R
prop.test(x = c(4,3),n = c(40,36),alternative = "g")
## Warning in prop.test(x = c(4, 3), n = c(40, 36), alternative = "g"):
## Chi-squared approximation may be incorrect
## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(4, 3) out of c(40, 36)
## X-squared = 1.0781e-30, df = 1, p-value = 0.5
## alternative hypothesis: greater
## 95 percent confidence interval:
##  -0.1087585  1.0000000
## sample estimates:
##     prop 1     prop 2 
## 0.10000000 0.08333333

Ejercicio

Se desea comparar la proporción de la germinación de semillas de 2 casas comerciales. En la casa x la prueba de germinación requirió 1200 semillas de las cuales germinarion 1100. En la casa y requirió de 1500 semillas de las que germinaron 1350. ¿Se puede considerar estadísticamente que la germinación es igual en las dos casas comerciales?