Pruebas de Hipótesis

Hipótesis estadísticas

Definición

Una hipótesis estadística \((H)\) es una proposición acerca de una característica de la población de estudio.

Por ejemplo: “la variable \(X\) toma valores en el intervalo \((a, b)\)”, “el valor de \(\theta\) es \(2^{\prime \prime}, \mid " l a\) distribución de \(X\) es normal”, etc.

Ejemplo

  • Una compañía recibe un gran cargamento de piezas. Sólo acepta el envío si no hay más de un \(5 \%\) de piezas defectuosas. ¿Cómo tomar una decisión sin verificar todas las piezas?

  • Se quiere saber si una propuesta de reforma tributaria es acogida de igual forma por hombres y mujeres. ¿Cómo se puede verificar esa conjetura?

    • Se formula la hipótesis sobre la población.
    • Las conclusiones sobre la validez de la hipótesis se basarán en la información de una muestra

Hipótesis nula y alternativa

  • Llamamos hipótesis nula, y se representa por \(H_0\), a la hipótesis que se desea contrastar.

Es la hipótesis que se plantea en primer lugar y la hipótesis que mantendremos a no ser que los datos indiquen su falsedad.

  • Es una idea es similar a la presunción de inocencia en un juicio.

  • La hipótesis nula siempre contiene los signos “\(=\)”, “\(\geq\)” o “\(\leq\)”.

  • La hipótesis nula nunca se acepta, se rechaza o no se rechaza.

  • Llamamos hipótesis alternativa, y la representamos por \(H_1\), a la negación de la hipótesis nula.

    • Es generalmente la hipótesis que se quiere verificar.
    • La hipótesis alternativa nunca contiene los signos “\(=\)”, “\(\geq\)” o “\(\leq\)”.
    • La hipótesis alternativa puede aceptarse o no aceptarse.

Ejemplo

En semestres pasados, el número medio de préstamos por semestre y por alumno en la biblioteca de la FULL ha sido de 4. Este semestre la biblioteca ha hecho una campaña de información y quiere saber el efecto que esta ha tenido entre los estudiantes. ¿Cuáles serían las hipótesis nula y alternativa en este caso?

Tipos de errores en un contraste de hipótesis

Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en probabilidades, siempre existe la posibilidad de llegar a una conclusión incorrecta. Cuando usted realiza una prueba de hipótesis, puede cometer dos tipos de error:

  • tipo I y

  • tipo II. Los riesgos de estos dos errores están inversamente relacionados y se determinan según el nivel de significancia y la potencia de la prueba. Por lo tanto, usted debe determinar qué error tiene consecuencias más graves para su situación antes de definir los riesgos.

  • Error de tipo I Si usted rechaza la hipótesis nula cuando es verdadera, comete un error de tipo I. La probabilidad de cometer un error de tipo I es \(\alpha\), que es el nivel de significancia que usted establece para su prueba de hipótesis. Un \(\alpha\) de 0.05 indica que usted está dispuesto a aceptar una probabilidad de \(5\%\) de estar equivocado al rechazar la hipótesis nula. Para reducir este riesgo, debe utilizar un valor menor para \(\alpha\). Sin embargo, usar un valor menor para alfa significa que usted tendrá menos probabilidad de detectar una diferencia si esta realmente existe.

  • Error de tipo II

Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de cometer un error de tipo II es \(\beta\), que depende de la potencia de la prueba. Puede reducir el riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo suficientemente grande como para detectar una diferencia práctica cuando esta realmente exista.

La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a \(1–\beta\). Este valor es la potencia de la prueba.

library(PASWR2)
## Loading required package: lattice
## Loading required package: ggplot2
library(DT)
data("EPIDURAL")
DT::datatable(EPIDURAL)
plot(density(EPIDURAL$cm))

Pasos Pruebas de Hipótesis

  • Paso 1: Hipótesis - Enuncie las hipótesis nula y alternativa.
  • Paso 2: Estadística de prueba - Seleccione una estadística de prueba adecuada y su distribución muestral bajo la hipótesis nula.
  • Paso 3: Calcular el valor p o region de rechazo
  • Paso 4: Conclusión estadística
  • Paso 5: Explicar la conclusión

Ejemplo

Los médicos quieren saber la altura media de las mujeres a las que se les aplica anestesia epidural en posición sentada tradicional. Sospechan que la altura media es superior a 163 cm.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
alturas=EPIDURAL %>% filter(treatment=="Traditional Sitting")
eda(alturas$cm)

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
##   50.000    0.000  152.000  160.000  165.300  164.000  165.065  170.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##  185.000    6.905   47.684    0.977   10.000   33.000   -0.105    0.492 
## SW p-val 
##    0.230
  • Paso 1: \[ \begin{align} H_0 &: μ = 163\\ H_1 &: μ > 163. \end{align} \]

  • Paso 2: Test estadístico

\[\frac{\bar{X}-\mu_{0}}{S / \sqrt{n}} \sim t_{n-1}\]

calculamos el valor

xbarrra=mean(alturas$cm)
xbarrra
## [1] 165.3
mu=163
S=sd(alturas$cm)
S
## [1] 6.905337
n=length(alturas$cm)
n
## [1] 50
T=(xbarrra- mu)/(S/sqrt(n))
T
## [1] 2.355201
  • Paso 3 Región de rechazo

La región de rechazo es \(t_{obs} > t_{0.05 , 49}\) = ?

qt(0.05/2, df=49, lower.tail = F)
## [1] 2.009575
pt(2.35, df=49, lower.tail = F)
## [1] 0.01142273
ngl<-49
x<-seq(-4,4,length=5000)
plot(x,dt(x,ngl), main=c("Densidad t-Student"),
sub=paste("gl=",ngl),
ylab="t-Student",type="l",col=3)
#Sombrear área for para valores mayores o iguales a 1
value <- 1.67
x1=x[x >= value]
y1=dt(x1,ngl)
polygon(c(x1, value),c(y1,0),
        col = "slateblue1",
        border = 1)
text(1.7, 0.17, "1.67", col = "darkred")
abline(v = 1.67, col="green") 

  • Paso 4: Conclusión estadística - El valor P es \(P(t49 ≥ 2,36) = 0,01\).
    • I. De la región de rechazo, rechazar \(H_0\) porque t_\(obs\) = 2,36 es mayor que 1,68.
    1. A partir del valor p, rechazar \(H_0\) porque el valor p = 0,01 es menor que 0.05. Rechace H0.
  • Paso 5: Explique la conclusión - Hay pruebas que sugieren que la altura media de las mujeres en posición sentada es superior a 163 cm.
library(tigerstats)
ttestGC(~cm,data=alturas, mu=163,
        alternative="greater",graph=TRUE)
## 
## 
## Inferential Procedures for One Mean mu:
## 
## 
## Descriptive Results:
## 
## variable  mean     sd       n          
## cm        165.300  6.905    50         
## 
## 
## Inferential Results:
## 
## Estimate of mu:   165.3 
## SE(x.bar):    0.9766 
## 
## 95% Confidence Interval for mu:
## 
##           lower.bound         upper.bound          
##           163.662744          Inf                  
## 
## Test of Significance:
## 
##  H_0:  mu = 163 
##  H_a:  mu > 163 
## 
##  Test Statistic:     t = 2.355 
##  Degrees of Freedom:   49 
##  P-value:        P = 0.01128

Prueba de diferencia de medias.

Resumen para la prueba de diferencias de medias cuando se toman muestras independientes de distribuciones normales con varianzas desconocidas y desiguales - Hipótesis Nula \[H_{0}: \mu_{X}-\mu_{Y}=0\]

\[\begin{array}{|c|c|} \hline \text{Hipótesis Alternativa} & \text{Región de rechazo} \\ \hline H_{1}: \mu_{X}-\mu_{Y}<0 & t_{\mathrm{obs}}<t_{\alpha ; \nu} \\ H_{1}: \mu_{X}-\mu_{Y}>0 & t_{\mathrm{obs}}>t_{1-\alpha ; \nu} \\ H_{1}: \mu_{X}-\mu_{Y} \neq 0 & \left|t_{\mathrm{obs}}\right|>t_{1-\alpha / 2 ; \nu} \\ \hline \end{array}\]

Ejemplo: EPIDURAL

Con el conjunto de datos EPIDURAL, realice una prueba de significación para ver si la altura media de las mujeres atendidas por el Dr.A es igual a la altura media de mujeres atendidas por el Dr. B a un nivel de significación = 0,05, donde ahora las varianzas son desconocidas pero desiguales.

library(ggplot2)
ggplot(EPIDURAL, aes(x=doctor, y=cm, color=doctor))+
  geom_boxplot()

cm.A = EPIDURAL %>% filter(doctor=="Dr. A")
cm.C<-EPIDURAL %>% filter(doctor=="Dr. C")

cm.C
##    doctor kg  cm      ease           treatment oc              complications
## 1   Dr. C 86 176      Easy   Hamstring Stretch  0                       None
## 2   Dr. C 91 175      Easy   Hamstring Stretch  1                       None
## 3   Dr. C 65 155      Easy Traditional Sitting  2                       None
## 4   Dr. C 91 163 Difficult   Hamstring Stretch  2                Paresthesia
## 5   Dr. C 48 152      Easy   Hamstring Stretch  0                       None
## 6   Dr. C 85 168      Easy   Hamstring Stretch  2                Paresthesia
## 7   Dr. C 80 173      Easy   Hamstring Stretch  0                       None
## 8   Dr. C 83 168      Easy Traditional Sitting  1                       None
## 9   Dr. C 71 152      Easy Traditional Sitting  4                       None
## 10  Dr. C 59 168      Easy Traditional Sitting  0                       None
## 11  Dr. C 75 173      Easy Traditional Sitting NA Failure - person got dizzy
## 12  Dr. C 90 168 Difficult   Hamstring Stretch  0                Paresthesia
## 13  Dr. C 95 170 Difficult   Hamstring Stretch 10     Failure - too many OCs
## 14  Dr. C 94 185      Easy Traditional Sitting  0                       None
## 15  Dr. C 85 163      Easy   Hamstring Stretch  0                       None
## 16  Dr. C 74 168      Easy Traditional Sitting  0                       None
## 17  Dr. C 92 163      Easy Traditional Sitting  1                       None
## 18  Dr. C 84 160      Easy   Hamstring Stretch  0                       None
## 19  Dr. C 77 157      Easy Traditional Sitting  0                       None
## 20  Dr. C 57 160      Easy   Hamstring Stretch  3                       None
## 21  Dr. C 96 180      Easy Traditional Sitting  0                       None
t.test(cm.A$cm, cm.C$cm, alternative="two.sided")
## 
##  Welch Two Sample t-test
## 
## data:  cm.A$cm and cm.C$cm
## t = -1.2259, df = 25.598, p-value = 0.2314
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -6.758720  1.711101
## sample estimates:
## mean of x mean of y 
##  164.0000  166.5238
Doctors= EPIDURAL %>% filter(doctor=="Dr. A" | doctor=="Dr. C")
Doctors
##    doctor  kg  cm       ease           treatment oc              complications
## 1   Dr. C  86 176       Easy   Hamstring Stretch  0                       None
## 2   Dr. C  91 175       Easy   Hamstring Stretch  1                       None
## 3   Dr. A  67 167       Easy Traditional Sitting  6                       None
## 4   Dr. C  65 155       Easy Traditional Sitting  2                       None
## 5   Dr. C  91 163  Difficult   Hamstring Stretch  2                Paresthesia
## 6   Dr. C  48 152       Easy   Hamstring Stretch  0                       None
## 7   Dr. C  85 168       Easy   Hamstring Stretch  2                Paresthesia
## 8   Dr. C  80 173       Easy   Hamstring Stretch  0                       None
## 9   Dr. A  57 165       Easy   Hamstring Stretch  1                       None
## 10  Dr. A 105 165  Difficult   Hamstring Stretch 10     Failure - too many OCs
## 11  Dr. C  83 168       Easy Traditional Sitting  1                       None
## 12  Dr. C  71 152       Easy Traditional Sitting  4                       None
## 13  Dr. A  83 170       Easy Traditional Sitting  1                       None
## 14  Dr. C  59 168       Easy Traditional Sitting  0                       None
## 15  Dr. C  75 173       Easy Traditional Sitting NA Failure - person got dizzy
## 16  Dr. A  61 163       Easy Traditional Sitting  1                       None
## 17  Dr. A 106 165       Easy Traditional Sitting  2                       None
## 18  Dr. A  81 163       Easy Traditional Sitting  1                       None
## 19  Dr. A 103 161       Easy   Hamstring Stretch  1                       None
## 20  Dr. A 142 170 Impossible Traditional Sitting  1                       None
## 21  Dr. A  67 160       Easy Traditional Sitting  1                       None
## 22  Dr. C  90 168  Difficult   Hamstring Stretch  0                Paresthesia
## 23  Dr. A  71 163       Easy Traditional Sitting  1                       None
## 24  Dr. A  66 160       Easy   Hamstring Stretch  1                       None
## 25  Dr. C  95 170  Difficult   Hamstring Stretch 10     Failure - too many OCs
## 26  Dr. A  70 165       Easy   Hamstring Stretch  4                       None
## 27  Dr. C  94 185       Easy Traditional Sitting  0                       None
## 28  Dr. C  85 163       Easy   Hamstring Stretch  0                       None
## 29  Dr. A  90 163       Easy Traditional Sitting  0                       None
## 30  Dr. A  84 164  Difficult Traditional Sitting  1                       None
## 31  Dr. C  74 168       Easy Traditional Sitting  0                       None
## 32  Dr. C  92 163       Easy Traditional Sitting  1                       None
## 33  Dr. A  80 157  Difficult Traditional Sitting  5                       None
## 34  Dr. C  84 160       Easy   Hamstring Stretch  0                       None
## 35  Dr. A  63 163       Easy Traditional Sitting  0                       None
## 36  Dr. A  85 165       Easy   Hamstring Stretch  0                       None
## 37  Dr. A  79 168       Easy   Hamstring Stretch  0                       None
## 38  Dr. A  79 160       Easy Traditional Sitting  3                       None
## 39  Dr. C  77 157       Easy Traditional Sitting  0                       None
## 40  Dr. C  57 160       Easy   Hamstring Stretch  3                       None
## 41  Dr. C  96 180       Easy Traditional Sitting  0                       None
## 42  Dr. A 103 170       Easy Traditional Sitting  1                       None
## 43  Dr. A  72 160       Easy Traditional Sitting  0                       None
## 44  Dr. A  94 165       Easy   Hamstring Stretch  0                       None
ttestGC(cm~doctor,data=Doctors,
      mu=0,first="Dr. A", graph = T)
## 
## 
## Inferential Procedures for the Difference of Two Means mu1-mu2:
##  (Welch's Approximation Used for Degrees of Freedom)
##   cm grouped by doctor 
## 
## 
## Descriptive Results:
## 
## group mean      sd        n          
## Dr. A 164.000   3.477     23         
## Dr. C 166.524   8.830     21         
## 
## 
## Inferential Results:
## 
## Estimate of mu1-mu2:  -2.524 
## SE(x1.bar - x2.bar):  2.059 
## 
## 95% Confidence Interval for mu1-mu2:
## 
##           lower.bound         upper.bound          
##           -6.758707           1.711088             
## 
## Test of Significance:
## 
##  H_0:  mu1-mu2 = 0 
##  H_a:  mu1-mu2 != 0 
## 
##  Test Statistic:     t = -1.226 
##  Degrees of Freedom:   25.6 
##  P-value:        P = 0.2314

Pruebas de hipótesis para \(\pi_1\) - \(\pi_2\).

Ejemplo

use los datos EPIDURAL para probar si la verdadera proporción de mujeres que se anestesian anestesia en la posición de estiramiento de los isquiotibiales es menor que la mujeres que tienen anestesia en la posición sentada tradicional.

harm=EPIDURAL %>% filter(treatment=="Hamstring Stretch")
n.harm=nrow(harm)
sit<- EPIDURAL %>% filter(treatment=="Traditional Sitting")
n.sit=nrow(sit)
prop.test(c(n.harm,n.sit),c(nrow(EPIDURAL),nrow(EPIDURAL)),alternative="l",
correct=TRUE)
## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c out of cn.harm out of nrow(EPIDURAL)n.sit out of nrow(EPIDURAL)
## X-squared = 4.6118, df = 1, p-value = 0.01588
## alternative hypothesis: less
## 95 percent confidence interval:
##  -1.00000000 -0.04053125
## sample estimates:
##    prop 1    prop 2 
## 0.4117647 0.5882353
proptestGC(x=c(n.harm, n.sit),n=c(nrow(EPIDURAL),nrow(EPIDURAL)),
           p=0,conf.level=0.95,graph=TRUE, alternative="less" )
## 
## 
## Inferential Procedures for the Difference of Two Proportions p1-p2:
##  Results taken from summary data.
## 
## 
## Descriptive Results:
## 
##         successes  n estimated.prop
## Group 1        35 85         0.4118
## Group 2        50 85         0.5882
## 
## 
## Inferential Results:
## 
## Estimate of p1-p2:    -0.1765 
## SE(p1.hat - p2.hat):  0.07549 
## 
## 95% Confidence Interval for p1-p2:
## 
##           lower.bound         upper.bound          
##           -1.000000           -0.052296            
## 
## Test of Significance:
## 
##  H_0:  p1-p2 = 0
##  H_a:  p1-p2 < 0
## 
##  Test Statistic:     z = -2.338 
##  P-value:        P = 0.009704