Pruebas de Hipótesis

Hipótesis estadísticas

Definición

Una hipótesis estadística \((H)\) es una proposición acerca de una característica de la población de estudio. Por ejemplo: “la variable \(X\) toma valores en el intervalo \((a, b)\)”, “el valor de \(\theta\) es \(2^{\prime \prime}, \mid " l a\) distribución de \(X\) es normal”, etc.

Ejemplo

  • Una compañía recibe un gran cargamento de piezas. Sólo acepta el envío si no hay más de un \(5 \%\) de piezas defectuosas. ¿Cómo tomar una decisión sin verificar todas las piezas?

  • Se quiere saber si una propuesta de reforma tributaria es acogida de igual forma por hombres y mujeres. ¿Cómo se puede verificar esa conjetura?

    • Se formula la hipótesis sobre la población.
    • Las conclusiones sobre la validez de la hipótesis se basarán en la informoción de una muestra

Hipótesis nula y alternativa

Llamamos hipótesis nula, y se representa por \(H_0\), a la hipótesis que se desea contrastar. Es la hipótesis que se plantea en primer lugar y la hipótesis que mantendremos a no ser que los datos indiquen su falsedad.

  • Es una idea es similar a la presunción de inocencia en un juicio.
  • La hipótesis nula siempre contiene los signos “\(=\)”, “\(\geq\)” o “\(\leq\)”.
  • La hipótesis nula nunca se acepta, se rechaza o no se rechaza.

Llamamos hipótesis alternativa, y la representamos por \(H_1\), a la negación de la hipótesis nula.

  • Es generalmente la hipótesis que se quiere verificar.
  • La hipótesis alternativa nunca contiene los signos “\(=\)”, “\(\geq\)” o “\(\leq\)”.
  • La hipótesis alternativa puede aceptarse o no aceptarse.

Ejemplo

En semestres pasados, el número medio de préstamos por semestre y por alumno en la biblioteca de la FULL ha sido de 4. Este semestre la biblioteca ha hecho una campaña de información y quiere saber el efecto que esta ha tenido entre los estudiantes. ¿Cuáles serían las hipótesis nula y alternativa en este caso?

Tipos de errores en un contraste de hipótesis

\[\begin{array}{|c|c|c|} \cline { 2 - 3 } \multicolumn{1}{c|}{\text { Decisión }} & \multicolumn{1}{|c|}{H_{0} \text { cierta }} & H_{0} \text { falsa } \\ \hline \multirow{2}{*}{\text { Rechazar } H_{0}} & \text { Error de Tipo I } & \text { Decisión correcta } \\ & P\left(\text { Rech. } \mid H_{0} \text { cierta }\right)=\alpha & P\left(\text { Rech. } \mid H_{0} \text { falsa }\right)=1-\beta \\ \text { No rechazar } H_{0} & \text { Decisión correcta } & \text { potencia } \\ & P\left(\text { No Rech. } \mid H_{0} \text { cierta }\right)=1-\alpha & P\left(\text { No Rech. } \mid H_{0} \text { falsa }\right)=\beta \\ \hline \end{array}\] Estado real \[\begin{array}{|c|c|c|} \cline { 2 - 3 } \multicolumn{1}{c|}{ Decisión } & \multicolumn{1}{|c|}{$H_{0}$ cierta } & $H_{0}$ falsa \\ \hline \multirow{2}{*}{ Rechazar $H_{0}$} & Error de Tipo I & Decisión correcta \\ & $P\left(\right.$ Rech. $\mid H_{0}$ cierta $)=\alpha$ & $P\left(\right.$ Rech. $\mid H_{0}$ falsa $)=1-\beta$ \\ No rechazar $H_{0}$ & Decisión correcta & potencia \\ & $P\left(\right.$ No Rech. $\mid H_{0}$ cierta $)=1-\alpha$ & $P\left(\right.$ No Rech. $\mid H_{0}$ falsa $)=\beta$ \\ \hline \end{array}\]
library(PASWR2)
## Loading required package: lattice
## Loading required package: ggplot2
library(DT)
data("EPIDURAL")
DT::datatable(EPIDURAL)
plot(density(EPIDURAL$cm))

Pasos Pruebas de Hipótesis

  • Paso 1: Hipótesis - Enuncie las hipótesis nula y alternativa.
  • Paso 2: Estadística de prueba - Seleccione una estadística de prueba adecuada y su distribución muestral bajo la hipótesis nula.
  • Paso 3: Calcular el valor p o region de rechazo
  • Paso 4: Conclusión estadística
  • Paso 5: Explicar la conclusión

Ejemplo

Los médicos quieren saber la altura media de las mujeres a las que se les aplica anestesia epidural en posición sentada tradicional. Sospechan que la altura media es superior a 163 cm.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
alturas=EPIDURAL %>% filter(treatment=="Traditional Sitting")
eda(alturas$cm)

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
##   50.000    0.000  152.000  160.000  165.300  164.000  165.065  170.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##  185.000    6.905   47.684    0.977   10.000   33.000   -0.105    0.492 
## SW p-val 
##    0.230
  • Paso 1: \[ \begin{align} H_0 &: μ = 163\\ H_1 &: μ > 163. \end{align} \]

  • Paso 2: Test estadístico

\[\frac{\bar{X}-\mu_{0}}{S / \sqrt{n}} \sim t_{n-1}\]

calculamos el valor

xbarrra=mean(alturas$cm)
xbarrra
## [1] 165.3
mu=163
S=sd(alturas$cm)
S
## [1] 6.905337
n=length(alturas$cm)
T=(xbarrra- mu)/(S/sqrt(n))
T
## [1] 2.355201
  • Paso 3 Región de rechazo

La región de rechazo es \(t_{obs} > t_{0.05 , 49}\) = ?

qt(0.05, df=49, lower.tail = F)
## [1] 1.676551
ngl<-49
x<-seq(-4,4,length=5000)
plot(x,dt(x,ngl), main=c("Densidad t-Student"),
sub=paste("gl=",ngl),
ylab="t-Student",type="l",col=3)
#Sombrear área for para valores mayores o iguales a 1
value <- 1.67
x1=x[x >= value]
y1=dt(x1,ngl)
polygon(c(x1, value),c(y1,0),
        col = "slateblue1",
        border = 1)
text(1.7, 0.17, "1.67", col = "darkred")
abline(v = 1.67, col="green") 

  • Paso 4: Conclusión estadística - El valor P es \(P(t49 ≥ 2,36) = 0,01\).
    • I. De la región de rechazo, rechazar \(H_0\) porque t_\(obs\) = 2,36 es mayor que 1,68.
    1. A partir del valor p, rechazar \(H_0\) porque el valor p = 0,01 es menor que 0.05. Rechace H0.
  • Paso 5: Explique la conclusión - Hay pruebas que sugieren que la altura media de las mujeres en posición sentada es superior a 163 cm.
library(tigerstats)
ttestGC(~cm,data=alturas, mu=163,
        alternative="greater",graph=TRUE)
## 
## 
## Inferential Procedures for One Mean mu:
## 
## 
## Descriptive Results:
## 
## variable  mean     sd       n          
## cm        165.300  6.905    50         
## 
## 
## Inferential Results:
## 
## Estimate of mu:   165.3 
## SE(x.bar):    0.9766 
## 
## 95% Confidence Interval for mu:
## 
##           lower.bound         upper.bound          
##           163.662744          Inf                  
## 
## Test of Significance:
## 
##  H_0:  mu = 163 
##  H_a:  mu > 163 
## 
##  Test Statistic:     t = 2.355 
##  Degrees of Freedom:   49 
##  P-value:        P = 0.01128

# Prueba de diferencia de medias. Resumen para la prueba de diferencias de medias cuando se toman muestras independientes de distribuciones normales con varianzas desconocidas y desiguales -Hipótesis Nula \[H_{0}: \mu_{X}-\mu_{Y}=0\]

Estadístico \[ t_{\mathrm{obs}}=\frac{\bar{X}-\bar{Y}-0}{\sqrt{\frac{s_{X}^{2}}{n_{X}}+\frac{s_{Y}^{2}}{n_{Y}}}}\]

\[\begin{array}{|c|c|} \hline \text{Hipótesis Alternativa} & \text{Región de rechazo} \\ \hline H_{1}: \mu_{X}-\mu_{Y}<0 & t_{\mathrm{obs}}<t_{\alpha ; \nu} \\ H_{1}: \mu_{X}-\mu_{Y}>0 & t_{\mathrm{obs}}>t_{1-\alpha ; \nu} \\ H_{1}: \mu_{X}-\mu_{Y} \neq 0 & \left|t_{\mathrm{obs}}\right|>t_{1-\alpha / 2 ; \nu} \\ \hline \end{array}\]

Ejemplo: EPIDURAL

Con el conjunto de datos EPIDURAL, realice una prueba de significación para ver si la altura media de las mujeres atendidas por el Dr.A es igual a la altura media de mujeres atendidas por el Dr. B a un nivel de significación = 0,05, donde ahora las varianzas son desconocidas pero desiguales.

library(ggplot2)
ggplot(EPIDURAL, aes(x=doctor, y=cm, color=doctor))+
  geom_boxplot()

cm.A = EPIDURAL %>% filter(doctor=="Dr. A")
cm.B<-EPIDURAL %>% filter(doctor=="Dr. B")

cm.B
##    doctor  kg  cm       ease           treatment oc complications
## 1   Dr. B 116 172  Difficult Traditional Sitting  0          None
## 2   Dr. B  72 157  Difficult Traditional Sitting  0          None
## 3   Dr. B  63 169       Easy   Hamstring Stretch  2          None
## 4   Dr. B 114 163 Impossible Traditional Sitting  0          None
## 5   Dr. B 121 163  Difficult   Hamstring Stretch  3          None
## 6   Dr. B  87 164  Difficult Traditional Sitting  6          None
## 7   Dr. B 108 175 Impossible Traditional Sitting  5          None
## 8   Dr. B  98 176       Easy Traditional Sitting  1          None
## 9   Dr. B  86 175       Easy Traditional Sitting  0          None
## 10  Dr. B  76 165  Difficult Traditional Sitting  0       Wet Tap
## 11  Dr. B 113 166  Difficult   Hamstring Stretch  5          None
## 12  Dr. B  86 165  Difficult   Hamstring Stretch  2          None
## 13  Dr. B  97 162  Difficult Traditional Sitting  4          None
## 14  Dr. B  59 157       Easy   Hamstring Stretch  0          None
## 15  Dr. B 112 170  Difficult Traditional Sitting  1          None
## 16  Dr. B  86 170 Impossible Traditional Sitting  1          None
## 17  Dr. B  93 170       Easy Traditional Sitting  1          None
## 18  Dr. B  79 160  Difficult Traditional Sitting  0          None
## 19  Dr. B  69 157       Easy Traditional Sitting  1          None
## 20  Dr. B  72 170       Easy   Hamstring Stretch  0          None
## 21  Dr. B  86 156 Impossible Traditional Sitting  0          None
t.test(cm.A$cm, cm.B$cm, alternative="two.sided")
## 
##  Welch Two Sample t-test
## 
## data:  cm.A$cm and cm.B$cm
## t = -1.1669, df = 30.58, p-value = 0.2523
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -4.974065  1.355018
## sample estimates:
## mean of x mean of y 
##  164.0000  165.8095
Doctors= EPIDURAL %>% filter(doctor=="Dr. A" | doctor=="Dr. B")
Doctors
##    doctor  kg  cm       ease           treatment oc          complications
## 1   Dr. B 116 172  Difficult Traditional Sitting  0                   None
## 2   Dr. B  72 157  Difficult Traditional Sitting  0                   None
## 3   Dr. B  63 169       Easy   Hamstring Stretch  2                   None
## 4   Dr. B 114 163 Impossible Traditional Sitting  0                   None
## 5   Dr. B 121 163  Difficult   Hamstring Stretch  3                   None
## 6   Dr. B  87 164  Difficult Traditional Sitting  6                   None
## 7   Dr. A  67 167       Easy Traditional Sitting  6                   None
## 8   Dr. A  57 165       Easy   Hamstring Stretch  1                   None
## 9   Dr. A 105 165  Difficult   Hamstring Stretch 10 Failure - too many OCs
## 10  Dr. B 108 175 Impossible Traditional Sitting  5                   None
## 11  Dr. B  98 176       Easy Traditional Sitting  1                   None
## 12  Dr. A  83 170       Easy Traditional Sitting  1                   None
## 13  Dr. B  86 175       Easy Traditional Sitting  0                   None
## 14  Dr. B  76 165  Difficult Traditional Sitting  0                Wet Tap
## 15  Dr. A  61 163       Easy Traditional Sitting  1                   None
## 16  Dr. A 106 165       Easy Traditional Sitting  2                   None
## 17  Dr. A  81 163       Easy Traditional Sitting  1                   None
## 18  Dr. A 103 161       Easy   Hamstring Stretch  1                   None
## 19  Dr. B 113 166  Difficult   Hamstring Stretch  5                   None
## 20  Dr. A 142 170 Impossible Traditional Sitting  1                   None
## 21  Dr. A  67 160       Easy Traditional Sitting  1                   None
## 22  Dr. A  71 163       Easy Traditional Sitting  1                   None
## 23  Dr. A  66 160       Easy   Hamstring Stretch  1                   None
## 24  Dr. A  70 165       Easy   Hamstring Stretch  4                   None
## 25  Dr. B  86 165  Difficult   Hamstring Stretch  2                   None
## 26  Dr. B  97 162  Difficult Traditional Sitting  4                   None
## 27  Dr. A  90 163       Easy Traditional Sitting  0                   None
## 28  Dr. A  84 164  Difficult Traditional Sitting  1                   None
## 29  Dr. B  59 157       Easy   Hamstring Stretch  0                   None
## 30  Dr. B 112 170  Difficult Traditional Sitting  1                   None
## 31  Dr. B  86 170 Impossible Traditional Sitting  1                   None
## 32  Dr. A  80 157  Difficult Traditional Sitting  5                   None
## 33  Dr. A  63 163       Easy Traditional Sitting  0                   None
## 34  Dr. A  85 165       Easy   Hamstring Stretch  0                   None
## 35  Dr. A  79 168       Easy   Hamstring Stretch  0                   None
## 36  Dr. A  79 160       Easy Traditional Sitting  3                   None
## 37  Dr. B  93 170       Easy Traditional Sitting  1                   None
## 38  Dr. B  79 160  Difficult Traditional Sitting  0                   None
## 39  Dr. B  69 157       Easy Traditional Sitting  1                   None
## 40  Dr. B  72 170       Easy   Hamstring Stretch  0                   None
## 41  Dr. B  86 156 Impossible Traditional Sitting  0                   None
## 42  Dr. A 103 170       Easy Traditional Sitting  1                   None
## 43  Dr. A  72 160       Easy Traditional Sitting  0                   None
## 44  Dr. A  94 165       Easy   Hamstring Stretch  0                   None
ttestGC(cm~doctor,data=Doctors,
      mu=0,first="Dr. A", graph = T)
## 
## 
## Inferential Procedures for the Difference of Two Means mu1-mu2:
##  (Welch's Approximation Used for Degrees of Freedom)
##   cm grouped by doctor 
## 
## 
## Descriptive Results:
## 
## group mean      sd        n          
## Dr. A 164.000   3.477     23         
## Dr. B 165.810   6.282     21         
## 
## 
## Inferential Results:
## 
## Estimate of mu1-mu2:  -1.81 
## SE(x1.bar - x2.bar):  1.551 
## 
## 95% Confidence Interval for mu1-mu2:
## 
##           lower.bound         upper.bound          
##           -4.974064           1.355016             
## 
## Test of Significance:
## 
##  H_0:  mu1-mu2 = 0 
##  H_a:  mu1-mu2 != 0 
## 
##  Test Statistic:     t = -1.167 
##  Degrees of Freedom:   30.58 
##  P-value:        P = 0.2523

Pruebas de hipótesis para \(\pi_1\) - \(\pi_2\).

Ejemplo

use los datos EPIDURAL para probar si la verdadera proporción de mujeres que se anestesian anestesia en la posición de estiramiento de los isquiotibiales es menor que la mujeres que tienen anestesia en la posición sentada tradicional.

harm=EPIDURAL %>% filter(treatment=="Hamstring Stretch")
n.harm=nrow(harm)
sit<- EPIDURAL %>% filter(treatment=="Traditional Sitting")
n.sit=nrow(sit)
prop.test(c(n.harm,n.sit),c(nrow(EPIDURAL),nrow(EPIDURAL)),alternative="l",
correct=TRUE)
## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c out of cn.harm out of nrow(EPIDURAL)n.sit out of nrow(EPIDURAL)
## X-squared = 4.6118, df = 1, p-value = 0.01588
## alternative hypothesis: less
## 95 percent confidence interval:
##  -1.00000000 -0.04053125
## sample estimates:
##    prop 1    prop 2 
## 0.4117647 0.5882353
proptestGC(x=c(n.harm, n.sit),n=c(nrow(EPIDURAL),nrow(EPIDURAL)),
           p=0,conf.level=0.95,graph=TRUE, alternative="less" )
## 
## 
## Inferential Procedures for the Difference of Two Proportions p1-p2:
##  Results taken from summary data.
## 
## 
## Descriptive Results:
## 
##         successes  n estimated.prop
## Group 1        35 85         0.4118
## Group 2        50 85         0.5882
## 
## 
## Inferential Results:
## 
## Estimate of p1-p2:    -0.1765 
## SE(p1.hat - p2.hat):  0.07549 
## 
## 95% Confidence Interval for p1-p2:
## 
##           lower.bound         upper.bound          
##           -1.000000           -0.052296            
## 
## Test of Significance:
## 
##  H_0:  p1-p2 = 0
##  H_a:  p1-p2 < 0
## 
##  Test Statistic:     z = -2.338 
##  P-value:        P = 0.009704