Pruebas de Hipótesis
Hipótesis estadísticas
Definición
Una hipótesis estadística \((H)\) es una proposición acerca de una característica de la población de estudio.
Por ejemplo: “la variable \(X\) toma valores en el intervalo \((a, b)\)”, “el valor de \(\theta\) es \(2^{\prime \prime}, \mid " l a\) distribución de \(X\) es normal”, etc.
Ejemplo
Una compañía recibe un gran cargamento de piezas. Sólo acepta el envío si no hay más de un \(5 \%\) de piezas defectuosas. ¿Cómo tomar una decisión sin verificar todas las piezas?
Se quiere saber si una propuesta de reforma tributaria es acogida de igual forma por hombres y mujeres. ¿Cómo se puede verificar esa conjetura?
- Se formula la hipótesis sobre la población.
- Las conclusiones sobre la validez de la hipótesis se basarán en la información de una muestra
Hipótesis nula y alternativa
- Llamamos hipótesis nula, y se representa por \(H_0\), a la hipótesis que se desea contrastar.
Es la hipótesis que se plantea en primer lugar y la hipótesis que mantendremos a no ser que los datos indiquen su falsedad.
Es una idea es similar a la presunción de inocencia en un juicio.
La hipótesis nula siempre contiene los signos “\(=\)”, “\(\geq\)” o “\(\leq\)”.
La hipótesis nula nunca se acepta, se rechaza o no se rechaza.
Llamamos hipótesis alternativa, y la representamos por \(H_1\), a la negación de la hipótesis nula.
- Es generalmente la hipótesis que se quiere verificar.
- La hipótesis alternativa nunca contiene los signos “\(=\)”, “\(\geq\)” o “\(\leq\)”.
- La hipótesis alternativa puede aceptarse o no aceptarse.
Ejemplo
En semestres pasados, el número medio de préstamos por semestre y por alumno en la biblioteca de la FULL ha sido de 4. Este semestre la biblioteca ha hecho una campaña de información y quiere saber el efecto que esta ha tenido entre los estudiantes. ¿Cuáles serían las hipótesis nula y alternativa en este caso?
Tipos de errores en un contraste de hipótesis
Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en probabilidades, siempre existe la posibilidad de llegar a una conclusión incorrecta. Cuando usted realiza una prueba de hipótesis, puede cometer dos tipos de error:
tipo I y
tipo II. Los riesgos de estos dos errores están inversamente relacionados y se determinan según el nivel de significancia y la potencia de la prueba. Por lo tanto, usted debe determinar qué error tiene consecuencias más graves para su situación antes de definir los riesgos.
Error de tipo I Si usted rechaza la hipótesis nula cuando es verdadera, comete un error de tipo I. La probabilidad de cometer un error de tipo I es \(\alpha\), que es el nivel de significancia que usted establece para su prueba de hipótesis. Un \(\alpha\) de 0.05 indica que usted está dispuesto a aceptar una probabilidad de \(5\%\) de estar equivocado al rechazar la hipótesis nula. Para reducir este riesgo, debe utilizar un valor menor para \(\alpha\). Sin embargo, usar un valor menor para alfa significa que usted tendrá menos probabilidad de detectar una diferencia si esta realmente existe.
Error de tipo II
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de cometer un error de tipo II es \(\beta\), que depende de la potencia de la prueba. Puede reducir el riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo suficientemente grande como para detectar una diferencia práctica cuando esta realmente exista.
La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a \(1–\beta\). Este valor es la potencia de la prueba.
library(PASWR2)
## Loading required package: lattice
## Loading required package: ggplot2
library(DT)
data("EPIDURAL")
::datatable(EPIDURAL) DT
plot(density(EPIDURAL$cm))
Pasos Pruebas de Hipótesis
- Paso 1: Hipótesis - Enuncie las hipótesis nula y alternativa.
- Paso 2: Estadística de prueba - Seleccione una estadística de prueba adecuada y su distribución muestral bajo la hipótesis nula.
- Paso 3: Calcular el valor p o region de rechazo
- Paso 4: Conclusión estadística
- Paso 5: Explicar la conclusión
Ejemplo
Los médicos quieren saber la altura media de las mujeres a las que se les aplica anestesia epidural en posición sentada tradicional. Sospechan que la altura media es superior a 163 cm.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
=EPIDURAL %>% filter(treatment=="Traditional Sitting")
alturaseda(alturas$cm)
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 50.000 0.000 152.000 160.000 165.300 164.000 165.065 170.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 185.000 6.905 47.684 0.977 10.000 33.000 -0.105 0.492
## SW p-val
## 0.230
Paso 1: \[ \begin{align} H_0 &: μ = 163\\ H_1 &: μ > 163. \end{align} \]
Paso 2: Test estadístico
\[\frac{\bar{X}-\mu_{0}}{S / \sqrt{n}} \sim t_{n-1}\]
calculamos el valor
=mean(alturas$cm)
xbarrra xbarrra
## [1] 165.3
=163
mu=sd(alturas$cm)
S S
## [1] 6.905337
=length(alturas$cm)
n n
## [1] 50
=(xbarrra- mu)/(S/sqrt(n))
T T
## [1] 2.355201
- Paso 3 Región de rechazo
La región de rechazo es \(t_{obs} > t_{0.05 , 49}\) = ?
qt(0.05/2, df=49, lower.tail = F)
## [1] 2.009575
pt(2.35, df=49, lower.tail = F)
## [1] 0.01142273
<-49
ngl<-seq(-4,4,length=5000)
xplot(x,dt(x,ngl), main=c("Densidad t-Student"),
sub=paste("gl=",ngl),
ylab="t-Student",type="l",col=3)
#Sombrear área for para valores mayores o iguales a 1
<- 1.67
value =x[x >= value]
x1=dt(x1,ngl)
y1polygon(c(x1, value),c(y1,0),
col = "slateblue1",
border = 1)
text(1.7, 0.17, "1.67", col = "darkred")
abline(v = 1.67, col="green")
- Paso 4: Conclusión estadística - El valor P es
\(P(t49 ≥ 2,36) = 0,01\).
- I. De la región de rechazo, rechazar \(H_0\) porque t_\(obs\) = 2,36 es mayor que 1,68.
- A partir del valor p, rechazar \(H_0\) porque el valor p = 0,01 es menor que 0.05. Rechace H0.
- Paso 5: Explique la conclusión - Hay pruebas que sugieren que la altura media de las mujeres en posición sentada es superior a 163 cm.
library(tigerstats)
ttestGC(~cm,data=alturas, mu=163,
alternative="greater",graph=TRUE)
##
##
## Inferential Procedures for One Mean mu:
##
##
## Descriptive Results:
##
## variable mean sd n
## cm 165.300 6.905 50
##
##
## Inferential Results:
##
## Estimate of mu: 165.3
## SE(x.bar): 0.9766
##
## 95% Confidence Interval for mu:
##
## lower.bound upper.bound
## 163.662744 Inf
##
## Test of Significance:
##
## H_0: mu = 163
## H_a: mu > 163
##
## Test Statistic: t = 2.355
## Degrees of Freedom: 49
## P-value: P = 0.01128
Prueba de diferencia de medias.
Resumen para la prueba de diferencias de medias cuando se toman muestras independientes de distribuciones normales con varianzas desconocidas y desiguales - Hipótesis Nula \[H_{0}: \mu_{X}-\mu_{Y}=0\]
- Estadístico \[ t_{\mathrm{obs}}=\frac{\bar{X}-\bar{Y}-0}{\sqrt{\frac{s_{X}^{2}}{n_{X}}+\frac{s_{Y}^{2}}{n_{Y}}}}\]
Ejemplo: EPIDURAL
Con el conjunto de datos EPIDURAL, realice una prueba de significación para ver si la altura media de las mujeres atendidas por el Dr.A es igual a la altura media de mujeres atendidas por el Dr. B a un nivel de significación = 0,05, donde ahora las varianzas son desconocidas pero desiguales.
library(ggplot2)
ggplot(EPIDURAL, aes(x=doctor, y=cm, color=doctor))+
geom_boxplot()
= EPIDURAL %>% filter(doctor=="Dr. A")
cm.A <-EPIDURAL %>% filter(doctor=="Dr. C")
cm.C
cm.C
## doctor kg cm ease treatment oc complications
## 1 Dr. C 86 176 Easy Hamstring Stretch 0 None
## 2 Dr. C 91 175 Easy Hamstring Stretch 1 None
## 3 Dr. C 65 155 Easy Traditional Sitting 2 None
## 4 Dr. C 91 163 Difficult Hamstring Stretch 2 Paresthesia
## 5 Dr. C 48 152 Easy Hamstring Stretch 0 None
## 6 Dr. C 85 168 Easy Hamstring Stretch 2 Paresthesia
## 7 Dr. C 80 173 Easy Hamstring Stretch 0 None
## 8 Dr. C 83 168 Easy Traditional Sitting 1 None
## 9 Dr. C 71 152 Easy Traditional Sitting 4 None
## 10 Dr. C 59 168 Easy Traditional Sitting 0 None
## 11 Dr. C 75 173 Easy Traditional Sitting NA Failure - person got dizzy
## 12 Dr. C 90 168 Difficult Hamstring Stretch 0 Paresthesia
## 13 Dr. C 95 170 Difficult Hamstring Stretch 10 Failure - too many OCs
## 14 Dr. C 94 185 Easy Traditional Sitting 0 None
## 15 Dr. C 85 163 Easy Hamstring Stretch 0 None
## 16 Dr. C 74 168 Easy Traditional Sitting 0 None
## 17 Dr. C 92 163 Easy Traditional Sitting 1 None
## 18 Dr. C 84 160 Easy Hamstring Stretch 0 None
## 19 Dr. C 77 157 Easy Traditional Sitting 0 None
## 20 Dr. C 57 160 Easy Hamstring Stretch 3 None
## 21 Dr. C 96 180 Easy Traditional Sitting 0 None
t.test(cm.A$cm, cm.C$cm, alternative="two.sided")
##
## Welch Two Sample t-test
##
## data: cm.A$cm and cm.C$cm
## t = -1.2259, df = 25.598, p-value = 0.2314
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -6.758720 1.711101
## sample estimates:
## mean of x mean of y
## 164.0000 166.5238
= EPIDURAL %>% filter(doctor=="Dr. A" | doctor=="Dr. C")
Doctors Doctors
## doctor kg cm ease treatment oc complications
## 1 Dr. C 86 176 Easy Hamstring Stretch 0 None
## 2 Dr. C 91 175 Easy Hamstring Stretch 1 None
## 3 Dr. A 67 167 Easy Traditional Sitting 6 None
## 4 Dr. C 65 155 Easy Traditional Sitting 2 None
## 5 Dr. C 91 163 Difficult Hamstring Stretch 2 Paresthesia
## 6 Dr. C 48 152 Easy Hamstring Stretch 0 None
## 7 Dr. C 85 168 Easy Hamstring Stretch 2 Paresthesia
## 8 Dr. C 80 173 Easy Hamstring Stretch 0 None
## 9 Dr. A 57 165 Easy Hamstring Stretch 1 None
## 10 Dr. A 105 165 Difficult Hamstring Stretch 10 Failure - too many OCs
## 11 Dr. C 83 168 Easy Traditional Sitting 1 None
## 12 Dr. C 71 152 Easy Traditional Sitting 4 None
## 13 Dr. A 83 170 Easy Traditional Sitting 1 None
## 14 Dr. C 59 168 Easy Traditional Sitting 0 None
## 15 Dr. C 75 173 Easy Traditional Sitting NA Failure - person got dizzy
## 16 Dr. A 61 163 Easy Traditional Sitting 1 None
## 17 Dr. A 106 165 Easy Traditional Sitting 2 None
## 18 Dr. A 81 163 Easy Traditional Sitting 1 None
## 19 Dr. A 103 161 Easy Hamstring Stretch 1 None
## 20 Dr. A 142 170 Impossible Traditional Sitting 1 None
## 21 Dr. A 67 160 Easy Traditional Sitting 1 None
## 22 Dr. C 90 168 Difficult Hamstring Stretch 0 Paresthesia
## 23 Dr. A 71 163 Easy Traditional Sitting 1 None
## 24 Dr. A 66 160 Easy Hamstring Stretch 1 None
## 25 Dr. C 95 170 Difficult Hamstring Stretch 10 Failure - too many OCs
## 26 Dr. A 70 165 Easy Hamstring Stretch 4 None
## 27 Dr. C 94 185 Easy Traditional Sitting 0 None
## 28 Dr. C 85 163 Easy Hamstring Stretch 0 None
## 29 Dr. A 90 163 Easy Traditional Sitting 0 None
## 30 Dr. A 84 164 Difficult Traditional Sitting 1 None
## 31 Dr. C 74 168 Easy Traditional Sitting 0 None
## 32 Dr. C 92 163 Easy Traditional Sitting 1 None
## 33 Dr. A 80 157 Difficult Traditional Sitting 5 None
## 34 Dr. C 84 160 Easy Hamstring Stretch 0 None
## 35 Dr. A 63 163 Easy Traditional Sitting 0 None
## 36 Dr. A 85 165 Easy Hamstring Stretch 0 None
## 37 Dr. A 79 168 Easy Hamstring Stretch 0 None
## 38 Dr. A 79 160 Easy Traditional Sitting 3 None
## 39 Dr. C 77 157 Easy Traditional Sitting 0 None
## 40 Dr. C 57 160 Easy Hamstring Stretch 3 None
## 41 Dr. C 96 180 Easy Traditional Sitting 0 None
## 42 Dr. A 103 170 Easy Traditional Sitting 1 None
## 43 Dr. A 72 160 Easy Traditional Sitting 0 None
## 44 Dr. A 94 165 Easy Hamstring Stretch 0 None
ttestGC(cm~doctor,data=Doctors,
mu=0,first="Dr. A", graph = T)
##
##
## Inferential Procedures for the Difference of Two Means mu1-mu2:
## (Welch's Approximation Used for Degrees of Freedom)
## cm grouped by doctor
##
##
## Descriptive Results:
##
## group mean sd n
## Dr. A 164.000 3.477 23
## Dr. C 166.524 8.830 21
##
##
## Inferential Results:
##
## Estimate of mu1-mu2: -2.524
## SE(x1.bar - x2.bar): 2.059
##
## 95% Confidence Interval for mu1-mu2:
##
## lower.bound upper.bound
## -6.758707 1.711088
##
## Test of Significance:
##
## H_0: mu1-mu2 = 0
## H_a: mu1-mu2 != 0
##
## Test Statistic: t = -1.226
## Degrees of Freedom: 25.6
## P-value: P = 0.2314
Pruebas de hipótesis para \(\pi_1\) - \(\pi_2\).
Ejemplo
use los datos EPIDURAL para probar si la verdadera proporción de mujeres que se anestesian anestesia en la posición de estiramiento de los isquiotibiales es menor que la mujeres que tienen anestesia en la posición sentada tradicional.
=EPIDURAL %>% filter(treatment=="Hamstring Stretch")
harm=nrow(harm)
n.harm<- EPIDURAL %>% filter(treatment=="Traditional Sitting")
sit=nrow(sit) n.sit
prop.test(c(n.harm,n.sit),c(nrow(EPIDURAL),nrow(EPIDURAL)),alternative="l",
correct=TRUE)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c out of cn.harm out of nrow(EPIDURAL)n.sit out of nrow(EPIDURAL)
## X-squared = 4.6118, df = 1, p-value = 0.01588
## alternative hypothesis: less
## 95 percent confidence interval:
## -1.00000000 -0.04053125
## sample estimates:
## prop 1 prop 2
## 0.4117647 0.5882353
proptestGC(x=c(n.harm, n.sit),n=c(nrow(EPIDURAL),nrow(EPIDURAL)),
p=0,conf.level=0.95,graph=TRUE, alternative="less" )
##
##
## Inferential Procedures for the Difference of Two Proportions p1-p2:
## Results taken from summary data.
##
##
## Descriptive Results:
##
## successes n estimated.prop
## Group 1 35 85 0.4118
## Group 2 50 85 0.5882
##
##
## Inferential Results:
##
## Estimate of p1-p2: -0.1765
## SE(p1.hat - p2.hat): 0.07549
##
## 95% Confidence Interval for p1-p2:
##
## lower.bound upper.bound
## -1.000000 -0.052296
##
## Test of Significance:
##
## H_0: p1-p2 = 0
## H_a: p1-p2 < 0
##
## Test Statistic: z = -2.338
## P-value: P = 0.009704