Prueba de hipótesis

En el campo de la investigación, por lo general los procesos de toma de decisiones comienzan con la identificación de un problema de interés, siguen con el planteo de dos hipótesis que postulan puntos de vista opuestos y, con base a información empírica se concluye con el rechazo de una de ellas y el sostenimiento de la otra

En Estadística las dos hipótesis mutuamente excluyentes reciben el nombre de hipótesis nula e hipótesis alternativa, y se expresan en forma simbólica. Un ejemplo de esto último puede ser, respectivamente: \[\begin{align*} H_0: \mu_1 = \mu_2 \end{align*}\]
\[\begin{align} H_a: \mu_1 \neq \mu_2\end{align}\]

En el campo científico los investigadores partirán del enunciado de una hipótesis en términos del problema de interés, que es la hipótesis de investigación, hipótesis científica o hipótesis de trabajo y que, por lo general, coincide con la hipótesis estadística alternativa. Para la toma de decisión en una prueba de hipótesis existen dos alternativas muy utilizadas, a saber:

  • uno tradicional que se basa en utilizar el denominado valor crítico del estadígrafo de la prueba de hipótesis de acuerdo a su distribución de probabilidades en el muestreo
  • uno más moderno que ha cobrado popularidad a través de los software estadísticos que emplea el valor p, que se refiere a la probabilidad condicional de que el valor tomado por el estadígrafo muestral se deba al azar

Elementos de la prueba de hipótesis

  • Una hipótesis es una aseveración o conjetura con respecto a un problema de interés.

  • Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones. En el análisis estadístico es usual el planteo de un par de hipótesis: la hipótesis nula y la hipótesis alternativa. Las hipótesis estadísticas se plantean formalmente en notación simbólica.

  • La hipótesis estadística nula, simbolizada como Ho , es la hipótesis que se somete a prueba. Por lo general, es una afirmación acerca de que un parámetro poblacional tiene un valor específico (o bien no se diferencia de un valor referencial).

  • La hipótesis estadística alternativa, simbolizada como H1 , es una afirmación sobre el mismo parámetro poblacional considerado en la hipótesis nula, que especifica que el mismo tiene un valor diferente, de alguna manera, al postulado en la hipótesis nula.

Una prueba de hipótesis es un proceso que permite tomar una decisión entre dos hipótesis opuestas: Ho y H1 . Estas hipótesis se plantean de modo que una es la negación de la otra (de esta forma una de ellas siempre resulta verdadera y la otra siempre es falsa). En la práctica la hipótesis nula, Ho , se somete a prueba esperando poder demostrar que su ocurrencia es muy improbable, lo cual implicará que la otra hipótesis, H1 , es probablemente la verdadera.

Resultados posibles en una prueba de hipótesis
Resultados posibles en una prueba de hipótesis
  • Una decisión correcta de tipo A ocurre cuando la hipótesis nula es verdadera y se decide a su favor.

  • Una decisión correcta de tipo B ocurre cuando la hipótesis nula es falsa y la decisión es en oposición a la hipótesis nula.

  • Al rechazo de la hipótesis nula cuando es verdadera se lo denomina error de tipo I

  • Al no rechazo de la hipótesis nula cuando esta es falsa se lo denomina error de tipo II

Probabilidades asignadas a los errores tipo I y II
Probabilidades asignadas a los errores tipo I y II

Por convención, los valores de probabilidad de mayor uso para \(\alpha\) y \(\beta\) son 0.01 y 0.05.

Prueba de hipótesis para una media poblacional (Caso Muestra Grande)

Ejemplo 1 Una planta química local ha producido un promedio diario de 880 toneladas de un producto químico durante los últimos años. A la gerente de control de calidad le gustaría saber si este promedio ha cambiado en los meses recientes. Selecciona al azar 50 días de la base de datos y calcula el promedio y desviación estándar de los n=50 producciones con \(\overline{x}\)= 871 t y s=21t, respectivamente. Pruebe la hipótesis apropiada con \(\alpha\)=0.05.

  1. Hipótesis estadísticas:
    H0:\(\mu\)=880
    H1:\(\mu\) \(\neq\) 880

  2. nivel de significancia: \(\alpha\)=0.05

  3. Estadígrafo de prueba: La estimación puntual para \(\mu\) es \(\overline{x}\). Entonces: \[\begin{equation} Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) \end{equation}\]

Como se desconoce la varianza poblacional, la desviación estándar poblacional se estima con la desviación estándar muestral con buena aproximación ya que n>30.
4. Regla de la decisión Valor crítico de Z
Si \(\alpha\)=0.05 , entonces \(\alpha/2\) va a ser 0.025. Tengo que calcular los valores de Z para que \(\alpha\)=0.05
Para dicho cálculo usamos la función qnorm
r qnorm(0.025,0,1)
## [1] -1.959964
Z0.025=-1.96 y Z0.0975=1.96 Se rechaza la hipótesis nula si Z0.025<Z<Z0.0975
_________________________________________________ Recuerde que
Nivel de confianza | \(\alpha\) | \(\alpha/2\) | \(z_{\alpha/2}\) ——————– | ———-|————|—————- 90% | 0.1 | 0.05 | 1.645 95% | 0.5 | 0.025 | 1.960 99% | 0.01 | 0.005 | 2.576
5. Cálculo de Z Al usar S para aproximar \(\sigma\), se obtiene al estadígrafo
\[\begin{equation} \frac{\overline{X}-\mu}{S/\sqrt{n}}=\frac{871-880}{21/\sqrt{50}}={-3.03}\end{equation}\]
  1. Decisión
    Para \(\alpha\)=0.05, la región de rechazo se compone de los valores de z>1.96 y z<-1.96. Como el valor muestral calculado con el estadígrafo de prueba z, es igual a –3.03, este valor cae en la región de rechazo, por lo que se rechaza la hipótesis nula de igualdad de la media a un valor determinado.

  1. Conclusión La muestra aporta evidencia suficiente, para un nivel de significancia de 0,05, para decir que el promedio de producción para un producto químico es distinto a 880 toneladas. Se puede decir, con un nivel de significancia de 0,05, que la producción del producto químico ha cambiado.

Ahora calculamos el valor p, es decir la probabilidad asociada al estadígrafo Z

## [1] 0.002441492

Para realizar el cálculo con R utilizamos la misma función que para los intervalos de confianza

library(BSDA)
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
zsum.test(mean.x=871,sigma.x=21, n.x=50,mu= 880, conf.level=0.95,alternative = "two.sided")
## 
##  One-sample z-Test
## 
## data:  Summarized x
## z = -3.0305, p-value = 0.002442
## alternative hypothesis: true mean is not equal to 880
## 95 percent confidence interval:
##  865.1792 876.8208
## sample estimates:
## mean of x 
##       871

Prueba de hipótesis con muestra pequeña y varianza poblacional desconocida

Ejemplo 2 Un nuevo proceso para producir diamantes sintéticos sólo puede funcionar a un nivel rentable si el peso promedio de los diamantes que se obtengan es mayor que 0,5 quilates. Para evaluar la rentabilidad del proceso se generan seis diamantes cuyos pesos son 0,46; 0,61; 0,52; 0,48; 0,57 y 0,54 quilates. ¿Las seis mediciones proporcionan suficiente evidencia de que el peso promedio de los diamantes que se obtienen con este proceso sobrepasa los 0,5 quilates?

  1. Hipótesis estadísticas:
    H0:\(\mu\)=0.5
    H1:\(\mu\)>0.5

  2. Nivel de significancia: \(\alpha\)=0.05

  3. Estadígrafo de prueba: Se supone que la población de la cual provienen los pesos de los diamantes sigue una distribución normal y se desconoce la desviación estándar poblacional. Entonces:

\[\begin{equation} T=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim t(n-1) \end{equation}\] 

Donde n-1 = 5 grados de libertad

  1. Regla de la decisión
    Valor crítico de T

Recordemos que la pregunta es sobre el peso promedio de los diamantes que sobrepasan los 0,5 quilates. En este caso no hay que dividir \(\alpha\) por 2, dado que nos pregunta por los valores mayores a 0.5 quintales. La hipotesis alternativa para este caso es H1:\(\mu\) \(\neq\) >0.5.Totalmente diferente fue el ejemplo 1 en el cual la hipotesis alternativa era H1:\(\mu\) \(\neq\) 880

Prueba de hipótesis de una y dos colas
Prueba de hipótesis de una y dos colas

Para calcular el valor de T utilizo la funcion qt

qt(0.05,5,lower.tail = FALSE) 
## [1] 2.015048

El valor crítico de T es 2.015

  1. Cálculos

El estadígrafo de prueba es un un estadístico t con (n-1) grados de libertad (6-1) = 5 grados de libertad. Calculas la media y la desviación estándar de los 6 pesos del diamante.

a<-c(0.46,0.61,0.52,0.48,0.57,0.54)

mean(a)
## [1] 0.53
sd(a)
## [1] 0.05585696

La media y la desviación estándar son 0.53 y 0.0559 respectivamente El valor calculado del estadístico de prueba es entonces:

\[\begin{equation} T=\frac{0.53-0.5}{0.0559/\sqrt{6}}={1.32}\end{equation}\] 

  1. Decisión

Bajo un nivel de significancia del 5% no se rechaza la hipótesis nula por se t=1.32<t~2.015

  1. Conclusión

La muestra no aporta evidencia suficiente, con un nivel de significancia de 0.05, para decir que el peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0.05 quilates.

Ahora resolvemos la prueba de hipótesis por el método del p-valor

T<-1.3156
pvalor<-pt( T,5,lower.tail = FALSE)
pvalor
## [1] 0.1227005

como el p-valor es mayor a 0.05 no rechazamos la hipótesis nula

Ahora resolveremos el mismo ejercicio usando la función de tsum.test

La función tsum.test tiene diversos usos según como la usemos. Podemo usarla para conocer si la media cambió de valor como en el caso que sigue a continuación

a<-c(0.46,0.61,0.52,0.48,0.57,0.54)

library(BSDA)
tsum.test(mean.x=mean(a),s.x=sd(a),n.x=6,mu=0.5,conf.level=0.95, alternative="greater")
## 
##  One-sample t-Test
## 
## data:  Summarized x
## t = 1.3156, df = 5, p-value = 0.1227
## alternative hypothesis: true mean is greater than 0.5
## 95 percent confidence interval:
##  0.4840498        NA
## sample estimates:
## mean of x 
##      0.53

Prueba de hipótesis para la diferencia de dos medias con muestra pequeña y varianza poblacional desconocida

También podemos usar la función t.sum.test para comparar las medias de dos muestras distintas supongamos que estamos probando dos tipos de maceraciones distintas (frio y carbónica) con tres repeticiones. A cada uno de los tanques le medimos el IPT

##     metodos   IPT
## 1      frio 60.56
## 2      frio 62.76
## 3      frio 63.43
## 4 carbonica 56.65
## 5 carbonica 58.34
## 6 carbonica 56.98

Queremos saber si la maceración por frío tuvo mayor IPT que la maceración carbónica Para ello utilizamos el t.test

frio<-c(60.56,62.76, 63.43)
carb<-c(56.65   ,58.34,56.98)

library(BSDA)
tsum.test(mean.x=mean(frio), s.x = sd(frio), n.x = 3, mean.y = mean(carb), s.y = sd(carb),
  n.y = 3, var.equal = TRUE,
  conf.level = 0.95, alternative="greater")
## 
##  Standard Two-Sample t-Test
## 
## data:  Summarized x and y
## t = 4.8807, df = 4, p-value = 0.004078
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  2.774756       NA
## sample estimates:
## mean of x mean of y 
##  62.25000  57.32333

Un departamento de inspección de cauces realizó un estudio para determinar si la concentración de microorganismos, en dos estaciones colectoras de un río, es significativamente diferente. Se supone que la densidad de microorganismos de ambas estaciones tiene distribución normal y las varianzas son iguales. Los resultados fueron los siguientes:

Número de microorganismos por metro cuadrado

Estación 1 Estación 2
5030 2800
13700 4670
10730 6890
11400 7720
860 7030
2200 7330
4250 2810
15040 1330
4980 3320
11900 1230
8130 2130
26850 2190
17660
22800
1130
1690

Ejercicio 3 Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con el propósito de reducir el mismo a menos de 3000 motores por día. Se llevó a cabo un muestreo del inventario en reserva al final de cada uno de ocho días, seleccionados aleatoriamente; los resultados se muestran en la siguiente tabla. ¿Con los datos hay evidencia suficiente que señale que el promedio del número diario de motores en el inventario es menor que 3000?

N° de motores

2905
2895
2725
3005
2835
2835
3065
2605

Prueba de hipótesis para una proporción

Ejemplo 3.
Según información reciente, la obesidad es un problema creciente en el país en grupos de todas las edades. En el año 2002 se reportó que 1276 de una muestra de 4115 adultos fueron encontrados obesos (índice corporal mayor a 30). Una encuesta realizada 4 años antes reveló que el 30% de los adultos encuestados se consideraron obesos. ¿Sugieren los datos más recientes que la proporción verdadera de adultos obesos es más de 1.5 veces el porcentaje de la encuesta? Tome en cuenta un nivel de significancia de 0.10.

Recuerde que:

\(\hat{\pi}=\frac{X}{C}\)

\(\mu_{\boldsymbol{\hat{\pi}}}\)=\(\pi\)
\(\sigma_{\boldsymbol{\hat{\pi}}}\)=\(\sqrt{\frac{\pi(1-\pi)}{c}}\)

  1. Hipótesis estadísticas:
    H0:\(\pi\)=0.30
    H1:\(\pi\) \(\neq\) >0.3

  2. Nivel de significancia: \(\alpha\)=0.10

  3. Estadígrafo de prueba

z=\(\frac{\hat{\pi}-{\pi}}{\sqrt{{\pi}{(1-\pi)}/c}}\)

  1. Regla de decisión. Se rechaza la hipótesis nula si z > 1.28
qnorm(0.1,0,1,lower.tail=FALSE)
## [1] 1.281552

  1. Cálculos

\(\hat{\pi}=\frac{1276}{4115}\)

z=\(\frac{0.31-{0.3}}{\sqrt{{(0.3)}{(0.7)}/4115}}=1.4\)

  1. Decisión

Como z =1,40 es mayor a 1,28 se rechaza la hipótesis nula.

  1. Conclusión

Los datos muestrales aportan evidencia suficiente, a un nivel de significancia de 0.10, para decir que la proporción de obesos adultos que resultó en el informe es mayor al 30%, es decir que ha aumentado más de 1.5 veces la proporción con respecto a los encuestados 4 años antes.

prop.test(1276, 4115,p=0.3,alternative="greater",conf.level=0.9,correct=F)
## 
##  1-sample proportions test without continuity correction
## 
## data:  1276 out of 4115, null probability 0.3
## X-squared = 1.993, df = 1, p-value = 0.07901
## alternative hypothesis: true p is greater than 0.3
## 90 percent confidence interval:
##  0.300922 1.000000
## sample estimates:
##         p 
## 0.3100851

Prueba de hipótesis para la diferencia de dos proporciones

Dos grupos de 200 cerdos cada uno afectados por una enfermedad (A y B), son usados para probar la eficacia de un nuevo tratamiento sobre la base de un suero. Ambos grupos son tratados idénticamente, excepto que al grupo A se le da el suero y al B no. Se encuentra que 140 y 120 de los enfermos del grupo A y B, respectivamente, se recuperan de la enfermedad. ¿Puede concluirse que el nuevo tratamiento ayuda a curar la enfermedad a un nivel de significancia de 0,01?

prop.test(x=c(140,120), n=c(200, 200),alternative="two.sided", conf.level=0.99,correct=F)
## 
##  2-sample test for equality of proportions without continuity correction
## 
## data:  c(140, 120) out of c(200, 200)
## X-squared = 4.3956, df = 1, p-value = 0.03603
## alternative hypothesis: two.sided
## 99 percent confidence interval:
##  -0.02218231  0.22218231
## sample estimates:
## prop 1 prop 2 
##    0.7    0.6

Ejercicio 4

La duración media de una muestra de 100 tubos fluorescentes producidos poruna compañía resulta ser 1500 horas, con una desviación típica poblacional de 120 horas. Si \(\mu\) es la duración media de todos los tubos producidos por la compañía, comprobar la hipótesis \(\mu=1600\) horas contra la hipótesis altemativa \(\mu\neq1600\) horas con un nivel de significación de 0.05 y 0.01.

Ejercicio 5

La resistencia a la rotura de los cables producidos por un fabricante tienen una media de 1800 libras y una desviación típica de 100 libras. Mediante una nueva técnica en el proceso de fa- bricación se aspira a que esta resistencia pueda ser incrementada. Para ensayar esta aspiración, se ensaya una muestra de 50 cables y se encuentra que su resistencia media es de 1850 libras. ¿Puede mantenerse que, en efecto, hay un aumento de resistencia al nivel de significación del 0.01?