En el campo de la investigación, por lo general los procesos de toma de decisiones comienzan con la identificación de un problema de interés, siguen con el planteo de dos hipótesis que postulan puntos de vista opuestos y, con base a información empírica se concluye con el rechazo de una de ellas y el sostenimiento de la otra
En Estadística las dos hipótesis mutuamente excluyentes reciben el
nombre de hipótesis nula e hipótesis
alternativa, y se expresan en forma simbólica. Un ejemplo de
esto último puede ser, respectivamente: \[\begin{align*} H_0: \mu_1 = \mu_2
\end{align*}\]
\[\begin{align} H_a: \mu_1 \neq
\mu_2\end{align}\]
En el campo científico los investigadores partirán del enunciado de una hipótesis en términos del problema de interés, que es la hipótesis de investigación, hipótesis científica o hipótesis de trabajo y que, por lo general, coincide con la hipótesis estadística alternativa. Para la toma de decisión en una prueba de hipótesis existen dos alternativas muy utilizadas, a saber:
Una hipótesis es una aseveración o conjetura con respecto a un problema de interés.
Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones. En el análisis estadístico es usual el planteo de un par de hipótesis: la hipótesis nula y la hipótesis alternativa. Las hipótesis estadísticas se plantean formalmente en notación simbólica.
La hipótesis estadística nula, simbolizada como Ho , es la hipótesis que se somete a prueba. Por lo general, es una afirmación acerca de que un parámetro poblacional tiene un valor específico (o bien no se diferencia de un valor referencial).
La hipótesis estadística alternativa, simbolizada como H1 , es una afirmación sobre el mismo parámetro poblacional considerado en la hipótesis nula, que especifica que el mismo tiene un valor diferente, de alguna manera, al postulado en la hipótesis nula.
Una prueba de hipótesis es un proceso que permite tomar una decisión entre dos hipótesis opuestas: Ho y H1 . Estas hipótesis se plantean de modo que una es la negación de la otra (de esta forma una de ellas siempre resulta verdadera y la otra siempre es falsa). En la práctica la hipótesis nula, Ho , se somete a prueba esperando poder demostrar que su ocurrencia es muy improbable, lo cual implicará que la otra hipótesis, H1 , es probablemente la verdadera.
Una decisión correcta de tipo A ocurre cuando la hipótesis nula es verdadera y se decide a su favor.
Una decisión correcta de tipo B ocurre cuando la hipótesis nula es falsa y la decisión es en oposición a la hipótesis nula.
Al rechazo de la hipótesis nula cuando es verdadera se lo denomina error de tipo I
Al no rechazo de la hipótesis nula cuando esta es falsa se lo denomina error de tipo II
Por convención, los valores de probabilidad de mayor uso para \(\alpha\) y \(\beta\) son 0.01 y 0.05.
Ejemplo 1 Una planta química local ha producido un promedio diario de 880 toneladas de un producto químico durante los últimos años. A la gerente de control de calidad le gustaría saber si este promedio ha cambiado en los meses recientes. Selecciona al azar 50 días de la base de datos y calcula el promedio y desviación estándar de los n=50 producciones con \(\overline{x}\)= 871 t y s=21t, respectivamente. Pruebe la hipótesis apropiada con \(\alpha\)=0.05.
Hipótesis estadísticas:
H0:\(\mu\)=880
H1:\(\mu\) \(\neq\) 880
nivel de significancia: \(\alpha\)=0.05
Estadígrafo de prueba: La estimación puntual para \(\mu\) es \(\overline{x}\). Entonces: \[\begin{equation}
Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)
\end{equation}\]
Como se desconoce la varianza poblacional, la desviación estándar poblacional se estima con la desviación estándar muestral con buena aproximación ya que n>30. |
4. Regla de la decisión Valor crítico de Z |
Si \(\alpha\)=0.05 , entonces \(\alpha/2\) va a ser 0.025. Tengo que calcular los valores de Z para que \(\alpha\)=0.05 |
Para dicho cálculo usamos la función qnorm |
r qnorm(0.025,0,1) |
## [1] -1.959964 |
Z0.025=-1.96 y Z0.0975=1.96 Se rechaza la hipótesis nula si Z0.025<Z<Z0.0975 |
_________________________________________________ Recuerde que |
Nivel de confianza | \(\alpha\) | \(\alpha/2\) | \(z_{\alpha/2}\) ——————– | ———-|————|—————- 90% | 0.1 | 0.05 | 1.645 95% | 0.5 | 0.025 | 1.960 99% | 0.01 | 0.005 | 2.576 |
5. Cálculo de Z Al usar S para aproximar \(\sigma\), se obtiene al estadígrafo |
\[\begin{equation}
\frac{\overline{X}-\mu}{S/\sqrt{n}}=\frac{871-880}{21/\sqrt{50}}={-3.03}\end{equation}\] |
Ahora calculamos el valor p, es decir la probabilidad asociada al estadígrafo Z
## [1] 0.002441492
Para realizar el cálculo con R utilizamos la misma función que para los intervalos de confianza
library(BSDA)
## Loading required package: lattice
##
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
##
## Orange
zsum.test(mean.x=871,sigma.x=21, n.x=50,mu= 880, conf.level=0.95,alternative = "two.sided")
##
## One-sample z-Test
##
## data: Summarized x
## z = -3.0305, p-value = 0.002442
## alternative hypothesis: true mean is not equal to 880
## 95 percent confidence interval:
## 865.1792 876.8208
## sample estimates:
## mean of x
## 871
Ejemplo 2 Un nuevo proceso para producir diamantes sintéticos sólo puede funcionar a un nivel rentable si el peso promedio de los diamantes que se obtengan es mayor que 0,5 quilates. Para evaluar la rentabilidad del proceso se generan seis diamantes cuyos pesos son 0,46; 0,61; 0,52; 0,48; 0,57 y 0,54 quilates. ¿Las seis mediciones proporcionan suficiente evidencia de que el peso promedio de los diamantes que se obtienen con este proceso sobrepasa los 0,5 quilates?
Hipótesis estadísticas:
H0:\(\mu\)=0.5
H1:\(\mu\)>0.5
Nivel de significancia: \(\alpha\)=0.05
Estadígrafo de prueba: Se supone que la población de la cual provienen los pesos de los diamantes sigue una distribución normal y se desconoce la desviación estándar poblacional. Entonces:
\[\begin{equation} T=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim t(n-1) \end{equation}\]
Donde n-1 = 5 grados de libertad
Recordemos que la pregunta es sobre el peso promedio de los diamantes que sobrepasan los 0,5 quilates. En este caso no hay que dividir \(\alpha\) por 2, dado que nos pregunta por los valores mayores a 0.5 quintales. La hipotesis alternativa para este caso es H1:\(\mu\) \(\neq\) >0.5.Totalmente diferente fue el ejemplo 1 en el cual la hipotesis alternativa era H1:\(\mu\) \(\neq\) 880
Para calcular el valor de T utilizo la funcion qt
qt(0.05,5,lower.tail = FALSE)
## [1] 2.015048
El valor crítico de T es 2.015
El estadígrafo de prueba es un un estadístico t con (n-1) grados de libertad (6-1) = 5 grados de libertad. Calculas la media y la desviación estándar de los 6 pesos del diamante.
a<-c(0.46,0.61,0.52,0.48,0.57,0.54)
mean(a)
## [1] 0.53
sd(a)
## [1] 0.05585696
La media y la desviación estándar son 0.53 y 0.0559 respectivamente El valor calculado del estadístico de prueba es entonces:
\[\begin{equation} T=\frac{0.53-0.5}{0.0559/\sqrt{6}}={1.32}\end{equation}\]
Bajo un nivel de significancia del 5% no se rechaza la hipótesis nula por se t=1.32<t~2.015
La muestra no aporta evidencia suficiente, con un nivel de significancia de 0.05, para decir que el peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0.05 quilates.
Ahora resolvemos la prueba de hipótesis por el método del p-valor
T<-1.3156
pvalor<-pt( T,5,lower.tail = FALSE)
pvalor
## [1] 0.1227005
como el p-valor es mayor a 0.05 no rechazamos la hipótesis nula
Ahora resolveremos el mismo ejercicio usando la función de tsum.test
La función tsum.test tiene diversos usos según como la usemos. Podemo usarla para conocer si la media cambió de valor como en el caso que sigue a continuación
a<-c(0.46,0.61,0.52,0.48,0.57,0.54)
library(BSDA)
tsum.test(mean.x=mean(a),s.x=sd(a),n.x=6,mu=0.5,conf.level=0.95, alternative="greater")
##
## One-sample t-Test
##
## data: Summarized x
## t = 1.3156, df = 5, p-value = 0.1227
## alternative hypothesis: true mean is greater than 0.5
## 95 percent confidence interval:
## 0.4840498 NA
## sample estimates:
## mean of x
## 0.53
También podemos usar la función t.sum.test para comparar las medias de dos muestras distintas supongamos que estamos probando dos tipos de maceraciones distintas (frio y carbónica) con tres repeticiones. A cada uno de los tanques le medimos el IPT
## metodos IPT
## 1 frio 60.56
## 2 frio 62.76
## 3 frio 63.43
## 4 carbonica 56.65
## 5 carbonica 58.34
## 6 carbonica 56.98
Queremos saber si la maceración por frío tuvo mayor IPT que la maceración carbónica Para ello utilizamos el t.test
frio<-c(60.56,62.76, 63.43)
carb<-c(56.65 ,58.34,56.98)
library(BSDA)
tsum.test(mean.x=mean(frio), s.x = sd(frio), n.x = 3, mean.y = mean(carb), s.y = sd(carb),
n.y = 3, var.equal = TRUE,
conf.level = 0.95, alternative="greater")
##
## Standard Two-Sample t-Test
##
## data: Summarized x and y
## t = 4.8807, df = 4, p-value = 0.004078
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## 2.774756 NA
## sample estimates:
## mean of x mean of y
## 62.25000 57.32333
Un departamento de inspección de cauces realizó un estudio para determinar si la concentración de microorganismos, en dos estaciones colectoras de un río, es significativamente diferente. Se supone que la densidad de microorganismos de ambas estaciones tiene distribución normal y las varianzas son iguales. Los resultados fueron los siguientes:
Número de microorganismos por metro cuadrado
Estación 1 | Estación 2 |
---|---|
5030 | 2800 |
13700 | 4670 |
10730 | 6890 |
11400 | 7720 |
860 | 7030 |
2200 | 7330 |
4250 | 2810 |
15040 | 1330 |
4980 | 3320 |
11900 | 1230 |
8130 | 2130 |
26850 | 2190 |
17660 | |
22800 | |
1130 | |
1690 |
Ejercicio 3 Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con el propósito de reducir el mismo a menos de 3000 motores por día. Se llevó a cabo un muestreo del inventario en reserva al final de cada uno de ocho días, seleccionados aleatoriamente; los resultados se muestran en la siguiente tabla. ¿Con los datos hay evidencia suficiente que señale que el promedio del número diario de motores en el inventario es menor que 3000?
N° de motores
2905
2895
2725
3005
2835
2835
3065
2605
Ejemplo 3.
Según información reciente, la obesidad es un problema creciente en el
país en grupos de todas las edades. En el año 2002 se reportó que 1276
de una muestra de 4115 adultos fueron encontrados obesos (índice
corporal mayor a 30). Una encuesta realizada 4 años antes reveló que el
30% de los adultos encuestados se consideraron obesos. ¿Sugieren los
datos más recientes que la proporción verdadera de adultos obesos es más
de 1.5 veces el porcentaje de la encuesta? Tome en cuenta un nivel de
significancia de 0.10.
Recuerde que:
\(\hat{\pi}=\frac{X}{C}\)
\(\mu_{\boldsymbol{\hat{\pi}}}\)=\(\pi\)
\(\sigma_{\boldsymbol{\hat{\pi}}}\)=\(\sqrt{\frac{\pi(1-\pi)}{c}}\)
Hipótesis estadísticas:
H0:\(\pi\)=0.30
H1:\(\pi\) \(\neq\) >0.3
Nivel de significancia: \(\alpha\)=0.10
Estadígrafo de prueba
z=\(\frac{\hat{\pi}-{\pi}}{\sqrt{{\pi}{(1-\pi)}/c}}\)
qnorm(0.1,0,1,lower.tail=FALSE)
## [1] 1.281552
\(\hat{\pi}=\frac{1276}{4115}\)
z=\(\frac{0.31-{0.3}}{\sqrt{{(0.3)}{(0.7)}/4115}}=1.4\)
Como z =1,40 es mayor a 1,28 se rechaza la hipótesis nula.
Los datos muestrales aportan evidencia suficiente, a un nivel de significancia de 0.10, para decir que la proporción de obesos adultos que resultó en el informe es mayor al 30%, es decir que ha aumentado más de 1.5 veces la proporción con respecto a los encuestados 4 años antes.
prop.test(1276, 4115,p=0.3,alternative="greater",conf.level=0.9,correct=F)
##
## 1-sample proportions test without continuity correction
##
## data: 1276 out of 4115, null probability 0.3
## X-squared = 1.993, df = 1, p-value = 0.07901
## alternative hypothesis: true p is greater than 0.3
## 90 percent confidence interval:
## 0.300922 1.000000
## sample estimates:
## p
## 0.3100851
Dos grupos de 200 cerdos cada uno afectados por una enfermedad (A y B), son usados para probar la eficacia de un nuevo tratamiento sobre la base de un suero. Ambos grupos son tratados idénticamente, excepto que al grupo A se le da el suero y al B no. Se encuentra que 140 y 120 de los enfermos del grupo A y B, respectivamente, se recuperan de la enfermedad. ¿Puede concluirse que el nuevo tratamiento ayuda a curar la enfermedad a un nivel de significancia de 0,01?
prop.test(x=c(140,120), n=c(200, 200),alternative="two.sided", conf.level=0.99,correct=F)
##
## 2-sample test for equality of proportions without continuity correction
##
## data: c(140, 120) out of c(200, 200)
## X-squared = 4.3956, df = 1, p-value = 0.03603
## alternative hypothesis: two.sided
## 99 percent confidence interval:
## -0.02218231 0.22218231
## sample estimates:
## prop 1 prop 2
## 0.7 0.6
Ejercicio 4
La duración media de una muestra de 100 tubos fluorescentes producidos poruna compañía resulta ser 1500 horas, con una desviación típica poblacional de 120 horas. Si \(\mu\) es la duración media de todos los tubos producidos por la compañía, comprobar la hipótesis \(\mu=1600\) horas contra la hipótesis altemativa \(\mu\neq1600\) horas con un nivel de significación de 0.05 y 0.01.
Ejercicio 5
La resistencia a la rotura de los cables producidos por un fabricante tienen una media de 1800 libras y una desviación típica de 100 libras. Mediante una nueva técnica en el proceso de fa- bricación se aspira a que esta resistencia pueda ser incrementada. Para ensayar esta aspiración, se ensaya una muestra de 50 cables y se encuentra que su resistencia media es de 1850 libras. ¿Puede mantenerse que, en efecto, hay un aumento de resistencia al nivel de significación del 0.01?