2020A

Contenido

  • Prueba de hipótesis para media de una sola población
    • Usando Z-test (Distribución normal con varianza conocida)
    • Usando t-test (Distribución normal con varianza desconocida)
    • Población sin distribución normal

\(Z-test\). Distribución normal y varianza poblacional conocida

Z-test- ¿Qué es?

  • Cuando se tiene una población con distribución normal (o aproximada a la normal) y se conoce la varianza es posible emplear el estadístico \(Z\) para la prueba de hipótesis.
  • Se parte del supuesto que \(H_0: \mu= \mu_0\)
  • El estadístico de prueba es:

\(z= \frac{ \bar{x}- \mu_0}{\sigma/ \sqrt{n}}\)

  • Se utiliza relativamente poco

Ejemplo 1 Para Z-test

Un grupo de investigadores desean conocer la edad media de cierta población. Saben por estudios anteriores, que la edad de los individuos en la población se distribuye normalmente con \(\sigma^2=27\). Para iniciar su estudio se preguntan ¿Si la media de edad de la población es diferente de 30?. Los investigadores quieren realizar su estudio con un 95% de confianza

Ejemplo 1 Para Z-test

Los investigadores tomaron una muestra 50 sujetos con las siguiente edades:

edades: 19, 29, 41, 18, 55, 24, 52, 41, 37, 41, 31, 50, 40, 39, 46, 44, 54, 42, 47, 36, 50, 26, 39, 51, 41, 37, 35, 49, 44, 19, 35, 36, 47, 30, 47, 30, 30, 22, 34, 45, 24, 25, 22, 43, 47, 39, 55, 55, 50, 39

Ejemplo 1 Para Z-test

Para solucionar este ejercicio seguiremos los pasos planteados en la clase anterior:

  1. Datos: Comprender los datos, formular hipótesis y hacer estadística descriptiva
  2. Supuestos: ¿Los datos siguen una distribución normal?
  3. Hipótesis: Formular las hipótesis estadísticas
  4. Estadística de prueba: ¿Qué tipo de prueba voy a utilizar?
  5. Regla de decisión:¿Que voy a considerar como mi valor crítico?¿Cual es mi zona de rechazo o aceptación?
  6. Estadístico de prueba:Determinar el valor de mi estadístico de prueba
  7. Decisión: ¿Acepto o rechazo?
  8. Conclusión
  9. Valor de \(p\)

Ejemplo 1 Para Z-test

Paso 1. Datos

  • ¿Qué datos tenemos disponibles?
    • \(\sigma^2=27\)
    • \(n=50\)
    • Población normal
  • ¿Qué características tienen mis datos?
    • Estadística descriptiva

Ejemplo 1 Para Z-test

Paso 1. Datos

Estadística descriptiva

edades<-c(32, 44, 35, 40, 42, 31, 38, 27, 23, 30, 39, 
          20, 30, 43, 26, 23, 22, 20, 36, 35, 25, 27, 
          27, 43, 22, 30, 26, 27, 32, 41, 42, 30, 43, 
          22, 42, 24, 22, 30, 27, 45, 26, 29, 45, 32, 
          31, 38, 25, 37, 31, 44)# Hice un objeto con las edades
summary(edades)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20.00   26.00   30.50   32.02   38.75   45.00

Gráficos. Ejemplo 1

hist(edades)

Gráficos. Ejemplo 1

boxplot(edades)

Ejemplo 1 Para Z-test

Paso 2. Supuestos

  • Para poder realizar una prueba de hipótesis debemos apegarnos a ciertos supuestos
  • En este caso podemos suponer que:
    • Los datos vienen de una población con distribución normal. Significa que podemos utilizar estadísticos que se basan en una distribución normal
    • Se conoce el valor de la varianza poblacional por lo tanto se puede emplear el estadístico Z

Ejemplo 1 Para Z-test

Paso 3. Hipótesis

  • \(H_0: \mu=30\).
  • \(H_A: \mu \neq 30\). Es una hipótesis bilateral, lo único que nos interesa es que la \(\mu\) sea diferente de 30 (ya sea menor o mayor)

Ejemplo 1 Para Z-test

Paso 4. Estadístico de prueba

  • En este paso debemos de definir con base a los pasos anteriores que estadístico de prueba vamos a necesitar.
  • Nos puede ayudar:
    • ¿Que vamos comparar?
    • ¿Qué vamos a probar?
    • ¿Qué datos conozco de la población?
    • ¿Son datos normales?

Ejemplo 1 Para Z-test

Paso 5. Regla de decisión

  • En este punto debemos de definir ¿Qué valores consideraremos para aceptar o rechazar nuestra \(H_0\)?
  • Del problema podemos deducir que:
    • Hipótesis bilateral (solo nos interesa que sea diferente de 30)
    • \(\alpha=0.05\). Los investigadores quieren realizar su estudio con un 95% de confianza
      • el \(\alpha=0.05\) es el valor que se utiliza habitualmente

Ejemplo 1 Para Z-test

Paso 5. Regla de decisión

  • Dado que elegimos\(\alpha=0.05\) y dado que nuestra hipótesis es bilateral buscamos en tablas el valor \(Z\) adecuado.
  • En r lo podemos estimar con la función qnorm
qnorm(0.025)#para la cola superior
## [1] -1.959964
qnorm(-0.025)# para la cola inferior
## [1] NaN
  • El valor con el que nos vamos a comparar es 1.96 y -1.96

Ejemplo 1 Para Z-test

Paso 5. Regla de decisión

Ejemplo 1 Para Z-test

Paso 6. Calcular estadístico con los datos de prueba

  • Para este punto nos basamos en la formula:
\(z= \frac{ \bar{x}- \mu_0}{\sigma/ \sqrt{n}}\)
  • Sustituyendo con los datos del Ejemplo 1
\(z= \frac{ mean(edades)-30}{\sqrt{27/50}}\)
  • Da como resultado: 2.7488718

Ejemplo 1 Para Z-test

Paso 7. Decisión

Con base en la regla de decisión, se puede rechazar la hipótesis nula porque 2.7489 está en la región de rechazo. Se puede decir que el valor calculado de la prueba estadística tiene un nivel de significación de .05 a dos colas

El valor que estimamos es mayor al valor de referencia de tablas

Ejemplo 1 Para Z-test

Paso 7. Decisión

Ejemplo 1 Para Z-test

Paso 8. Conclusión

Con un 95% de confianza podemos decir que la media es distinta de 30

Ejemplo 1 Para Z-test

Paso 9. Valor de p

  • Podemos estimar la probabilidad de encontrar en nuestra población el valor de \(z\) estimado.
  • Este valor lo podemos obtener de tablas
  • En r lo podemos calcular con la función pnorm
pnorm(2.7489, lower.tail = F)# para el valor de la cola superior. Se debe de cambiar el valor el parámetro lower.tail para que nos de el valor superior
## [1] 0.002989781
pnorm(-2.7489)# para la cola inferior
## [1] 0.002989781

Ejemplo 1 Para Z-test

Paso 9. Valor de p

  • Dado que nuestra hipótesis es bilateral debemos de sumar las dos probabilidades
  • Nos da como resultado: 0.0059796
  • Podemos decir que en nuestra población la probabilidad de encontrar una media igual a 30 es de 0.0059796
  • Podemos decir los resultados observados se deben al azar en 0.5979563%

Ejemplo 1 Para Z-test

Paso 9. Valor de p

Si el valor \(p\) es menor o igual que \(\alpha\), es posible rechazar la hipótesis nula; si el valor p es mayor que \(\alpha\) no es posible rechazar la hipótesis nula.

Ejemplo 2

Otro grupo de investigadores decidió replicar el estudio con el siguiente conjunto de datos:

edades2<-c(25, 29, 26, 34, 34, 35, 34, 29, 27, 
           31, 35, 35, 34, 33, 29, 33, 30, 30, 
           26, 33, 27, 26, 30, 25, 28, 32, 27, 
           30, 27, 35, 32, 33, 25, 29, 30, 32, 
           34, 33, 32, 27, 33, 32, 25, 33, 34, 
           27, 29, 34, 32, 32)

Ejemplo 2

Pasos del 1 al 5

Todos los pasos del 1 al 5 son iguales al problema anterior

Ejemplo 2

Paso 6. Calcular estadístico con los datos de prueba

  • Para este punto nos basamos en la formula:
\(z= \frac{ \bar{x}- \mu_0}{\sigma/ \sqrt{n}}\)
  • Sustituyendo con los datos del Ejemplo 2
\(z= \frac{ mean(edades2)-30}{\sqrt{27/50}}\)
  • Da como resultado: 0.7348469

Ejemplo 2 Para Z-test

Paso 7. Decisión

Ejemplo 2 Para Z-test

Paso 7. Decisión

Con base en la regla de decisión, NO existen argumentos para rechazar la \(H_0\) 0.73 está en la región de aceptación.

El valor que estimamos es mayor al valor de referencia de tablas

Ejemplo 2 Para Z-test

Paso 8. Conclusión

No existen argumentos para decir que la media es distinta de 30 con un 95% de confianza

Ejemplo 2 Para Z-test

Paso 9. Valor de p

  • Podemos estimar la probabilidad de encontrar en nuestra población el valor de \(z\) estimado.
  • Este valor lo podemos obtener de tablas
  • En r lo podemos calcular con la función pnorm
pnorm(0.74, lower.tail = F)# para el valor de la cola superior. 
## [1] 0.22965
#Se debe de cambiar el valor el parámetro lower.tail para que nos de el valor superior
pnorm(-0.74)# para la cola inferior
## [1] 0.22965

Hipótesis unilateral

  • Si la hipótesis es unilateral no se divide el valor de \(\alpha\)
  • Nuestro criterio de rechazo quedaría en uno de los lados de la curva

Ejemplo 1. Hipótesis unilateral

  • Los investigadores ahora desean saber si la media de la edad es mayor a 30.
  • El criterio de rechazo quedaría: ## Ejemplo 1. Hipótesis unilateral
  • Ahora el estadístico con el que nos vamos a comparar es: \(z=1.64\) que corresponde a la cola superior con un \(\alpha=0.05\)
  • En R lo podemos calcular de la siguiente manera:
qnorm(0.05, lower.tail = F)
## [1] 1.644854

Ejemplo 1. Hipótesis unilateral

Paso 7. Decisión

Ejemplo 1. Hipótesis unilateral

  • Con base en la regla de decisión, podemos rechazar la \(H_0\)

  • Existe evidencia con un 95% de confianza de que la media es mayor que 30

  • El valor de \(p\) quedaría repartido en un solo lado

pnorm(2.7489, lower.tail = F)
## [1] 0.002989781

Ejemplo 1. Hipótesis unilateral

  • ¿Y si buscáramos que nuestra media fuera menor de 30?
    • \(H_A: \mu<30\)

¿Cómo hacerlo en R?

install.packages("BSDA")
  • Se utiliza la función:z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)

¿Cómo hacerlo en R?

Argumentos z.test

  • x
    • numeric vector; NAs and Infs are allowed but will be removed.
  • y
    • numeric vector; NAs and Infs are allowed but will be removed.
  • alternative
    • character string, one of “greater”, “less” or “two.sided”, or the initial letter of each, indicating the specification of the alternative hypothesis.

¿Cómo hacerlo en R?

Argumentos z.test

  • mu
    • a single number representing the value of the mean or difference in means specified by the null hypothesis
  • sigma.x
    • a single number representing the population standard deviation for x
  • sigma.y
    • a single number representing the population standard deviation for y
  • conf.level
    • confidence level for the returned confidence interval, restricted to lie between zero and one

¿Cómo hacerlo en R?

Ejemplo 1.

z.test(edades, alternative = "two.sided", mu=30, sigma.x = sqrt(27))
## 
##  One-sample z-Test
## 
## data:  edades
## z = 2.7489, p-value = 0.00598
## alternative hypothesis: true mean is not equal to 30
## 95 percent confidence interval:
##  30.57973 33.46027
## sample estimates:
## mean of x 
##     32.02

¿Cómo hacerlo en R?

Ejemplo 1.

Si buscamos \(H_A: \mu>30\)

z.test(edades, alternative = "greater", mu=30, sigma.x = sqrt(27))
## 
##  One-sample z-Test
## 
## data:  edades
## z = 2.7489, p-value = 0.00299
## alternative hypothesis: true mean is greater than 30
## 95 percent confidence interval:
##  30.81128       NA
## sample estimates:
## mean of x 
##     32.02

¿Cómo hacerlo en R?

Ejemplo 2.

z.test(edades2, alternative = "two.sided", mu=30, sigma.x = sqrt(27))
## 
##  One-sample z-Test
## 
## data:  edades2
## z = 0.73485, p-value = 0.4624
## alternative hypothesis: true mean is not equal to 30
## 95 percent confidence interval:
##  29.09973 31.98027
## sample estimates:
## mean of x 
##     30.54