Clase 2.2
Estimación por intervalos de la media poblacional
Msc. Roberto Trespalacios
Universidad Tecnológica de Bolivar
2024-01-29
Tabla de contenido
Estimación por intervalos de la media poblacional
Intervalo de confianza para la media \(\mu\), \(\sigma^2\) conocida
Simulación de intervalos de confianza para la media \(\mu\), \(\sigma^2\) conocida
Intervalo de confianza para la media \(\mu\), \(\sigma^2\) desconocida y \(n\) pequeño (\(n < 30\))
Ejemplos
Ejercicios
Intervalo de confianza para la media \(\mu\), \(\sigma^2\) conocida
El método general para construir intervalos de confianza es el siguiente llamado método del pivote:
Supongamos el siguiente caso particular. Sea \(x_1, x_2,\dots, x_n\), una muestra aleatoria de tamaño \(n\) de una variable aleatoria \(X\), tal que,
\[X \rightarrow N(\mu,\sigma^2)\]
Sea \(\sigma^2\) conocido. Queremos construir un intervalo de confianza para el parámetro \(\mu\) con un nivel de confianza de \(1-\alpha\) y significancia \(\alpha\).
Intervalo de confianza para la media \(\mu\), \(\sigma^2\) conocida
Tomamos un estimador puntual de \(\mu\), sabemos que un buen estimador es \(\bar{x}\).
Apartir de \(\bar{x}\), construimos el estadístico \(Z\), estandarizado; es decir:
\[Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}\]\(Z\) será el “pivote”. Notemos que el “pivote” tiene el verdadero valor del parámetro \(\mu\); además, que bajo las condiciones dadas, se tiene que:
Puesto que conocemos la distribución de \(Z\), podemos plantear lo siguiente: hallar un número \(z\) tal que:
\[p(-z_{\frac{\alpha}{2}} \leqslant Z \leqslant z_{\frac{\alpha}{2}}) = 1-\alpha\] Es decir,
\[p(-z_{\frac{\alpha}{2}} \leqslant \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \leqslant z_{\frac{\alpha}{2}}) = 1-\alpha\] Despejando \(\mu\) en el interior de la probabilidad, vemos que
Intervalo de confianza para la media \(\mu\), \(\sigma^2\) conocida
De lo anterior, podemos concluir que un intervalo de confianza para la media \(\mu\), con varianza \(\sigma^2\) conocida y con nivel de confianza de \(1-\alpha\) es:
Observación: al valor \(\varepsilon = z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\), se le llama el error del intervalo.
Ejemplo 1
La variable \(X\) representa el precio (en miles de euros) de la vivienda de alquiler en Madrid, la cual se distribuye normal, con media desconocida \(\mu\) y varianza conocida \(\sigma^2 = 25\). Se quiere construir un intervalo de confianza para la media \(\mu\) del precio; para esto, se toma una muestra aleatoria de 40 viviendas y se optiene una media muestral de \(\bar{x}= 82.5\). Calcule un intervalo de confianza al 95%.
Solución
Nivel de confianza: \(1-\alpha= 0.95\), luego, \(\alpha = 0.05\) y \(\frac{\alpha}{2}=0.025\), así, \(z_{\frac{\alpha}{2}}=z_{0.05}=1.96\); y por simetría, la región de confianza es:
Elección del estadístico. \(Z = \frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0, 1)\)
\[p\left(\bar{x} -1.96 \frac{\sigma}{\sqrt{n}} < \mu < \bar{x} + 1.96\frac{\sigma}{\sqrt{n}}\right)=0.95\] 4. Reemplazando los valores de cada parámetro y del estadístico, se tiene que intervalo al 95% de confianza para \(\mu\) es:
Conclusión: con una confianza del 95%, el precio medio del alquiler en Madrid se encuentra en el intervalo \((80.95, 84.04)\) miles de euros.
Solución en R
Construyendo el código
Code
n =40# El tamaño de la muestraxbar =82.5# la media muestralsd =sqrt(25) # La desviación estándar poblacionalnivel_conf =0.95# nivel de confianzaerror.est = sd/sqrt(n) # Calculamos el error estándarerror =qnorm(0.975, mean=0, sd=1) * error.est # error del intervaloLinf <- xbar - error # Limite inferior del intervaloLsup <- xbar + error # Limite superior del intervalocat("Un intervalo de confianza para \U03BC, al 95% es: (",round(Linf,4), "," , round(Lsup,4),")")
Simulación de intervalos de confianza para la media \(\mu\), \(\sigma^2\) conocida
Sea \(X\) = “Estatura de los hombres en Colombia”. Supongamos que \(X \rightarrow N(\mu =172,\sigma^2 = 6.25)\). Veamos una simulación para el problema de los intervalos de confianza bajo estos supuestos. Los pasos a seguir son lo siguientes.
Generemos 100 muestras de tamaño \(n=5000\), de la variable \(X\) de la población, donde \(X \rightarrow N(\mu =172,\sigma^2 = 6.25)\)).
Para cada una de estas 100 muestras, calcule lo siguiente:
Media \(\bar{x}\)
Sesgo absoluto \(|\bar{x} - \mu|\)
Error estándar \(SE = \frac{\sigma}{\sqrt{n}}\)
Límites inferior y superior del intervalo de confianza al 90%
Cree un gráfico de los 100 intervalos generados.
Solución
Para la variable \(X\), generemos 100 muestras de tamaño \(n=5000\) de la población \(X \rightarrow N(\mu = 172,\sigma^2 = 6.25)\)
Para cada muestra, encontremos Media, Sesgo absoluto, Error estándar, límites inferior y superior del intervalo de confianza.
Code
info <-function(x){ M <-mean(x) DF <-length(x) -1 SE <- sigma/sqrt(length(x)) INT <-qt(.95, DF) * SEreturn(c(M, M - mu, SE, M - INT, M + INT))}formato <-c("Media"=0, "Sesgo"=0, "Err.Est"=0, "Linf"=0, "Lsup"=0)resultados <- muestras %>%vapply(., info, formato) %>%t()
Solución
Ahora veamos cuales intervalos contienen la media poblacional \(\mu\)
La proporción de intervalos que contienen el valor real de la media poblacional \(\mu\).
Code
media_contiene
[1] 0.9
Solución
Gráfico de los 100 intervalos de confianza, al 90%.
Code
ggplot(resultados, aes(y=Media, x=1:100)) +geom_segment(aes(x =-2, xend =102, y =172, yend =172), color ="darkblue", size =1.2)+geom_pointrange(aes(ymin = resultados$Linf, ymax = resultados$Lsup, color = Contiene), size =0.6) +scale_color_manual(values=c("#57D871", "#EA3046"),name="Contiene \U03BC",breaks=c("Si", "No"),labels=c("Si", "No")) +geom_text(x=-4, y=172, label="\U03BC", size=10) +labs(title ="Intervalo al 90% de Confianza\npara la media poblacional \U03BC",x ="Simulación 1-100", y ="(\U0078\U0304 - \U03B5, \U0078\U0304 + \U03B5)")+theme(plot.title =element_text(hjust =0.5), text=element_text(size=22))
Intervalo de confianza para la media \(\mu\), \(\sigma^2\) desconocida y \(n\) pequeño (\(n < 30\))
Análogamente, del análisis anterior, si cambiamos \(\sigma\) por \(s\) y \(Z_{\frac{\alpha}{2}}\) por \(t_{(n-1,\frac{\alpha}{2})}\), encontramos un intervalo de confianza para la media \(\mu\), con varianza \(\sigma^2\) desconocida, \(n\) pequeño (\(n <30\)) y con nivel de confianza de \(1-\alpha\) es:
Observación: al valor \(\varepsilon = t_{(n-1,\frac{\alpha}{2})} \frac{s}{\sqrt{n}}\), se le llama el error del intervalo.
Ejemplo 2
Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre y se encontró una media de 10.48 ohms y una desviación estandar de 1.36 ohms. Si se sabe que la resistencia del alambre sigue una distribución normal, calcule un intervalo de confianza para la media poblacional del alambre, usando un 90% de nivel de confianza.
Solución
Nivel de confianza: \(1-\alpha= 0.90\), luego, \(\frac{\alpha}{2}=0.05\), así, \(t_{(n-1,\frac{\alpha}{2})}=t_{(9,0.05)}=1.83\)
Elección del estadístico: \(t = \frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}\)
El intervalo: \(\left(\bar{x} -1.83 \frac{s}{\sqrt{n}} , \bar{x} + 1.83\frac{s}{\sqrt{n}}\right)\)
La edad de los alumnos que el año pasado se matricularon en alguno de los cursos de verano de la Universidad Tecnológica de Bolivar sigue una distribución normal con desviación típica de 7 años. Una muestra aleatoria de 150 alumnos ha dado como resultado una edad media de 23.4 años.
Obtener el intervalo de confianza del 94% para la media de edad de todos los matriculados.
¿Cuál es el tamaño mínimo que debe tener la muestra si deseamos que el error cometido al estimar la media con un nivel de confianza del 92% sea de 0.5?
Ejercicios
De una población normalmente distribuida, se selecciona una muestra aleatoria simple de tamaño 25, encontrando que el promedio y la desviación estandar de la muestra son: 108 y 10, respectivamente.
¿Cuál es el margen de error para un intervalo al nivel de confianza del 98%?
Encuentre los límites superior e inferior para construir un intervalo de confianza para el inciso a.
¿Cuál es el intervalo de confianza de acuerdo a los incisos a. y b.
Construya un intervalo de confianza al 95% para la media.
Construya un intervalo de confianza al 90% para la media.
Compare sus resultados en c., d. y e. ¿Qué sucede con el margen de error cuando se disminuye el nivel de confianza?
Las puntuaciones en un test que mide la variable creatividad siguen, en la población general de adolescentes siguen una distribución normal. En un centro escolar que ha implantado un programa de estimulación de la creatividad una muestra de 20 alumnos ha proporcionado las siguientes puntuaciones:
A un nivel de confianza del 95%, calcule un intervalo de confianza para la puntuación media del test. Interprete el resultado.
Ejercicios
Se estima que el tiempo de reacción a un estímulo de cierto dispositivo electrónico está distribuido normalmente con desviación estándar de 0.05 segundos. ¿Cuál es el número de mediciones temporales que deberá hacerse para que la confianza de que el error de la estimación de la esperanza no exceda de 0.01 sea del 95%?