Estimar intervalos de confianza de la media de una población haciendo uso de la distribución t student.
Se cargan librerías usadas a lo largo del caso.
Se debe encontrar el intervalo de confianza que permite inferir el valor del parámetro o la media de una población basados en los estadísticos siguientes:
\(n:\) como el tamaño de la muestra;
\(\bar{x}:\) la media de la muestra y
\(\sigma:\) la desviación estándar de la muestra.
Ahora bien depende de la pregunta para decidir si es cola izqierda o cola derecha o ambas y calcular el intervalo de confianza (IC) e inferir sobre la media de la población.
\[ IC = \bar{x} \pm t \cdot\frac{\sigma}{\sqrt(n)} \]
Si la pregunta que la media de la población debe ser mayor o igual que la media de la muestra (\(\mu\ge\bar{x}\)) a una muestra de \(n\) con media muestral \(\bar{x}\) (tal) y desviación \(\sigma\) (tal) entonces, se calcula el valor de t a la izquierda y se utiliza con la fórmula del intervalo de confianza:
\[ IC = \bar{x} - t \cdot\frac{\sigma}{\sqrt(n)} \]
Si la pregunta que la media de la población debe ser menor o igual que la media de la muestra (\(\mu\le\bar{x}\)) a una muestra de \(n\) con media muestral \(\bar{x}\) (tal) y desviación \(\sigma\) (tal) entonces, se calcula el valor de t a la derecha y se utiliza con la fórmula del intervalo de confianza: \[ IC = \bar{x} + t \cdot\frac{\sigma}{\sqrt(n)} \]
Si la pregunta que la media de la población es diferente a la media de la muestra (\(\mu\ne\bar{x}\)) de \(n\) con media muestral \(\bar{x}\) (tal) y desviación \(\sigma\) (tal) entonces, se calcula el valor de t a ambas colas y se utiliza con la fórmula del intervalo de confianza: \[ IC = \bar{x} + t \cdot\frac{\sigma}{\sqrt(n)} \]
Se tiene un estudio en donde se ha medido la velocidad promedio de un coche en una carretera y se desea obtener un intervalo de confianza para la media de la velocidad a un nivel de confianza del 95%. Se sabe que la velocidad sigue una distribución normal, pero se desconoce la desviación estándar poblacional. Se ha tomado una muestra aleatoria de tamaño 15 y se ha obtenido una media muestral de 55 millas por hora y una desviación estándar muestral de 5 millas por hora. La media de la población debe ser mayor o igual a la media de la muestra a un intervalo de confianza del 95%
\[ IC = \bar{x} - t \cdot\frac{\sigma}{\sqrt(n)} \]
\[ IC = 55 - t \cdot\frac{5}{\sqrt(15)} \therefore\\ IC = 55 - t \cdot\frac{5}{3.872983} \therefore\\ IC = 55 - t \cdot3.717389 = ? \]
Todo en dos listas
confianza = 0.95 # 95%
alfa = 1 - confianza # Por la izquierda
nivel_confianza <- list(confianza = confianza, alfa = alfa)
print("Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda")
[1] "Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda"
$confianza
[1] 0.95
$alfa
[1] 0.05
por la izquierda
\[ IC = 55 - (-1.76131 \cdot3.717389) = 57.2738 \]
Llamando la función f.intervalo.confianza.t() con argumento tipo = 1 que significa por la izquierda
IC = f.intervalo.confianza.t(media = media_m, desv = desv_std_m, confianza = confianza, n = n, tipo = 1)
IC
[1] 57.2738 Inf
El valor de la media poblacional a un 95% de confianza debe ser mayor o igual que 57.2738 millas por hora.
msj = paste("El valor de la media poblacional a un '\n", confianza * 100, "%, de confianza debe ser mayor o igual \n que ",IC[1], "millas por hora. \n Con una muestra de ", n, "observaciones")
visualize.t(stat = t, df = gl) +
text(0, 0.3, msj, col = "black")
integer(0)
Se quiere estimar la media de una población de alturas y se toma una muestra de tamaño \(n = 25\). Se sabe que la desviación estándar de la población es \(\sigma = 5\). Se obtiene una media muestral de \(\bar{x} = 170\). Se desea calcular un intervalo de confianza de cola derecha con un nivel de confianza del \(95%\). Es decir, ¿cuál sería el intérvalo de confianza de la media poblacional si esta es menor o igual a la media muestral \(\mu \le \bar{x}\) a un 95% de confianza. Cola por la derecha.
\[ IC = \bar{x} + t \cdot\frac{\sigma}{\sqrt(n)} \]
\[ IC = 170 + t \cdot\frac{5}{\sqrt(25)} \therefore\\ IC = 170 + t \cdot\frac{5}{5} \therefore\\ IC = 170 + t \cdot 1 = ? \]
Todo en dos listas
confianza = 0.95 # 95%
alfa = 1 - confianza # Por la derecha
nivel_confianza <- list(confianza = confianza, alfa = alfa)
print("Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda")
[1] "Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda"
$confianza
[1] 0.95
$alfa
[1] 0.05
por la derecha
\[ IC = 170 + 1.710882 \cdot 1 = 171.7109 \]
Llamando la función f.intervalo.confianza.t() con argumento tipo = 1 que significa por la izquierda
IC = f.intervalo.confianza.t(media = media_m, desv = desv_std_m, confianza = confianza, n = n, tipo = 2)
IC
[1] -Inf 171.7109
El valor de la media poblacional a un 95% de confianza debe ser menor o igual que 171.7109 en altura.
msj = paste("El valor de la media poblacional a un '\n", confianza * 100, "%, de confianza debe ser menor o igual \n que ",IC[2], "en altura. \n Con una muestra de ", n, "observaciones")
visualize.t(stat = t, df = gl, section = "upper") +
text(0, 0.3, msj, col = "black")
integer(0)
De este último ejemplo, ¿cuál es el intervalo de confianza (IC) con los mismos datos iniciales: una muestra de tamaño \(n = 25\). Se sabe que la desviación estándar de la población es \(\sigma = 5\). Se obtiene una media muestral de \(\bar{x} = 170\) con respecto a la altura de las personas.
\[ IC = \bar{x} \pm t \cdot\frac{\sigma}{\sqrt(n)} \]
\[ IC = 170 \pm t \cdot\frac{5}{\sqrt(25)} \therefore\\ IC = 170 \pm t \cdot\frac{5}{5} \therefore\\ IC = 170 \pm t \cdot 1 = ? \]
[1] "Aquí nivel de confianza y valor de alfa = 1 - confianza, ambas colas"
$confianza
[1] 0.95
$alfa
[1] 0.025
[1] "Aquí los estadísticos del ejercicio"
$n
[1] 25
$gl
[1] 24
$media_m
[1] 170
$desv_std_m
[1] 5
El intervalo de confianza para ambas colas
\[ IC1 = 170 -2.063899- 1.710882 \cdot 1 = 167.9361 \\ IC2 = 170 +2.063899 \cdot 1 = 172.0639 \]
Llamando la función f.intervalo.confianza.t() con argumento tipo = 1 que significa por la izquierda
t <- abs(t)
msj = paste("El valor de la media poblacional a un '\n", confianza * 100, "%, de confianza debe estar entre ",IC[1], "y ", IC[2], "en altura. \n Con una muestra de ", n, "observaciones")
visualize.t(stat = c(-t, t), df = gl, section = "tails") +
text(0, 0.3, msj, col = "black")
integer(0)