Ejercicios Intervalos de Confianza t student

Rubén Pizarro Gurrola

Objetivo

Estimar intervalos de confianza de la media de una población haciendo uso de la distribución t student.

Cargar librerías

Se cargan librerías usadas a lo largo del caso.

library(dplyr)
library(mosaic)
library(ggplot2)  # Para gráficos
library(cowplot) #Imágenes en el mismo renglón
library(visualize)
options(scipen=999) # Notación normal

Cargar funciones

source ("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/funciones%20para%20disribuciones%20de%20probabilidad.R")

Se debe encontrar el intervalo de confianza que permite inferir el valor del parámetro o la media de una población basados en los estadísticos siguientes:

\(n:\) como el tamaño de la muestra;

\(\bar{x}:\) la media de la muestra y

\(\sigma:\) la desviación estándar de la muestra.

Ahora bien depende de la pregunta para decidir si es cola izqierda o cola derecha o ambas y calcular el intervalo de confianza (IC) e inferir sobre la media de la población.

Fórmula de Intervalo de Confianza

\[ IC = \bar{x} \pm t \cdot\frac{\sigma}{\sqrt(n)} \]

Cola a la izquierda

Si la pregunta que la media de la población debe ser mayor o igual que la media de la muestra (\(\mu\ge\bar{x}\)) a una muestra de \(n\) con media muestral \(\bar{x}\) (tal) y desviación \(\sigma\) (tal) entonces, se calcula el valor de t a la izquierda y se utiliza con la fórmula del intervalo de confianza:

\[ IC = \bar{x} - t \cdot\frac{\sigma}{\sqrt(n)} \]

Cola a la derecha

Si la pregunta que la media de la población debe ser menor o igual que la media de la muestra (\(\mu\le\bar{x}\)) a una muestra de \(n\) con media muestral \(\bar{x}\) (tal) y desviación \(\sigma\) (tal) entonces, se calcula el valor de t a la derecha y se utiliza con la fórmula del intervalo de confianza: \[ IC = \bar{x} + t \cdot\frac{\sigma}{\sqrt(n)} \]

Ambas colas

Si la pregunta que la media de la población es diferente a la media de la muestra (\(\mu\ne\bar{x}\)) de \(n\) con media muestral \(\bar{x}\) (tal) y desviación \(\sigma\) (tal) entonces, se calcula el valor de t a ambas colas y se utiliza con la fórmula del intervalo de confianza: \[ IC = \bar{x} + t \cdot\frac{\sigma}{\sqrt(n)} \]

Ejemplo cola izquierda:

Se tiene un estudio en donde se ha medido la velocidad promedio de un coche en una carretera y se desea obtener un intervalo de confianza para la media de la velocidad a un nivel de confianza del 95%. Se sabe que la velocidad sigue una distribución normal, pero se desconoce la desviación estándar poblacional. Se ha tomado una muestra aleatoria de tamaño 15 y se ha obtenido una media muestral de 55 millas por hora y una desviación estándar muestral de 5 millas por hora. La media de la población debe ser mayor o igual a la media de la muestra a un intervalo de confianza del 95%

Ejemplo cola izquierda:

\[ IC = \bar{x} - t \cdot\frac{\sigma}{\sqrt(n)} \]

\[ IC = 55 - t \cdot\frac{5}{\sqrt(15)} \therefore\\ IC = 55 - t \cdot\frac{5}{3.872983} \therefore\\ IC = 55 - t \cdot3.717389 = ? \]

Los valores iniciales

Todo en dos listas

confianza = 0.95  # 95%
alfa  = 1 - confianza  # Por la izquierda
nivel_confianza <- list(confianza = confianza, alfa = alfa)
print("Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda")
[1] "Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda"
print(nivel_confianza)
$confianza
[1] 0.95

$alfa
[1] 0.05

Los valores iniciales

n <- 15
gl <- n-1
media_m <- 55
desv_std_m <- 5
estadisticos <- list(n = n, gl = gl, media_m = media_m, desv_std_m = desv_std_m)

print("Aquí los estadísticos del ejercicio")
[1] "Aquí los estadísticos del ejercicio"
print(estadisticos)
$n
[1] 15

$gl
[1] 14

$media_m
[1] 55

$desv_std_m
[1] 5

Valor de t al 95% de confianza

por la izquierda

print("Valor de t: ")
[1] "Valor de t: "
t <- qt(p = alfa, df = gl)
t
[1] -1.76131

IC por la izquierda

\[ IC = 55 - (-1.76131 \cdot3.717389) = 57.2738 \]

Llamando la función f.intervalo.confianza.t() con argumento tipo = 1 que significa por la izquierda

IC = f.intervalo.confianza.t(media = media_m, desv = desv_std_m, confianza = confianza, n = n, tipo = 1)
IC
[1] 57.2738     Inf

El valor de la media poblacional a un 95% de confianza debe ser mayor o igual que 57.2738 millas por hora.

Visualmente

msj = paste("El valor de la media poblacional a un '\n", confianza * 100, "%, de confianza debe ser mayor o igual \n que ",IC[1], "millas por hora. \n Con una muestra de ", n, "observaciones")
visualize.t(stat = t, df = gl) +
 text(0, 0.3, msj, col = "black")
integer(0)

Ejemplo cola por la derecha:

Se quiere estimar la media de una población de alturas y se toma una muestra de tamaño \(n = 25\). Se sabe que la desviación estándar de la población es \(\sigma = 5\). Se obtiene una media muestral de \(\bar{x} = 170\). Se desea calcular un intervalo de confianza de cola derecha con un nivel de confianza del \(95%\). Es decir, ¿cuál sería el intérvalo de confianza de la media poblacional si esta es menor o igual a la media muestral \(\mu \le \bar{x}\) a un 95% de confianza. Cola por la derecha.

Ejemplo cola derecha:

\[ IC = \bar{x} + t \cdot\frac{\sigma}{\sqrt(n)} \]

\[ IC = 170 + t \cdot\frac{5}{\sqrt(25)} \therefore\\ IC = 170 + t \cdot\frac{5}{5} \therefore\\ IC = 170 + t \cdot 1 = ? \]

Los valores iniciales

Todo en dos listas

confianza = 0.95  # 95%
alfa  = 1 - confianza  # Por la derecha
nivel_confianza <- list(confianza = confianza, alfa = alfa)
print("Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda")
[1] "Aquí nivel de confianza y valor de alfa = 1 - confianza, por la izquierda"
print(nivel_confianza)
$confianza
[1] 0.95

$alfa
[1] 0.05

Los valores iniciales

n <- 25
gl <- n-1
media_m <- 170
desv_std_m <- 5
estadisticos <- list(n = n, gl = gl, media_m = media_m, desv_std_m = desv_std_m)

print("Aquí los estadísticos del ejercicio")
[1] "Aquí los estadísticos del ejercicio"
print(estadisticos)
$n
[1] 25

$gl
[1] 24

$media_m
[1] 170

$desv_std_m
[1] 5

Valor de t al 95% de confianza

por la derecha

print("Valor de t: ")
[1] "Valor de t: "
t <- qt(p = alfa, df = gl, lower.tail = FALSE)
t
[1] 1.710882

IC por la derecha

\[ IC = 170 + 1.710882 \cdot 1 = 171.7109 \]

Llamando la función f.intervalo.confianza.t() con argumento tipo = 1 que significa por la izquierda

IC = f.intervalo.confianza.t(media = media_m, desv = desv_std_m, confianza = confianza, n = n, tipo = 2)
IC
[1]     -Inf 171.7109

El valor de la media poblacional a un 95% de confianza debe ser menor o igual que 171.7109 en altura.

Visualmente

msj = paste("El valor de la media poblacional a un '\n", confianza * 100, "%, de confianza debe ser menor o igual \n que ",IC[2], "en altura. \n Con una muestra de ", n, "observaciones")
visualize.t(stat = t, df = gl, section = "upper") +
 text(0, 0.3, msj, col = "black")
integer(0)

Ejemplo Dos colas:

De este último ejemplo, ¿cuál es el intervalo de confianza (IC) con los mismos datos iniciales: una muestra de tamaño \(n = 25\). Se sabe que la desviación estándar de la población es \(\sigma = 5\). Se obtiene una media muestral de \(\bar{x} = 170\) con respecto a la altura de las personas.

\[ IC = \bar{x} \pm t \cdot\frac{\sigma}{\sqrt(n)} \]

\[ IC = 170 \pm t \cdot\frac{5}{\sqrt(25)} \therefore\\ IC = 170 \pm t \cdot\frac{5}{5} \therefore\\ IC = 170 \pm t \cdot 1 = ? \]

Datos iniciales similares al anteior

[1] "Aquí nivel de confianza y valor de alfa = 1 - confianza, ambas colas"
$confianza
[1] 0.95

$alfa
[1] 0.025

Datos iniciales similares al anterior

[1] "Aquí los estadísticos del ejercicio"
$n
[1] 25

$gl
[1] 24

$media_m
[1] 170

$desv_std_m
[1] 5

Valor de t al 95% ambas colas

El intervalo de confianza para ambas colas

print("Valor de t: ")
[1] "Valor de t: "
t1 <- qt(p = alfa, df = gl)
t2 <- qt(p = alfa, df = gl, lower.tail = FALSE)
t  <- abs(t)
t1; t2;  t
[1] -2.063899
[1] 2.063899
[1] 1.710882

IC por ambas colas

\[ IC1 = 170 -2.063899- 1.710882 \cdot 1 = 167.9361 \\ IC2 = 170 +2.063899 \cdot 1 = 172.0639 \]

Llamando la función f.intervalo.confianza.t() con argumento tipo = 1 que significa por la izquierda

IC = f.intervalo.confianza.t(media = media_m, desv = desv_std_m, confianza = confianza, n = n, tipo = 3)
IC
[1] 167.9361 172.0639

Visualmente

t <- abs(t)
msj = paste("El valor de la media poblacional a un '\n", confianza * 100, "%, de confianza debe estar entre ",IC[1], "y ", IC[2], "en altura. \n Con una muestra de ", n, "observaciones")
visualize.t(stat = c(-t, t), df = gl, section = "tails") +
 text(0, 0.3, msj, col = "black")
integer(0)