Ejercicios T Student

Rubén Pizarro Gurrola

11/10/22

Objetivo

Estimar intervalos de confianza de la media poblacional basado en distribución t student

¿Porqué?

¿Porqué?

Se conoce la media \(\bar{x}\) de la muestra, se conoce la desviación estándar de la muestra \(\sigma\) y se conoce obviamente el valor de \(n\) de la muestra, pero se desconoce la media poblacional \(\mu\), razón por la cual se usa T Student.

Se debe estimar que valor debe tener la media de la población \(\mu\), inferir el intervalo en que debe estar ese valor.

Fundamento teórico

El intervalo de confianza (IC) se sustenta en la teoría de la inferencia estadística; es una herramienta para determinar el rango de valores en los que es probable que se encuentren los parámetros de la población objetivo con una confianza del 90% o del 95% o de 99% que son valores muy comunes de confianza en los campos de estudios(Sánchez Rodríguez 2021)

Descripción

Se cargan las librerías necesarias

Se cargan las funciones previamente codificadas

Se describe los ejercicios

Se inicializan variables

Se estima el intervalo de confianza

Cargar librerías

library(dplyr)
library(mosaic)
library(ggplot2)  # Para gráficos
library(cowplot) #Imágenes en el mismo renglón
library(visualize)
options(scipen=999) # Notación normal

Cargar funciones de distribución

Se utiliza la función f.intervalo.confianza.t() para devolver el intervalo de confianza.

source ("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/funciones%20para%20distribuciones.R")

Fórmula de intervalo de confianza IC

\[ IC = \bar{x} \pm t \cdot \frac{\sigma}{\sqrt{n}} \]

  • Se requiere la media de la muestra

  • El valor de t crítico ambos lados

  • La desviación estándar de la muestra

  • EL valor de \(n\) la cantidad de datos de la muestra

Ejercicios

Promedio escolar

Promedio escolar

Un directivo desea estimar la media del promedio escolar de todos los estudiantes (se quiere estimar la media de una población) de una carrera profesional de Sistemas. Se hace un estudio de una muestra de 25 estudiantes en donde la media de la muestra es 80 y la desviación es 5.

Inicializar variables

\[ \bar{x} = 80 \\ \sigma=5 \\ n=25 \\ confianza = 0.95 \\ \text{grados de libertad = (n-1) = 24} \\ \]

media.m <- 80
desv.std.m <- 5
n <- 25
media.m; desv.std.m; n
[1] 80
[1] 5
[1] 25

Hipótesis

El valor de la media del promedio escolar de toda la población de estudiantes de Sistemas es de 82.

Encontrar los valores críticos de t

El valor de confianza es el 95% para estimar la media de la población

confianza <- 0.95

Utilizar qt() para conocer los valores de t critico

t1 <- qt(p = (1 - confianza) / 2, df = n-1) # dos colas
t2 <- qt(p = (1 - confianza) / 2, df = n-1, lower.tail = FALSE)

# Tomar cualquiera de las dos t t.a o t.b en su valor absoluto
t <- abs(t1)


print ("Valores de t")
[1] "Valores de t"
t
[1] 2.063899

Visualizar t student

visualize.t(stat = c(-t, t), df = n-1, section = "tails") +
  text(0, 0.2, expression("95%"), col = "red")
integer(0)

Calcular el intervalo de confianza

\[ IC = \bar{x} \pm t \cdot \frac{\sigma}{\sqrt{n}} \]

li <- media.m - t * (desv.std.m /sqrt(n) )
ls <- media.m + t * (desv.std.m /sqrt(n) )
print("intervalo de confianza")
[1] "intervalo de confianza"
intervalo <- c(li, ls)
intervalo
[1] 77.9361 82.0639

Usando la función previamente programada

intervalo <- f.intervalo.confianza.t(media = media.m, desv = desv.std.m, confianza = confianza, n = n)
intervalo
[1] 77.9361 82.0639

Interpretación

De acuerdo al intervalo de confianza calculado con t student de 77.9361, 82.0639, y dado que el valor de 82 establecido en la hipótesis inicial cae dentro de ese rango o intervalo, se acepta la hipótesis que la media del promedio escolar debe ser 82 a un 95% de confianza.

¿si se cambia el nivel de confianza al 99%?

¿Se acepta la misma hipótesis o se rechaza?

Interpretación

a mayor nivel de confianza, mayor amplitud del intervalo y viceversa; para tener mayor confianza seguramente se requiere menor precisión en ello dado que el intervalo(amplitud) es mayor.

Como se trata de estimar un parámetro poblacional, entonces el margen de error aumenta en la estimación cuando se tiene un valor de confianza menor, es decir, se tiene entonces un menor rango en el intervalo en la que pueda estar el parámetro estimado.

Ejercicio. Constructora

Ejercicio. Constructora

Una compañía constructora resuelve estudiar la resistencia a la compresión de una mezcla de concreto, con el objetivo de hacer control de calidad. Para ello se tomaron \(18\) cilindros de prueba de acuerdo con las normas establecidas.

Se encontró en la muestra que, luego de 28 días de curado, media muestra de: \(bar{x} = 280 \text{kg/cm2}\) y desviación estándar de: \(\sigma = 19.3kg/cm2\).

Construir un intervalo de confianza del \(90\%\) y \(95\%\) para el valor de la resistencia a la compresión media de la mezcla de concreto

Inicializar variables

\[ \bar{x} = 280 \\ \sigma=19.3 \\ n=18 \\ confianza = \text{0.90 y 0.95} \\ \text{grados de libertad = (n-1) = 24} \\ \]

n <- 18
confianza1 <- 0.90
confianza2 <- 0.95
media.m <- 280
desv.std.m <- 19.3

Intervalo al 90% de confianza

intervalo <- f.intervalo.confianza.t(media = media.m, desv = desv.std.m, confianza = confianza1, n = n)
paste("Al ",confianza1 * 100, "% de confianza, el intervalo es:", intervalo[1], " a ",intervalo[2], ". La media del valor de la resistencia a la compresión en toda la población debe estar en ese rango.")
[1] "Al  90 % de confianza, el intervalo es: 272.0864  a  287.9136 . La media del valor de la resistencia a la compresión en toda la población debe estar en ese rango."

Visualización al 90%

t1 <- qt(p = (1 - confianza1) / 2, df = n-1) # dos colas
t2 <- qt(p = (1 - confianza1) / 2, df = n-1, lower.tail = FALSE)

# Tomar cualquiera de las dos t, t1 o t2 en su valor absoluto
t <- abs(t1)

Visualización al 90%

visualize.t(stat = c(-t, t), df = n-1, section = "tails") +
  text(0, 0.2, expression("90%"), col = "red")
integer(0)

Intervalo al 95% de confianza

intervalo <- f.intervalo.confianza.t(media = media.m, desv = desv.std.m, confianza = confianza2, n = n)
paste("Al ",confianza2 * 100, "% de confianza, el intervalo es:", intervalo[1], " a ",intervalo[2], ". La media del valor de la resistencia a la compresión en toda la población debe estar en ese rango.")
[1] "Al  95 % de confianza, el intervalo es: 270.4023  a  289.5977 . La media del valor de la resistencia a la compresión en toda la población debe estar en ese rango."

Visualización al 95%

t1 <- qt(p = (1 - confianza2) / 2, df = n-1) # dos colas
t2 <- qt(p = (1 - confianza2) / 2, df = n-1, lower.tail = FALSE)

# Tomar cualquiera de las dos t t.a o t.b en su valor absoluto
t <- abs(t1)

paste ("Valor de t", t)
[1] "Valor de t 2.10981557783332"

Visualización al 95%

visualize.t(stat = c(-t, t), df = n-1, section = "tails") +
  text(0, 0.2, expression("95%"), col = "red")
integer(0)

Bibliografía