OBJETIVO

Utilizar funciones de una distribución T Student para calcular función de densidad, probabilidades e identificar valores de t e intervalo de

FÓRMULA

Utilizar funciones de una distribución T Student para calcular función de densidad, probabilidades e identificar valores de t e intervalo de confianza.

x¯=media muestral μ=media poblacional s=desviación estándar de la muestra n=número de elementos de la muestra

Características de T Student

  1. Tiene forma de montículo o campana de gauss y es simétrica alrededor de t=0, igual que z la normal estándar.

  2. Es más variable que z, con “colas más pesadas”; esto es, la curva t no aproxima al eje horizontal con la misma rapidez que z. Esto es porque el estadístico t abarca dos cantidades aleatorias, x¯ y s, en tanto que el estadístico z tiene sólo la media muestral, x¯. Ver curvas de T Student y Normal Estándar z.

  3. La forma de la distribución t depende del tamaño muestral n. A medida que n aumenta, la variabilidad de t disminuye porque la estimación s de σ está basada en más y más información.

  4. Cuando n sea infinitamente grande, las distribuciones t y z son idénticas.

Grados de libertad

El número de grados de libertad es igual al tamaño de la muestra n (número de observaciones independientes) menos 1

gl=df=(n–1) ∴ df=grados de libertad n=total de elementos de la muestra de t

Aplicación

Datos

  library(readxl)
  data_tratada <- read_excel("C:/Users/giang/Downloads/data_tratada.xlsx")

  media.m <- mean(data_tratada$matematica)
  desv.m <- sd(data_tratada$matematica)
  n <- round(length(data_tratada$matematica))
  confianza = 0.95

Creación de una tabla

tabla <- data.frame(variables = c("n", "Grados libertad", "Media muestra", "Desv.Std muestra", "Media Pob.","Confianza"), datos = c(n, (n-1), media.m, desv.m, NA, confianza)) 
tabla
##          variables      datos
## 1                n 240.000000
## 2  Grados libertad 239.000000
## 3    Media muestra  12.945833
## 4 Desv.Std muestra   3.483551
## 5       Media Pob.         NA
## 6        Confianza   0.950000

Valor de t real

t <- qt(p = (1 - confianza) / 2, df = n-1) # dos colas
t <- abs(t)
t
## [1] 1.969939

Intervalo de confianza

li <- media.m - t * (desv.m /sqrt(n) )
ls <- media.m + t * (desv.m /sqrt(n) )
li
## [1] 12.50287
ls
## [1] 13.3888
intervalo <- c(li, ls)
intervalo
## [1] 12.50287 13.38880

Evaluación al intervalo

La mejor estimación de una nota de matematica es tenga un valor entre 12.50287 13.38880 con un 95% de confianza.

Gráfica

  library(visualize)
  visualize.t(stat = c(-t, t), df = n-1, section = "tails") +
  text(0, 0.2, expression("95%"), col = "red")

## integer(0)