1 Objetivo

Calcular probabilidad de distribución T Student y evaluar hipótesis.

2 Descripción

En el apartado de marco teórico, se da a conocer un panorama de la importancia de la distribución T Student.

En el desarrollo, se cargan librerías, datos y se calculan probabilidades de diversos ejercicios bajo la distribucón T Student

Se visualian la curva T Student

Se calculan probabilidades y se evalúan hipótesis de diversos ejercicios de una distribución T Student.

3 Fundamento teórico

Existe una fórmula para calcular la densidad de distribuciones discretas

\[ t = \frac{(\bar{x}-\mu)}{s / \sqrt{n}} \]

\[ \bar{x} = \text{media muestral} \\ \mu = \text{media poblacional} \\ s = \text{desviación estándar de la muestra} \\ n = \text{número de elementos de la muestra} \] para muestras aleatorias de tamaño \(n\) desde una población normal (Mendenhall, Beaver, and Beaver 2010).

El numerador representa la diferencia a probar y el denominador la desviación estándar de la diferencia llamado también Error Estándar.

En esta fórmula \(t\) representa al valor estadístico que se estará buscando \(\bar{x}\)es el promedio de la variable analizada de la muestra, y \(\mu\) es el promedio poblacional de la variable a estudiar.

En el denominador se tiene a \(s\) como representativo de la desviación estándar de la muestra y \(n\) el tamaño de ésta.

El número de grados de libertad es igual al tamaño de la muestra \(n\) (número de observaciones independientes) menos 1.

\[ gl = df = (n – 1) \\ \therefore \\ df = \text{grados de libertad} \\ n = \text{total de elementos de la muestra de t} \]

La T Student tiene estas características:

  • Tiene forma de montículo o campana de gauss y es simétrica alrededor de \(t = 0\), igual que \(z\) la normal stándar.

  • Es más variable que \(z\), con “colas más pesadas”; esto es, la curva \(t\) no aproxima al eje horizontal con la misma rapidez que \(z\). Esto es porque el estadístico \(t\) abarca dos cantidades aleatorias, \(\bar{x}\) y \(s\), en tanto que el estadístico \(z\) tiene sólo la media muestral, \(\bar{x}\). Ver curvas de T Student y Normal Stándard.

  • La forma de la distribución \(t\) depende del tamaño muestral \(n\). A medida que \(n\) aumenta, la variabilidad de \(t\) disminuye porque la estimación \(s\) de \(\sigma\) está basada en más y más información.

  • Cuando \(n\) sea infinitamente grande, las distribuciones \(t\) y \(z\) son idénticas.

4 Desarrollo

4.1 Cargar librerías

library(dplyr)
library(mosaic)
library(readr)
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos

library(cowplot) #Imágenes en el mismo renglón

options(scipen=999) # Notación normal

Gráfica de campana normal Stándar y T Student

Se presenta una muestra pequeña de 28 valores, se generan valores de una secuencia alrededor de cero, esto se hace porque la distribución T Student, los valores de la variable aleatoria \(x\) se centran con media igual a cero y por supuesto desviación igual a \(1\).

Se construyen gráficas:

  • g1 es una distribución normal estándar,

  • g2 distribución t student con 27 grados de libertad,

  • g3 t student con 10 grados de libertad y

Se visualizan las tres gráficas con una forma de campana o gauss, simétricas, solo que la distribución \(t\) se achata en relación a la distribución normal estándar \(z\) y se observa diferencia de dispersión con los grados de libertad en las gráficas \(t\).

# Grafica Normal con media igual a cero y desv igual a 1
n <- 28

x <- seq(from = -3, to = 3, length.out = n)

media <- round(mean(x),2)
desv <- round(sd(x), 2)

densn  <- dnorm(x = x, mean = media, sd = desv)

tabla <- data.frame(x = x, y = densn)
#tabla.normal

g1 <- ggplot(data = tabla, aes(x = x, y = densn)) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue') +
  ggtitle("Distribución Normal Estándar(Z)", subtitle = paste("media = ", media, "sd=", desv)) +
  labs(x = "X's", y= "Densidad")


# Distribución T Aproximada a Distribución Z Normal Stándard con 27 grados de libertad
denst.27  <- dt(x = x, df = n - 1)

# Se vuelve a generar la tabla
tabla <- data.frame(x = x, y = denst.27)

g2 <- ggplot(data = tabla, aes(x = x, y = denst.27)) +
  geom_point(colour = "red") +
  geom_line(colour = 'green') +
  ggtitle("Distribución T.", subtitle = paste(n-1, " grados de libertad")) +
  labs(x = "X's", y= "Densidad")

# Distribución T Aproximada a Distribución Z Normal Stándard con 5 grados de libertad

denst.5  <- dt(x = x, df = 5)

# Se vuelve a generar la tabla nuevamente
tabla <- data.frame(x = x, y = denst.5)

g3 <- ggplot(data = tabla, aes(x = x, y = denst.5)) +
  geom_point(colour = "red") +
  geom_line(colour = 'yellow') +
  ggtitle("Distribución T.", subtitle = paste(5, " grados de libertad")) +
  labs(x = "X's", y= "Densidad")

plot_grid(g1, g2, g3, nrow = 1, ncol = 3)

Construyendo una tabla con las tres distribuciones incluyendo los valores de \(x's\) y de las densidades juntas

# Gráficas juntas con una misma tabla
tabla <- data.frame(x, densn, denst.27, denst.5)

g4 <- ggplot(data = tabla) 
g4 <- g4 + geom_line(aes(x= x, y = densn), colour = "blue") 
g4 <- g4 + geom_line(aes(x= x, y = denst.27), colour = "green") 
g4 <- g4 + geom_line(aes(x= x, y = denst.5), colour = "yellow") 

g4 <- g4 + ggtitle("Densidad Normal Stándar(Z) y T", subtitle = paste("media = 0, sd = 1; ", (n-1)," y 5", " grados de libertadad") )
g4 <- g4 + labs(x = "X's", y= "Densidad")

g4

Mendenhall, William, Robert J. Beaver, and Barbara M. Beaver. 2010. Introducción a La Probabilidad y Estadística. 13th ed. Cengage Learning Editores, S.A. de C.V.,.