Calcular probabilidad de distribución T Student y evaluar hipótesis.
En el apartado de marco teórico, se da a conocer un panorama de la importancia de la distribución T Student.
En el desarrollo, se cargan librerías, datos y se calculan probabilidades de diversos ejercicios bajo la distribucón T Student
Se visualian la curva T Student
Se calculan probabilidades y se evalúan hipótesis de diversos ejercicios de una distribución T Student.
Existe una fórmula para calcular la densidad de distribuciones discretas
\[ t = \frac{(\bar{x}-\mu)}{s / \sqrt{n}} \]
\[ \bar{x} = \text{media muestral} \\ \mu = \text{media poblacional} \\ s = \text{desviación estándar de la muestra} \\ n = \text{número de elementos de la muestra} \] para muestras aleatorias de tamaño \(n\) desde una población normal (Mendenhall, Beaver, and Beaver 2010).
El numerador representa la diferencia a probar y el denominador la desviación estándar de la diferencia llamado también Error Estándar.
En esta fórmula \(t\) representa al valor estadístico que se estará buscando \(\bar{x}\)es el promedio de la variable analizada de la muestra, y \(\mu\) es el promedio poblacional de la variable a estudiar.
En el denominador se tiene a \(s\) como representativo de la desviación estándar de la muestra y \(n\) el tamaño de ésta.
El número de grados de libertad es igual al tamaño de la muestra \(n\) (número de observaciones independientes) menos 1.
\[ gl = df = (n – 1) \\ \therefore \\ df = \text{grados de libertad} \\ n = \text{total de elementos de la muestra de t} \]
La T Student tiene estas características:
Tiene forma de montículo o campana de gauss y es simétrica alrededor de \(t = 0\), igual que \(z\) la normal stándar.
Es más variable que \(z\), con “colas más pesadas”; esto es, la curva \(t\) no aproxima al eje horizontal con la misma rapidez que \(z\). Esto es porque el estadístico \(t\) abarca dos cantidades aleatorias, \(\bar{x}\) y \(s\), en tanto que el estadístico \(z\) tiene sólo la media muestral, \(\bar{x}\). Ver curvas de T Student y Normal Stándard.
La forma de la distribución \(t\) depende del tamaño muestral \(n\). A medida que \(n\) aumenta, la variabilidad de \(t\) disminuye porque la estimación \(s\) de \(\sigma\) está basada en más y más información.
Cuando \(n\) sea infinitamente grande, las distribuciones \(t\) y \(z\) son idénticas.
library(dplyr)
library(mosaic)
library(readr)
library(ggplot2) # Para gráficos
library(knitr) # Para formateo de datos
library(cowplot) #Imágenes en el mismo renglón
options(scipen=999) # Notación normal
Gráfica de campana normal Stándar y T Student
Se presenta una muestra pequeña de 28 valores, se generan valores de una secuencia alrededor de cero, esto se hace porque la distribución T Student, los valores de la variable aleatoria \(x\) se centran con media igual a cero y por supuesto desviación igual a \(1\).
Se construyen gráficas:
g1 es una distribución normal estándar,
g2 distribución t student con 27 grados de libertad,
g3 t student con 10 grados de libertad y
Se visualizan las tres gráficas con una forma de campana o gauss, simétricas, solo que la distribución \(t\) se achata en relación a la distribución normal estándar \(z\) y se observa diferencia de dispersión con los grados de libertad en las gráficas \(t\).
# Grafica Normal con media igual a cero y desv igual a 1
n <- 28
x <- seq(from = -3, to = 3, length.out = n)
media <- round(mean(x),2)
desv <- round(sd(x), 2)
densn <- dnorm(x = x, mean = media, sd = desv)
tabla <- data.frame(x = x, y = densn)
#tabla.normal
g1 <- ggplot(data = tabla, aes(x = x, y = densn)) +
geom_point(colour = "red") +
geom_line(colour = 'blue') +
ggtitle("Distribución Normal Estándar(Z)", subtitle = paste("media = ", media, "sd=", desv)) +
labs(x = "X's", y= "Densidad")
# Distribución T Aproximada a Distribución Z Normal Stándard con 27 grados de libertad
denst.27 <- dt(x = x, df = n - 1)
# Se vuelve a generar la tabla
tabla <- data.frame(x = x, y = denst.27)
g2 <- ggplot(data = tabla, aes(x = x, y = denst.27)) +
geom_point(colour = "red") +
geom_line(colour = 'green') +
ggtitle("Distribución T.", subtitle = paste(n-1, " grados de libertad")) +
labs(x = "X's", y= "Densidad")
# Distribución T Aproximada a Distribución Z Normal Stándard con 5 grados de libertad
denst.5 <- dt(x = x, df = 5)
# Se vuelve a generar la tabla nuevamente
tabla <- data.frame(x = x, y = denst.5)
g3 <- ggplot(data = tabla, aes(x = x, y = denst.5)) +
geom_point(colour = "red") +
geom_line(colour = 'yellow') +
ggtitle("Distribución T.", subtitle = paste(5, " grados de libertad")) +
labs(x = "X's", y= "Densidad")
plot_grid(g1, g2, g3, nrow = 1, ncol = 3)
Construyendo una tabla con las tres distribuciones incluyendo los valores de \(x's\) y de las densidades juntas
# Gráficas juntas con una misma tabla
tabla <- data.frame(x, densn, denst.27, denst.5)
g4 <- ggplot(data = tabla)
g4 <- g4 + geom_line(aes(x= x, y = densn), colour = "blue")
g4 <- g4 + geom_line(aes(x= x, y = denst.27), colour = "green")
g4 <- g4 + geom_line(aes(x= x, y = denst.5), colour = "yellow")
g4 <- g4 + ggtitle("Densidad Normal Stándar(Z) y T", subtitle = paste("media = 0, sd = 1; ", (n-1)," y 5", " grados de libertadad") )
g4 <- g4 + labs(x = "X's", y= "Densidad")
g4