Distribución t-Student


Santiago OtƔvaro Garcƭa 1

1 Pontificia Universidad Javeriana de Cali
2 30 de Septiembre del 2025
3 Clase de probabilidad y estadistica

Introducción

La distribución t student es una distribucion de probabilidad usada en casos especificos, especialmente cuando se trabaja con muestras de tamaño menor a 30 y no se conoce una varianza pobacional.Es muy parecida a la distribución normal pero, al tener varianza desconocida, se le asignan mas probabilidad a valores extremos.Esta depende del grado de libertad.

Origen

Sealy Gosset, un matematico estadistico y quimico ingles crea la distribución t-Student, y la publica en el aƱo 1908 publicando un articulo ā€œthe probable error of a meanā€ Gosset no pudo titular esta distribución a su nombre debido a que Ć©l publico esta distribución estando afiliado a una empresa por lo que opto por usar el pseudonimo t-Student.

La t de Student, inicialmente se diseñó para examinar las diferencias entre dos muestras independientes y pequeñas que tengan distribución normal y homogeneidad en sus varianzas (en el artículo original, el autor no define qué es una muestra grande y/o pequeña). Gosset hace hincapié en la normalidad de las dos muestras como crucial en el desarrollo de la prueb

Caracteristicas principales

Esta distribución se caracteriza por: Poseer una formulación de hipotesis nula e hipotesis alterna,que establece que no hay diferencias en la media de las dos muestras independientes y que de existir esta diferencia, sólo se debe al azar. Es una distribución continua y simĆ©trica Media debe ser igual a 0, siempre que los grados de libertad sean ā€œgl>1ā€, Para los grados de libertad > a 2: \[ \text{var}(t)=\frac{gl}{gl-2}, \quad gl >2 \] Cuando gl es infinito, la distribución t tiende a ser una distribución normal estandar N(0,1). Para realizar una distribución t-Student optima debemos seguir los siguientes pasos:

  1. Probar que cada una de las muestras tiene una distribución normal 2.0 Obtener para cada una de las muestras: 2.1) el tamaño de las muestras (n1 y n2), 2.2) sus respectivas medias (m1 y m2), 2.3) sus varianzas (v1 y v2); 3. Probar que las varianzas sean homogéneas. En caso de homogeneidad en esas varianzas: a) establecer la diferencia entre las medias: m1-m2, b) calcular la varianza común de las dos muestras con la siguiente formula \[ vc = \frac{(n_1 - 1)v_1 + (n_2 - 1)v_2}{n_1 + n_2 - 2} \]

Ejemplo grafico:

Ejemplo:

De un universo de 44,000 niños, a los que se les registró el peso, talla e índice de masa corporal, se tomó una muestra de 56 adolescentes (21 niñas y 35 niños), del subgrupo de niñas y niños de 14 años de edad, para comparar las medias tomando exclusivamente el índice de masa corporal.

Creamos las hipotesis: **H0: El IMC es igual en niƱos y en niƱas.

**H1: El IMC es diferentes en niƱos y en las niƱas.

prueba de normalidad

Datos iniciales:
- NiƱas: \(n_1 = 21\), \(\bar{x}_1 = 21.775\), \(v_1 = 17.852\)
- NiƱos: \(n_2 = 35\), \(\bar{x}_2 = 20.850\), \(v_2 = 14.428\)

Varianza comĆŗn

\[ vc = \frac{(n_1 - 1)v_1 + (n_2 - 1)v_2}{n_1 + n_2 - 2} = \frac{20 \times 17.852 + 34 \times 14.428}{54} = 15.696 \]

Error estƔndar de la diferencia de medias

\[ ESM = \sqrt{ vc \left(\frac{n_1 + n_2}{n_1 n_2}\right) } = \sqrt{ 15.696 \times \frac{56}{735} } = 1.094 \]

EstadĆ­stico t

\[ t = \frac{\bar{x}_1 - \bar{x}_2}{ESM} = \frac{0.925}{1.094} = 0.846 \]

Con \(gl = 54\), se obtiene un valor \(p = 0.401\).
Por lo tanto, no existe diferencia significativa en el IMC entre niƱas y niƱos de 14 aƱos.

##Aplicaciones

Esta distribución sirve mucho para casos hipoteticos en las que no conocemos una varianza poblacional notoria. Con esta distribucion podemos hacer comparativos entre dos muestras independientes como el ejemplo ya mencionado en el que se compara el imc de hombres y mujers.Permitegenerar intervalos de confianza. todo esto es altamente util para areas como la Biología (Mi area) en donde, gracias a esta distribución podemos comparar valores bioquimicos enzimaticos entre especies de x individuos que procesan la glucosa de manera distinta.A su vez, por el lado de la quimica, podemos determinar en una reacción si un reactivo genera diferencias significativas en una reacción.

Relación entre distribuciones univariadas

Al leer el articulo nos podemos dar cuenta que nos hablan de la forma en como surgen las formulas y como muchas de las formulas mas complejas surgen de la simplicidad de otras con utilidad para casos muy especificos. Para t-student al parecer surge de la distribucion n grados de libertad que se define como: \[ T = \frac{Z}{\sqrt{\chi^2(n)/n}}, \quad Z \sim N(0,1), \; \chi^2(n) \text{ independiente} \] En donde Z se aproxima a parecer N(Normal estandar) y el chi cuadrado me define los grados de libertad

Como ya habiamos mencionado antes, cuando la t-Student tiende a infinito, la distribucion tiende a la distribución normal estÔndar.

Todo lo que debes saber sobre la distribucion t-Student