Intervalos de confianza II

Maestría en Gobierno y Políticas Públicas

Diego Solís Delgadillo

Distribución t

¿Qué es la Distribución t de Student?

  • Es una distribución de probabilidad que se usa cuando el tamaño de la muestra es pequeño y la desviación estándar poblacional es desconocida.
  • Similar a la distribución normal, pero con colas más gruesas.
  • Se define por grados de libertad \((df)\), que dependen del tamaño de la muestra.

📌 Fórmula de la estadística t:

\[ t = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}} \] Donde:

  • \(\bar{x}\) = media muestral

  • \(\mu\) = media poblacional

  • \(s\) = desviación estándar muestral

  • \(n\) = tamaño de la muestra

¿Cuando utilizar la distribución t?

Usos distribución t

✔ Cuando \(n\) es pequeño \(( n < 30)\) y no conocemos la desviación estándar poblacional.
✔ Se usa en pruebas de hipótesis como la prueba t para una muestra y la prueba t para dos muestras.
✔ A medida que \(n\) aumenta, la distribución t se aproxima a la normal estándar \((Z)\).

Distribución t

  • Es utilizada cuando tenemos muestras pequeñas

Tip

  • Si utilizamos los valores z con muestras pequeñas el error estándar es muy grande
  • Por ello sustituimos el valor \(Z\) por el valor \(t\)

📊 Comparación: Distribución t vs. Distribución Z

Característica Distribución Z (Normal Estándar) Distribución t
Forma Campana simétrica Similar, pero con colas más gruesas
Uso Tamaño de muestra grande Tamaño de muestra pequeño
Varianza Se conoce (\(\sigma\)) No se conoce (\(s\)) se estima)
Grados de libertad No aplica \(df = n - 1\)
Convergencia Se mantiene igual Se aproxima a \(Z\) cuando \(n \to \infty\)

Comparación

Colas Gruesas en la Distribución t

¿Qué significa que la distribución t tenga colas más gruesas?

  • La distribución t de Student tiene colas más gruesas que la normal estándar (\(Z\)).
  • Esto significa que hay mayor probabilidad de valores extremos en comparación con la distribución normal.
  • Cuanto menores sean los grados de libertad (\(df\)), más gruesas serán las colas.

🔍 ¿Por qué ocurre esto?

  • Cuando trabajamos con muestras pequeñas, hay más incertidumbre sobre la estimación de la media y la desviación estándar.
  • Esta incertidumbre hace que la distribución tenga más dispersión en los valores extremos.
  • Con muestras más grandes (\(n \to \infty\)), la distribución t se aproxima a la normal estándar.

Efecto grados de libertad

Tip

  • Entre más grados de libertad, la distribución \(t\) se parece más a la normal estandarizada

¿Qué son los Grados de Libertad?

Definición de Grados de Libertad (df)

  • Los grados de libertad representan la cantidad de valores independientes que pueden variar en un cálculo estadístico.
  • Se usan en muchas distribuciones, como la t de Student,chi-cuadrada \((\chi^2 )\) y F.

Ejemplo grados de libertad

Repartiendo Calificaciones

  • 📌 Imagina que tienes 5 estudiantes y el promedio de sus calificaciones debe ser 80.
Estudiante Calificación
A 78
B 82
C 79
D 81
E

💡 Pregunta: ¿Cuántas calificaciones puedes elegir libremente?

✔ Puedes asignar libremente las 4 primeras calificaciones.
✔ La quinta calificación está determinada automáticamente por la condición del promedio.

✔ Por lo tanto, los grados de libertad son \(df = 5 - 1 = 4\).

Tabla \(t\)

Tip

  • Muestra los valores a distintos niveles de confianza

  • Expresados como \(t_{.100}\), \(t_{.050}\), \(t_{.025}\), \(t_{.010}\)

  • Lo que indican es la probabilidad de la cola derecha de la distribución

  • Si tenemos 6 grados de libertad y queremos un intervalo de 95%
  • El valor \(t\) es 2.446
  • El intervalo paa este punto sería

\[ \bar{x} \pm 2.446(se) \]

Ejemplo

  • Tenemos una muestra de 11 personas que participan en una subasta en Ebay
  • Los valores son: 570, 620, 610, 590, 540, 590, 565, 590, 580, 570, 595
  • Su desviación estándar es 14.40
  • ¿Cuál es su intervalo de confianza?

Calculo Error Estándar

\(\bar{x} = 583.63\)

  • Error estándar \[ se= \frac{14.40}{\sqrt{11}}= 4.34 \]

Intervalo de confianza

  • Intervalo de confianza al 95% con 10 grados de libertad

\[\bar{x} \pm 2.22(se)\] \[583.63 \pm 2.22(4.34) \]

Tip

  • Límite superior= 593.26
  • Límite inferior= 574

Tamaño de la muestra

Important

  • El tamaño de una muestra depende de la precisión que se busque
  • El número de personas incluidas depende del margen de error
  • El margen de error depende del error estándar
  • El error estándar depende del tamaño de la muestra

Tamaño de la muestra para proporción

Tip

  • Primero debemos decidir el margen de error que deseamos

  • Debemos señalar a qué nivel de confianza queremos alcanzar

Important

  • Comúnmente se usa el 95%

¿Qué tamaño de muestra?

Tip

  • Queremos hacer una encuesta de salida de una elección
  • Queremos un estimado de la proporción de personas que votaron por los candidatos
  • La encuesta más reciente ubica al candidato A con 58% y al B con 42%
  • Decidimos que el margen de error deseado es 4% (0.04)

Cálculo tamaño muestra

Tip

  • Sabemos que el margen de error con un intervalo de confianza es el producto de \[ \hat{p} \pm 1.96(se)=0.04 \]

Note

Sustituyendo con la fórmula del error estándar

\[ \hat{p} \pm 1.96(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}})=0.04 \]

Despeje

  • Igualando el margen de error a 0.04: \[ 1.96 \left( \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \right) = 0.04 \]
  • Paso 2: Despejar la raíz cuadrada Dividiendo ambos lados por 1.96: \[ \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \frac{0.04}{1.96} \]

Despeje

  • Elevando al cuadrado ambos lados: \[ \frac{\hat{p}(1-\hat{p})}{n} = \left( \frac{0.04}{1.96} \right)^2 \]

  • Despejar el tamaño de muestra (n) Reordenando la expresión para despejar (n): \[ n = \frac{\hat{p}(1-\hat{p})}{\left( \frac{0.04}{1.96} \right)^2} \]

Despeje

Paso 4: Simplificación - Utilizando la notación general para el nivel de confianza y margen de error: \[ n = \frac{z^2 \cdot \hat{p}(1-\hat{p})}{m^2} \]

Tip

  • Al momento de despejar la operación llegamos a la siguiente fórmula \[ n= \frac{z^2(\hat{p}(1-\hat{p}))}{m^2} \]

Important

  • Sustituyendo

\[ n= \frac{1.96^2(\hat{p}(1-\hat{p}))}{0.04^2} \]

Tip

  • Pero nosotros desconocemos el valor de \(\hat{p}\) antes de levantar la encuesta

  • Hacemos una estimación informada de \(\hat{p}\)

  • Si en la última encuesta el candidato A obtuvo 58% podemos utilizar esta información

\[ n= \frac{1.96^2(0.58(1-0.58))}{0.04^2}= 584.88 \]

Tamaño de la muestra sin información de \(\hat{p}\)

Important

  • En ocasiones puede no existir información previa que nos oriente sobre el valor de \(\hat{p}\)
  • El producto \(\hat{p}(1-\hat{p})\) tiene un valor máximo de 0.25
  • Ese valor se obtiene cuando \(\hat{p}\) es igual a 0.50
  • Cuando no tenemos información tomamos a 0.50 como el valor de \(\hat{p}\)

Tamaño de la muestra para la media

Tip

  • Primero determinamos el intervalo de confianza deseado (95%)

\[ \bar{x} \pm t_{.025}(se) \]

  • Sustituyendo el error estádar

\[ \bar{x} \pm t_{.025}(\frac{s}{\sqrt{n}}) \]

Warning

  • Hay varias limitaciones
  • No conocemos los grados de libertad
  • Y desconocemos la desviación estándar de la muestra

Important

  • Sabemos que en muestras mayores a 30 la distribución \(t\) es muy similar a la distribución \(z\)
  • Utilizamos valores \(z\)

\[ n= \frac{\sigma^2z^2}{m^2} \]

Warning

  • No conocemos \(\sigma\) y podemos hacer dos cosas: tomar la desviación de algún estudio similar
  • O hacer una muestra piloto para estimarla

Ejemplo

Tip

  • Queremos conocer en una comunidad el número de años de estudio completados por los habitantes
  • No tenemos información previa
  • Pero podemos pensar que el rango puede ir de 0 a 18 años

Note

  • Si esta tiene una distribución normal entonces todos los casos estarán contenidos en \(\mu+3\sigma\) 𝒚 \(\mu-3\sigma\)

  • Entonces hay seis desviaciones estándar en total
  • Dividiendo 18/6 obtenemos un estimado de \(\sigma\)
  • Quiero un margen de error de un año

\[ n= \frac{\sigma^2z^2}{m^2} n= \frac{(3^2)(1.96^2)}{1^2}= 34.57 \]

image/svg+xml