Análisis estadístico de puntajes SAT verbal

Variables

  • Variable respuesta: Puntaje verbal del SAT

  • Tipo: cuantitativa continua.

  • Variable explicativa (factor): Nivel educativo de los padres

  • Categorías:

  • Padres con licenciatura.

  • Padres con preparatoria.


Tipo de muestra

Las observaciones corresponden a dos muestras independientes, ya que cada estudiante pertenece a un único grupo y no existe emparejamiento entre las observaciones. No se mide al mismo individuo más de una vez.

Debido a esto, el análisis adecuado es una comparación de medias poblacionales con muestras independientes.


Parámetros poblacionales de interés

Se definen los siguientes parámetros:

  • \(\mu_1\): media poblacional del puntaje SAT verbal de estudiantes cuyos padres tienen licenciatura.
  • \(\mu_2\): media poblacional del puntaje SAT verbal de estudiantes cuyos padres tienen preparatoria.

El parámetro principal de interés es la diferencia de medias poblacionales:

\[ \mu_1 - \mu_2 \]


Estadísticos muestrales y origen de los datos

Los siguientes estadísticos se obtienen directamente a partir de los datos de la tabla.

Padres con licenciatura

  • Tamaño muestral: \[ n_1 = 16 \] (obtenido contando el número de observaciones)

  • Media muestral: \[ \bar{x}_1 = 525 \] (calculada como el promedio aritmético de los puntajes)

  • Desviación estándar muestral: \[ s_1 = 59.4 \] calculada mediante: \[ s_1 = \sqrt{\frac{\sum (x_{1i} - \bar{x}_1)^2}{n_1 - 1}} \]

Padres con preparatoria

  • Tamaño muestral: \[ n_2 = 12 \]

  • Media muestral: \[ \bar{x}_2 = 487 \]

  • Desviación estándar muestral: \[ s_2 = 51.7 \] calculada como: \[ s_2 = \sqrt{\frac{\sum (x_{2i} - \bar{x}_2)^2}{n_2 - 1}} \]

Las desviaciones estándar \(s_1\) y \(s_2\) no son dadas por el problema, sino que se calculan a partir de los datos muestrales y estiman la variabilidad poblacional.


Estimación puntual de la diferencia de medias

El estimador puntual del parámetro \(\mu_1 - \mu_2\) es:

\[ \bar{x}_1 - \bar{x}_2 = 525 - 487 = 38 \]

Este valor indica que, en la muestra, el puntaje promedio del grupo con padres con licenciatura es mayor en 38 puntos.


Error estándar de la diferencia de medias

Dado que las muestras son independientes, el error estándar se calcula como:

\[ SE(\bar{x}_1 - \bar{x}_2) = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \]

Sustituyendo los valores obtenidos de la muestra:

\[ SE = \sqrt{\frac{59.4^2}{16} + \frac{51.7^2}{12}} \approx 21.1 \]

Este valor es un estadístico muestral, no un parámetro poblacional.


Intervalo de confianza para la diferencia de medias

Como las desviaciones poblacionales son desconocidas, se utiliza un intervalo de confianza t de Student.

El intervalo de confianza del 95 % para \(\mu_1 - \mu_2\) está dado por:

\[ (\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \cdot SE \]

donde: - \(\alpha = 0.05\), - \(df \approx 26\) (grados de libertad aproximados por el método de Welch), - \(t_{0.025,26} \approx 2.06\) (obtenido de la tabla t).


Prueba de hipótesis

Se plantean las siguientes hipótesis:

\[ H_0: \mu_1 = \mu_2 \]

\[ H_a: \mu_1 > \mu_2 \]

Se realiza una prueba t unilateral para dos muestras independientes.


Estadístico de prueba

El estadístico t se calcula como:

\[ t = \frac{\bar{x}_1 - \bar{x}_2}{SE} = \frac{38}{21.1} \approx 1.80 \]

Este valor se obtiene utilizando únicamente los estadísticos muestrales calculados previamente.


Valor-p

El valor-p corresponde al área a la derecha del estadístico observado bajo una distribución t con aproximadamente 26 grados de libertad:

\[ p \approx 0.04 \]

Este valor se obtiene a partir de la distribución t y no es dado directamente por el problema.


Interpretación

Con un nivel de significancia del 5 %, el análisis proporciona evidencia estadística de que la media poblacional del puntaje SAT verbal es mayor para estudiantes cuyos padres tienen licenciatura que para aquellos cuyos padres tienen preparatoria.