Variable respuesta: Puntaje verbal del SAT
Tipo: cuantitativa continua.
Variable explicativa (factor): Nivel educativo de los padres
Categorías:
Padres con licenciatura.
Padres con preparatoria.
Las observaciones corresponden a dos muestras independientes, ya que cada estudiante pertenece a un único grupo y no existe emparejamiento entre las observaciones. No se mide al mismo individuo más de una vez.
Debido a esto, el análisis adecuado es una comparación de medias poblacionales con muestras independientes.
Se definen los siguientes parámetros:
El parámetro principal de interés es la diferencia de medias poblacionales:
\[ \mu_1 - \mu_2 \]
Los siguientes estadísticos se obtienen directamente a partir de los datos de la tabla.
Tamaño muestral: \[ n_1 = 16 \] (obtenido contando el número de observaciones)
Media muestral: \[ \bar{x}_1 = 525 \] (calculada como el promedio aritmético de los puntajes)
Desviación estándar muestral: \[ s_1 = 59.4 \] calculada mediante: \[ s_1 = \sqrt{\frac{\sum (x_{1i} - \bar{x}_1)^2}{n_1 - 1}} \]
Tamaño muestral: \[ n_2 = 12 \]
Media muestral: \[ \bar{x}_2 = 487 \]
Desviación estándar muestral: \[ s_2 = 51.7 \] calculada como: \[ s_2 = \sqrt{\frac{\sum (x_{2i} - \bar{x}_2)^2}{n_2 - 1}} \]
Las desviaciones estándar \(s_1\) y \(s_2\) no son dadas por el problema, sino que se calculan a partir de los datos muestrales y estiman la variabilidad poblacional.
El estimador puntual del parámetro \(\mu_1 - \mu_2\) es:
\[ \bar{x}_1 - \bar{x}_2 = 525 - 487 = 38 \]
Este valor indica que, en la muestra, el puntaje promedio del grupo con padres con licenciatura es mayor en 38 puntos.
Dado que las muestras son independientes, el error estándar se calcula como:
\[ SE(\bar{x}_1 - \bar{x}_2) = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \]
Sustituyendo los valores obtenidos de la muestra:
\[ SE = \sqrt{\frac{59.4^2}{16} + \frac{51.7^2}{12}} \approx 21.1 \]
Este valor es un estadístico muestral, no un parámetro poblacional.
Como las desviaciones poblacionales son desconocidas, se utiliza un intervalo de confianza t de Student.
El intervalo de confianza del 95 % para \(\mu_1 - \mu_2\) está dado por:
\[ (\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \cdot SE \]
donde: - \(\alpha = 0.05\), - \(df \approx 26\) (grados de libertad aproximados por el método de Welch), - \(t_{0.025,26} \approx 2.06\) (obtenido de la tabla t).
Se plantean las siguientes hipótesis:
\[ H_0: \mu_1 = \mu_2 \]
\[ H_a: \mu_1 > \mu_2 \]
Se realiza una prueba t unilateral para dos muestras independientes.
El estadístico t se calcula como:
\[ t = \frac{\bar{x}_1 - \bar{x}_2}{SE} = \frac{38}{21.1} \approx 1.80 \]
Este valor se obtiene utilizando únicamente los estadísticos muestrales calculados previamente.
El valor-p corresponde al área a la derecha del estadístico observado bajo una distribución t con aproximadamente 26 grados de libertad:
\[ p \approx 0.04 \]
Este valor se obtiene a partir de la distribución t y no es dado directamente por el problema.
Con un nivel de significancia del 5 %, el análisis proporciona evidencia estadística de que la media poblacional del puntaje SAT verbal es mayor para estudiantes cuyos padres tienen licenciatura que para aquellos cuyos padres tienen preparatoria.