Distribución muestral de la diferencia de medias de dos poblaciones normales independientes.

Jorge Luis Villalba Acevedo

Primer caso: varianzas pobalcionales conocidas o desconocidas y muestras grandes.

Teorema

Sean $ \bar{x}_{1} $ y $ \bar{x}_{2} $ las medias de muestras aleatorias de independientes de tamaños $ n_{1} $ y $ n_{2} $ de poblaciones con medias $ \mu_{1} $ , $ \mu_{2} $ y varianzas $ \sigma^{2}_{1} $ , $ \sigma^{2}_{2} $, respectivamente. Supongamos que se cumpla alguna de las siguientes condiciones:

a) Ambas poblaciones son normales y ambas varianzas poblacionales $ \sigma^{2}_{1} $ y $ \sigma^{2}_{2} $ son conocidas;

b) Ambas poblaciones son desconocidas o no normales, ambas varianzas poblacionales $ \sigma^{2}_{1} $ y $ \sigma^{2}_{2} $ son conocidas o desconcidas y $ n_{1} + n_{2} > 30 $.

Entonces, la distribución muestral de la diferencia entre dos medias muestrales estará distribuida normalmente y tendrá una media igual a $ \mu_{1} - \mu_{2} $ y una varianza $ \frac{\sigma^{2}_{1}}{n_{1}} + \frac{\sigma^{2}_{2}}{n_{2}} $.

Luego la variable aleatoria.

Si $ \sigma_{1} $ y $ \sigma_{2} $ son conocidas.

\[ Z = \frac {(\bar{X}_{1} - \bar{X}_{2}) - (\mu_{1} - \mu_{2})}{\sqrt{\frac{\sigma^{2}_{1}}{n_{1}} + \frac{\sigma^{2}_{2}}{n_{2}}}} \approx N(0,1) \].

Si $ \sigma_{1} $ y $ \sigma_{2} $ son desconocidas.

\[ Z = \frac {(\bar{X}_{1} - \bar{X}_{2}) - (\mu_{1} - \mu_{2})}{\sqrt{\frac{S^{2}_{1}}{n_{1}} + \frac{S^{2}_{2}}{n_{2}}}} \approx N(0,1) \]

Ejercicio 1.

Para comparar los pesos promedios de niñas y niños de sexto grado en una escuela de instrucción media, se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que, en niños y niñas, los pesos siguen una distribución normal. En concreto, el promedio de los pesos de todos los niños de sexto grado de esa escuala es de 100 libras y su desviación estandar es de 14,142, mientras que el promedio de los pesos de todas las niñas de todas las niñas del sexto grado es de 85 libras y su desviación estándar es de 12,247. Encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea almenos 20 libras más grande que el de las 25 niñas.

Ejercicio 2.

Con objeto de estudiar si existen diferencias significaticas en la longitud (en mm.) del cuerpo de dos poblaciones de rana pipiens, geográficamente aisladas, se tomó un muestra aleatoria simple de individuos machos en cada una de las dos poblaciones obteniéndose los siguientes resultados $ n_{1} =65 $, $ \bar{x}_{1} = 75$, $ S^{2}_{1} = 225 $ $ n_{2} =35 $, $ \bar{x}_{1} = 79 $, $ S^{2}_{2} = 195 $. La probabilidad de que la diferencia de las medias muestrales estime la diferencia de medias poblacionales con un error mayor de 2 mm será,

\[ P(|(\bar{x}_{1} - \bar{x}_{2}) - (\mu_{1} - \mu_{2}) | > 2) \]

Ejercicio 3.

Se identificaron dos poblaciones de estudiantes de último año de un colegio. La variable de interés en la investigación consistía en los puntajes obtenidosen una prueba de rendimiento en estadística, que hicieron los estudiantes de las dos poblaciones. Los investigadores suponían que los puntajes de las dos poblaciones estaban distribuidos normalmente con las siguientes medias y varianzas: $ \mu_{1} = 50 $, $ \sigma^{2}_{1} = 40 $, $ \mu_{2} = 40 $, $ \sigma^{2}_{2} = 60 $. Al tomar una muestra aleatoria de tamaño $ n_{1} = 10 $ de la población 1 y otra de tamaño $ n_{2} = 12 $ de la población 2, ¿cuál es la probabilidad de que la diferencia entre las medias muestrales se halle entre 5 y 15?

Segundo caso: varianzas pobalcionales desconocidas, iguales y muestras pequeñas.

Teorema

Si $ \sigma^{2}_{1} $ y $ \sigma^{2}_{2} $ son iguales y desconocidas, entonces, la distribución muestral de la media tiene media $ \mu_{1} - \mu_{2} $ y varianza estimada igual a $ \sqrt{\frac{S^{2}}{n_{1}} + \frac{S^{2}}{n_{2}}} $, siendo, $ S^{2} =\frac{(n_{1} -1)S^{2}_{1} +(n_{2} -1)S^{2}_{2} }{n_{1} + n_{2} - 2 } $ la varianza muestral combinada. Además, si las dos poblaciones en cuestión son normales y las tamaños de las muesras son pequeños $ (n_{1} +n_{2} \le 30) $

\[ t = \frac {(\bar{X}_{1} - \bar{X}_{2}) - (\mu_{1} - \mu_{2})}{ \sqrt{\frac{(n_{1} -1)S^{2}_{1} +(n_{2} -1)S^{2}_{2} }{n_{1} + n_{2} - 2 } } \sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}} \approx t_{n_{1}+n_{2}-2} \].

Ejercicio 4

Suponga que dos drogas, $ A $ y $ B $, de las que se dice reducen el tiempo de respuesta de las ratas a determinado estímulo, se están comprando en un experimento de laboratorio. El experimentador sabe que en las respectivas poblaciones los tiempos de respuestas al estímulo están distribuidos normalmente. Se administra la droga $ A $ a 12 ratas y la dorga $ B $ a 13. Cuando se lleva a cabo el experimento, la reducción promedio de tiempo de respuesta al estimulo por parte de las ratas que estan recibiendo la droga $ A $ es 30,45 $ ms $ con una desviación tipica de 5 $ ms $. Los datos correpondiente a la droga $ B $ son 24,9 y 6 $ ms $. ¿Cuál es la probabilidad de que la diferencia entre la reducción promedio de tiempo de respuesta al estimulo por parte de las ratas que estan recibiendo la droga $ A $ y la de las ratas que estan recibiendo la droga $ B $ sea menor o igual a la observada al experimento?. Suponga que no hay diferencia alguna entre las dos drogas con respecto a la reducción promedio en tiempos de repuestas y que las dorgas son igualmente efectivas con varianza poblacional igual.

Tercer caso: varianzas pobalcionales desconocidas, diferentes y muestras pequeñas.

Teorema

Si $ \sigma^{2}_{1} $ y $ \sigma^{2}_{2} $ son diferentes y desconocidas, entonces, la distribución muestral de la media tiene media $ \mu_{1} - \mu_{2} $ y varianza estimada igual a $ \sqrt{\frac{S^{2}_{1}}{n_{1}} + \frac{S^{2}_{2}}{n_{2}}} $. Además, si las dos poblaciones en cuestión son normales y los tamaños de las muestras son pequeños (es suficiente considerar que sean estrictamente menores que 30), entonces, la variable aleatoria

\[ t = \frac {(\bar{x}_{1} - \bar{x}_{2}) - (\mu_{1} - \mu_{2})}{ \sqrt{\frac{S^{2}_{1}}{n_{1}} + \frac{S^{2}_{2}}{n_{2}}}} \approx t_{v} \].

donde

\[ v = \frac{ \left( \frac{S^{2}_{1}}{n_{1}} + \frac{S^{2}_{2}}{n_{2}} \right)^{2}} {\frac{(S^{2}_{1}/n_{1})^{2}}{n_{1} - 1} + \frac{(S^{2}_{2}/n_{2})^{2}}{n_{2} - 1}} \]

Ejercicio 5

Retomemos el ejercicio 4 , pero ahora suponiendo que las varianzas poblacionales son diferenctes.

Datos pareados (muestras dependientes)

Teorema:

Supongamos que disponemos de una muestra aleatorias de datos pareados procedenres de distribuciones con medias $ \mu_{1} $ y $ mu_{2} $. Sean, así, $ \bar{d} $ y $ S_{d} $ la media y la desviación estándar muestral para las $ n < 30 $ diferencias $ d_{i} = x_{i} - y_{i} $. Si se asume que la distribución de las diferencias es normal, entonces la distribución muestral del $ \bar{D} = X_{i} - Y_{i} $ es la $ t $ de Student con $ n -1 $ grados de libertad.

Este teorema implica que la variable aleatoria $ t = \frac{\bar{D} - \mu_{\bar{D}} } {\sigma_{\bar{D}} } \approx t_{n-1} $

en donde es

$ \bar{D} = \frac{1}{n} \displaystyle\sum_{i=1}^{n}(X_{i} - Y_{i}) = \bar{x} -\bar{y} $ y

$ \sigma_{\bar{D}} = S_{d}/\sqrt{n} $ con

$ S^{2}_{d} = \frac{1}{n-1} \displaystyle\sum_{i=1}^{n}(X_{i} - Y_{i} - \bar{d})^2 = \frac{\displaystyle\sum_{i=1}^{n} d_{i}^{2} - n \bar{d} }{n-1} $

Ejercicio 6

La tabla de abajo recoge los datos de consumo de gasolina correspondientes a una nuetra aleatoria de 8 automóviles norteamericanos de dos modelos diferentes. Se formaron pares con las dos muestras y cada elemento de un determinado par fue conducido por la misma ruta y por el mismo piloto.

$ X_{i}(auto A) = 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4 $
$ Y_{i}(auto B) = 19.6 17.5 18.4 17.5 18.0 20.0 18.8 19.2 $

a) Determine la media y la desviación muestral de las diferencias en el consumo de gasolina.

b) Suponiendo que la distribución de las diferencias poblacionales es normal con media -0.807, encuentre la probabilidad de que el consumo promedio de gasolina del auto $ A $ sea mayor que el del auto $ B $.

https://support.rstudio.com/hc/en-us/articles/200486468.

Distribución muestral de la diferencia de medias de dos poblaciones normales independientes.

**Primer caso: varianzas pobalcionales conocidas o desconocidas y muestras grandes.**

Teorema

Ejercicio 1.

Ejercicio 2.

Ejercicio 3.

Segundo caso: varianzas pobalcionales desconocidas, iguales y muestras pequeñas.

Teorema

Ejercicio 4

Tercer caso: varianzas pobalcionales desconocidas, diferentes y muestras pequeñas.

Teorema

Ejercicio 5

Datos pareados (muestras dependientes)

Ejercicio 6

Primer caso: varianzas pobalcionales conocidas o desconocidas y muestras grandes.