Logo FCA Logo UNCA

Cátedra de Biometría y Técnica Experimental

_______________________________________________________________________________________________________

Trabajo Práctico N° 8: Prueba de Hipótesis II


Autores: Prof. Adj. Ing. Agr. Esp. Sebastian Bustos
         JTP Ing. Agr. Arnaldo Romero

Contacto: estadistica@agrarias.unca.edu.ar


Motivación


A continuación, se describen los estadísticos de prueba y los intervalos de confianza que veremos en el desarrollo del espacio curricular para comparar dos poblaciones.

Pruebas de hipótesis para dos poblaciones

Caso 1. Prueba de Hipótesis para las varianzas poblacionales

El estadístico de prueba para comparar las varianzas mediante la prueba de Fisher:

\[ {F = \frac{\frac{S_1^2}{\sigma_1^2}}{\frac{S_2^2}{\sigma_2^2}} \sim F_{[(n_1 - 1)(n_2 - 1)]}} \]


Donde:

  • \(s_1^2\) y \(s_2^2\): varianzas muestrales de las dos muestras que se comparan

  • \(\sigma_1^2\) y \(\sigma_2^2\): varianzas poblacionales de las dos muestras que se comparan.

  • \(n_1 - 1\): grados de libertad de la muestra 1.

  • \(n_2 - 1\): grados de libertad de la muestra 2.


Intérvalo de confianza para la diferencia de varianzas poblacionales

\[ \boxed{ \large{ \left( \frac{s_1^2}{s_2^2} \right) \cdot \frac{1}{F_{\alpha/2, \text{df}_2, \text{df}_1}}, \quad \left( \frac{s_1^2}{s_2^2} \right) \cdot F_{\alpha/2, \text{df}_1, \text{df}_2} } } \]

\[ \boxed{ \large{ P\left( \frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{\alpha/2, \text{df}_2, \text{df}_1}} < \sigma_1^2 - \sigma_2^2 < \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2, \text{df}_1, \text{df}_2} \right) = 1 - \alpha } } \]

Caso 2. Prueba de Hipótesis para la diferencia de medias poblacionales con varianza conocida

Para probar la diferencia de medias poblacionales con varianza conocida, el estadístico de prueba es:

\[{Z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)} \]


Donde:

  • \(\bar{x}_1\) y \(\bar{x}_2\): medias muestrales

  • \(\mu_1\) y \(\mu_2\): medias poblacionales

  • \(\sigma_1^2\) y \(\sigma_2^2\): varianzas poblacionales

  • \(n_1\) y \(n_2\): tamaños muestrales

Bajo la hipótesis nula de no diferencia, el estadístico \( Z \) ~ N(0;1).


Intérvalo de confianza para la diferencia de medias poblacionales con varianza conocida

\[ \boxed{ \large{\bar{x}_1 - \bar{x}_2 \pm Z \cdot \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} } \]


Caso 3.a. Prueba de Hipótesis para la diferencia de medias poblacionales con varianzas desconocidas y homogéneas

\[ {t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2) }{\sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2} \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}} \sim t_{(n_1 + n_2 - 2)}} \]


Donde:

  • \(\bar{x}_1\) y \(\bar{x}_2\): medias muestrales

  • \(\mu_1\) y \(\mu_2\): medias poblacionales

  • \(S_1^2\) y \(S_2^2\): varianzas muestrales

  • \(n_1\) y \(n_2\): tamaños muestrales

  • Varianza combinada:\[ \Large \boxed{S_p^2 = \frac{(n_1 - 1) \cdot S_1^2 + (n_2 - 1) \cdot S_2^2}{n_1 + n_2 - 2}} \]


Intervalo de Confianza para la diferencia de medias (varianzas desconocidas y homogeneas)

\[ \boxed{ \large{ (\bar{X}_1 - \bar{X}_2) \pm t_{(1 - \alpha/2); (n_1+n_2 -2)} \cdot \sqrt{S_p^2(\frac{1}{n_1} + \frac{1}{n_2})} } } \]


Caso 3.b. Prueba de Hipótesis para la diferencia de medias poblacionales con varianza desconocida y no homogénea


\[ {t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2) }{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \sim t_{(v)} } \]


Grados de libertad \( \nu \):

\[ \Large \boxed{v = \frac{\left(\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}\right)^2}{\frac{\left(\frac{S_1^2}{n_1}\right)^2}{n_1 - 1} + \frac{\left(\frac{S_2^2}{n_2}\right)^2}{n_2 - 1}}} \]


Donde:

  • \(\bar{x}_1\) y \(\bar{x}_2\): medias muestrales.

  • \(\mu_1\) y \(\mu_2\): medias poblacionales.

  • \(S_1^2\) y \(S_2^2\): varianzas muestrales.

  • \(n_1\) y \(n_2\): tamaños muestrales.

  • \(v\): (niu) grados de libertad.


Intervalo de Confianza para la diferencia de medias (varianzas desconocidas y no homogéneas)

\[ \boxed{ \large{ \bar{X}_1 - \bar{X}_2 \pm t_{\alpha/2, \text{df}} \cdot \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} } } \]


Caso 4. Prueba de Hipótesis para muestras apareadas

\[ {t = \frac{\bar{d}}{\frac{S_d}{\sqrt{n}}} \sim t_{(n - 1)}} \]


Donde:

  • \( \bar{d} \): media de las diferencias.
  • \( S_d \): desviación estándar de las diferencias.
  • \( n \): número de pares apareados.


Intervalo de confianza para muestras apareadas

\[ \boxed{ \large{ \bar{d} \pm (t_{\alpha/2, \text{df}} \cdot \frac{s_d}{\sqrt{n}}) } } \]


Caso 5. Prueba de Hipótesis para la diferencia de proporciones poblacionales

\[{Z = \frac{(\hat{p}_1 - \hat{p}_2)}{\sqrt{p(1-p)\left(\frac{1}{n_1} + \frac{1}{n_2}\right)}} ~ \sim N(0,1)}\]


Donde:

  • \(\hat{p}_1\) y \(\hat{p}_2\): proporciones muestrales de las dos poblaciones.
  • \(p\): proporción combinada de éxitos en ambas muestras.
  • \(1-p\): proporción combinada de fracasos en ambas muestras.
  • \(n_1\) y \(n_2\): tamaño de las muestras.


Intervalo de confianza para la diferencia de proporciones poblacionales

\[ \boxed{ \large{ (\hat{p}_1 - \hat{p}_2 \pm z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}) } } \]


Actividad

Ejercicio 1. Un técnico desea evaluar el comportamiento de un modelo recién lanzado al mercado de aspersores de riego; para ello va a comparar el modelo tradicionalmente usado y el nuevo modelo, el cual por su diseño, tiene una menor deriva en las gotas de agua, lo cual produciría una menor variabilidad en los caudales entregados y una mayor uniformidad en el riego. Para probar esto, se seleccionaron 10 aspersores, midiéndose el caudal entregado por c/u de ellos luego de un mes de uso. Los datos recolectados son los siguientes:

Aspersor 1 2 3 4 5 6 7 8 9 10
Tradicional (m3/h) 9 7 9 10 11 12 4 8 11 7
Nuevo modelo (m3/h) 5 2 4 6 7 6 7 3 10 15

Responder:

  1. ¿Cual es la variable de interés?¿ Qué tipo de variable es?
  2. Represente gráficamente los datos.
  3. Construya intervalos de confianza para el caudal promedio de cada uno de los aspersores y para la desviación estándar. Concluya.
  4. ¿Será mejor el nuevo modelo de aspersor? Sacar conclusiones usando α = 0,01.

Ejercicio 2. Se desea comparar la longitud de los pétalos (variable Petal.Length1) entre dos especies de “iris1” diferentes: “setosa” y “versicolor”. Realizar un análisis estadístico descriptivo e inferencial completo y determinar si existe una diferencia significativa en la longitud promedio de los pétalos entre estas dos especies.

1datos incluidos en el software R, base de datos “iris”.

Ejercicio 3. Una compañía dedicada a la comercialización de semillas decidió poner a prueba el rendimiento de dos híbridos de sorgo granífero bajo riego. Se estudiaron dos muestras, la primera del híbrido “Nueva GR80” y la segunda del híbrido “Overa”. Los resultados, en qq/ha fueron:

Nueva GR80: 

110; 112; 135; 140; 128; 132; 123; 125; 140; 142; 151; 113; 142; 123; 118; 143; 138; 135; 140; 135; 112; 128; 152; 136; 152; 139; 142; 129; 150; 135; 119; 128; 123; 142; 138; 145; 136; 147; 141; 137

Overa: 

115; 158; 139; 143; 151; 152; 148; 139; 153; 125; 136; 129; 146; 136; 140; 150; 140; 139; 128; 129; 125; 130; 140; 149; 150; 139; 142; 138; 129; 126; 137; 148; 146; 150; 158; 153; 119; 139; 154; 139; 151; 154; 139; 132

Variedad Nueva GR80

Variedad Overa

Responder:

  1. Realice una tabla de frecuencias, obtenga medidas de resumen para cada variedad y grafique adecuadamente. Intérprete los resultados en términos agronómicos.

  2. ¿Cuál de los dos híbridos recomendaría sembrar?

Ejercicio 4. En una investigación sobre la susceptibilidad de plántulas de duraznero a dos cepas diferentes de un virus, se tomaron de un vivero quince (15) plantas al azar; en cada plántula se seleccionaron dos (2) hojas y cada una fue inoculada con una de las dos cepas virales. Al cabo de una semana, se midió en cada hoja el tamaño de la lesión producida por el virus (mm2). Los datos obtenidos figuran en la siguiente tabla:

Planta
Virus 1 2 3 4 5 6 7 8 9 10 1 12 13 14 15
Cepa A 31 20 18 8 25 14 17 12 21 30 17 9 13 10 24
Cepa B 18 17 14 7 21 13 22 11 22 15 11 10 13 5 25

Responder:

  1. Realice el análisis descriptivo adecuado.

  2. Elegir un nivel de significación 𝞪 y poner a prueba la siguiente hipótesis nula: Las lesiones que producen las dos cepas virales tienen, en promedio, el mismo tamaño.

  3. Interpretar el intervalo de confianza 1-𝞪 para la esperanza de la diferencia entre los tamaños de las lesiones producidas por las dos cepas virales.

  4. Explicar que representa el valor de 𝞪 elegido en términos de la situación en estudio.

Bibliografía

  • Balzarini, M., Di Rienzo, J. Tablada, M. González, L. Bruno, C., Córdoba, M. Robledo, W., Casanoves, F. (2016). Estadística y biometría: ilustraciones del uso de InfoStat en problemas de agronomía - 2a ed. Córdoba: Editorial Brujas; UNC.

  • Batista, W. B., (2018). Introducción a la inferencia estadística aplicada: teoría, cálculo e interpretación - 1a ed. Ciudad Autónoma de Buenos Aires: Editorial Facultad de Agronomía.