TP_-TEST_DE_HIPÓTESIS

Logo FCA Logo UNCA

Cátedra de Biometría y Técnica Experimental

_______________________________________________________________________________________________________

Trabajo Práctico N° 8: Prueba de Hipótesis II

Motivación

Las pruebas de hipótesis constituyen una herramienta fundamental en la estadística inferencial, ya que permiten tomar decisiones objetivas a partir de datos muestrales. En numerosos estudios científicos, agronómicos, biológicos y sociales, no basta solamente con describir los datos, sino que resulta necesario evaluar si las diferencias observadas o los resultados obtenidos son estadísticamente significativos.

En este Trabajo Práctico de Prueba de Hipótesis II se profundiza el análisis inferencial mediante la aplicación de distintos contrastes estadísticos utilizados para comparar parámetros poblacionales bajo diferentes condiciones. Estas metodologías permiten validar afirmaciones, controlar procesos y respaldar conclusiones con bases científicas.

Además, el uso de herramientas computacionales como R Project y RStudio facilita la implementación de los procedimientos estadísticos, promoviendo la interpretación adecuada de resultados y el desarrollo de competencias en análisis de datos reproducibles.

De esta manera, el trabajo práctico busca integrar los conceptos teóricos con situaciones aplicadas, fortaleciendo la capacidad de análisis crítico y la toma de decisiones basadas en evidencia estadística.

Pruebas de hipótesis para dos poblaciones

Caso 1. Prueba de Hipótesis para las varianzas poblacionales

Estadístico de Prueba

Cuando se desea comparar las varianzas de dos poblaciones normales independientes, se utiliza el estadístico F:

\[ \frac{ \dfrac{S_1^2}{\sigma_1^2} }{ \dfrac{S_2^2}{\sigma_2^2} } \sim F_{[(n_1-1)(n_2-1)]} \]

Donde:

\(S_1^2\) y \(S_2^2\): varianzas muestrales de las dos muestras que se comparan.
\(\sigma_1^2\) y \(\sigma_2^2\): varianzas poblacionales de las dos muestras que se comparan.
\(n_1 - 1\): grados de libertad de la muestra 1.
\(n_2 - 1\): grados de libertad de la muestra 2.

Caso 2. Prueba de Hipótesis para la diferencia de medias poblacionales con varianza conocida

Para probar la diferencia de medias poblacionales con varianza conocida, el estadístico de prueba es:

\[ Z= \frac{ (\bar{X}_1-\bar{X}_2)-(\mu_1-\mu_2) }{ \sqrt{ \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2} } } \]

Donde:

\(\bar{x}_1\) y \(\bar{x}_2\): medias muestrales.
\(\mu_1\) y \(\mu_2\): medias poblacionales.
\(\sigma_1^2\) y \(\sigma_2^2\): varianzas poblacionales.
\(n_1\) y \(n_2\): tamaños muestrales.

Intervalo de confianza para la diferencia de medias poblacionales con varianza conocida:

\[ P\left( (\bar{X}_1-\bar{X}_2) - Z_{\alpha/2} \sqrt{ \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} } < \mu_1-\mu_2 < (\bar{X}_1-\bar{X}_2) + Z_{\alpha/2} \sqrt{ \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} } \right) = 1-\alpha \]

Caso 3.a. Prueba de Hipótesis para la diferencia de medias poblacionales con varianzas desconocidas y homogéneas

\[ \frac{ (\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2) }{ \sqrt{ \frac{ (n_1-1)S_1^2+(n_2-1)S_2^2 }{ n_1+n_2-2 } \left( \frac{1}{n_1}+\frac{1}{n_2} \right) } } \sim t_{(n_1+n_2-2)} \]

Donde:

\(\bar{x}_1\) y \(\bar{x}_2\): medias muestrales.
\(\mu_1\) y \(\mu_2\): medias poblacionales.
\(S_1^2\) y \(S_2^2\): varianzas muestrales.
\(n_1\) y \(n_2\): tamaños muestrales.

Varianza combinada:

\[ S_p^2= \frac{ (n_1-1)S_1^2+(n_2-1)S_2^2 }{ n_1+n_2-2 } \]

Intervalo de Confianza para la diferencia de medias (varianzas desconocidas y homogeneas)

\[ P\left( (\bar{X}_1-\bar{X}_2) - t_{\alpha/2,(n_1+n_2-2)} \sqrt{ \frac{ (n_1-1)S_1^2+(n_2-1)S_2^2 }{ n_1+n_2-2 } \left( \frac{1}{n_1}+\frac{1}{n_2} \right) } < \mu_1-\mu_2 < (\bar{X}_1-\bar{X}_2) + t_{\alpha/2,(n_1+n_2-2)} \sqrt{ \frac{ (n_1-1)S_1^2+(n_2-1)S_2^2 }{ n_1+n_2-2 } \left( \frac{1}{n_1}+\frac{1}{n_2} \right) } \right) = 1-\alpha \]

Caso 3.b. Prueba de Hipótesis para la diferencia de medias poblacionales con varianza desconocida y no homogénea

\[ \frac{ (\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2) }{ \sqrt{ \frac{S_1^2}{n_1} + \frac{S_2^2}{n_2} } } \sim t_{(\nu)} \]

Grados de libertad:

\[ \nu= \frac{ \left( \frac{S_1^2}{n_1} + \frac{S_2^2}{n_2} \right)^2 }{ \frac{ \left( \frac{S_1^2}{n_1} \right)^2 }{ n_1-1 } + \frac{ \left( \frac{S_2^2}{n_2} \right)^2 }{ n_2-1 } } \]

Donde:

\(\bar{x}_1\) y \(\bar{x}_2\): medias muestrales.
\(\mu_1\) y \(\mu_2\): medias poblacionales.
\(S_1^2\) y \(S_2^2\): varianzas muestrales.
\(n_1\) y \(n_2\): tamaños muestrales.

Intervalo de Confianza para la diferencia de medias (varianzas desconocidas y no homogéneas)

\[ P\left( (\bar{X}_1-\bar{X}_2) - t_{\alpha/2,(\nu)} \sqrt{ \frac{S_1^2}{n_1} + \frac{S_2^2}{n_2} } < \mu_1-\mu_2 < (\bar{X}_1-\bar{X}_2) + t_{\alpha/2,(\nu)} \sqrt{ \frac{S_1^2}{n_1} + \frac{S_2^2}{n_2} } \right) = 1-\alpha \]

Caso 4. Prueba de Hipótesis para muestras apareadas

\[ t= \frac{ \bar{d}-\mu_d }{ \frac{S_d}{\sqrt{n}} } \sim t_{(n-1)} \]

Donde:

\(\bar{d}\): media de las diferencias.
\(S_d\): desviación estándar de las diferencias.
\(n\): número de pares apareados.

Intervalo de confianza para muestras apareadas

\[ P\left( \bar{d} - t_{\alpha/2,(n-1)} \frac{S_d}{\sqrt{n}} < \mu_d < \bar{d} + t_{\alpha/2,(n-1)} \frac{S_d}{\sqrt{n}} \right) = 1-\alpha \]

Actividad

Ejercicio 1. Un investigador agrícola desea evaluar el comportamiento de dos variedades de semillas de maíz utilizadas en la región semiárida de Catamarca. Para ello, comparará una variedad tradicionalmente sembrada por los productores con una nueva variedad híbrida desarrollada para mejorar la uniformidad del rendimiento. Se espera que la nueva variedad presente una menor variabilidad en la producción de granos por planta, lo que permitiría obtener lotes más homogéneos y facilitar las prácticas de manejo y cosecha. Para analizar esta situación, se seleccionaron 10 plantas de cada variedad y se registró el peso de granos producido por cada una al finalizar el ciclo del cultivo. Los datos recolectados fueron los siguientes:

Variedad tradicional	10	8	10	11	12	13	5	9	12	8
Nueva variedad	6	3	5	7	8	7	8	4	11	16

Responder:

¿Cuál es la variable de interés? ¿Qué tipo de variable es?
Represente gráficamente los datos obtenidos para ambas variedades de semillas.
Construya intervalos de confianza para la desviación estándar poblacional de cada variedad. Interprete y concluya los resultados obtenidos.
Considerando que una menor variabilidad en el rendimiento indica una mayor uniformidad productiva, determine si la nueva variedad híbrida presenta un mejor comportamiento agronómico que la variedad tradicional. α=0.01

Ejercicio 2. Se desea comparar la longitud de los pétalos (variable Petal.Length¹) entre dos especies de “iris¹” diferentes: “setosa” y “versicolor”. Realizar un análisis estadístico descriptivo e inferencial completo y determinar si existe una diferencia significativa en la longitud promedio de los pétalos entre estas dos especies.

¹datos incluidos en el software R, base de datos “iris”.

Ejercicio 3. El porcentaje de calcio, medido en hojas de muestras de soja, se determinó a través de dos métodos de mineralización: (A) cenizas secas y, (B) mineralización húmeda. Los datos obtenidos fueron:

Método A (%)	0.30	0.31	0.36	0.26	0.27	0.29	0.28
Método B (%)	0.35	0.35	0.34	0.36	0.31	0.28	0.28

Responder: a) Construya un intervalo de confianza para la media de cada método de mineralización. Interprete. b) Construya un intervalo de confianza para la diferencia de medias. c) ¿Ambos métodos, producen los mismos resultados? (α = 0,05).

Ejercicio 4. En una investigación sobre la susceptibilidad de plántulas de duraznero a dos cepas diferentes de un virus, se tomaron de un vivero quince (15) plantas al azar; en cada plántula se seleccionaron dos (2) hojas y cada una fue inoculada con una de las dos cepas virales. Al cabo de una semana, se midió en cada hoja el tamaño de la lesión producida por el virus (mm2). Los datos obtenidos figuran en la siguiente tabla:

Virus	1	2	3	4	5	6	7	8	9	10	1	12	13	14	15
Cepa A	31	20	18	8	25	14	17	12	21	30	17	9	13	10	24
Cepa B	18	17	14	7	21	13	22	11	22	15	11	10	13	5	25

Responder:

Realice el análisis descriptivo adecuado.
Elegir un nivel de significación 𝞪 y poner a prueba la siguiente hipótesis nula: Las lesiones que producen las dos cepas virales tienen, en promedio, el mismo tamaño.
Interpretar el intervalo de confianza 1-𝞪 para la esperanza de la diferencia entre los tamaños de las lesiones producidas por las dos cepas virales.
Explicar que representa el valor de 𝞪 elegido en términos de la situación en estudio.