_______________________________________________________________________________________________________
Autores: Prof. Adj. Ing. Agr. Esp. Sebastian Bustos
JTP Ing. Agr. Arnaldo Romero
Contacto: estadistica@agrarias.unca.edu.ar
Las pruebas de hipótesis estadísticas ofrecen un marco metodológico sólido para la evaluación y toma de decisiones en diferentes ámbitos de la actividad profesional. Facilitan inferencias sobre poblaciones mediante el análisis de datos recolectados de muestras representativas. Su relevancia se evidencia en la validación de resultados y el control de errores (tipo I y tipo II), abarcando diversos contextos, desde estudios experimentales hasta análisis comparativos. En este sentido, respaldan no solo la investigación, sino también la toma de decisiones y la implementación de prácticas agrícolas eficaces y sostenibles.
Las Pruebas de Hipótesis son procedimientos estadísticos utilizados para evaluar afirmaciones o hipótesis acerca de los parámetros de una población como la media, la varianza o la proporción, entre los más relevantes. En términos generales, se plantea una hipótesis inicial (conocida como hipótesis nula, H0) y una hipótesis alternativa ( Hi o H1), posteriormente se recolectan y analizan datos de una muestra para determinar si hay suficiente evidencia para rechazar la hipótesis nula en favor de la hipótesis alternativa. A continuación, se presentan los casos de Pruebas de Hipótesis para una población:
Estadístico de Prueba:
\[ \boxed{ \huge Z = \frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}} } \]
donde:
\(\bar{x}\) es la media muestral
\(\mu_0\) es el valor hipotético de la media poblacional
\(\sigma\) es la desviación estándar poblacional conocida
\(n\) es el tamaño de la muestra.
Distribución del Estadístico z
El estadístico \(Z\) sigue una distribución normal estándar \(Z \sim N(0, 1)\). La distribución normal estándar tiene una media de cero y una desviación estándar de uno.
Estadístico de Prueba:
\[ \boxed{ \huge t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}} } \]
donde:
\(\bar{x}\) es la media muestral,
\(\mu_0\) es el valor hipotético de la media poblacional,
\(s\) es la desviación estándar muestral,
\(n\) es el tamaño de la muestra.
Distribución del Estadístico t
El estadístico \(t\) sigue una distribución t de Student con \(n-1\) grados de libertad.
Estadístico de Prueba:
\[ \boxed{ \huge \chi^2 = \frac{(n-1) \cdot s^2}{\sigma_0^2} } \]
donde:
Distribución del Estadístico \(\chi^2\)
El estadístico \(\chi^2\) sigue una distribución chi-cuadrado con \(n-1\) grados de libertad.
Estadístico de Prueba:
\[ \boxed{ \huge z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0 \cdot (1 - p_0)}{n}}} } \]
donde:
Distribución del Estadístico \(z\)
El estadístico \(z\) sigue una distribución normal estándar (\(z \sim N(0, 1)\)). La distribución normal estándar tiene una media de cero y una desviación estándar de uno.
P-Valor y significancia estadística
El p-valor es una herramienta utilizada para decidir si rechazar o no la hipótesis nula en una prueba de hipótesis. Un p-valor pequeño (por lo general, menor que un umbral preestablecido como 0.05) sugiere que la hipótesis nula puede ser rechazada en favor de la hipótesis alternativa.
La significación estadística se refiere a la decisión de si un resultado es estadísticamente significativo o no, basado en el p-valor y un nivel de significancia preestablecido (como 0.05). Si el p-valor es menor que el nivel de significancia, se dice que el resultado es estadísticamente significativo.
En las Pruebas de Hipótesis, se pueden cometer dos tipos principales de errores. El primero es el Error Tipo I, que ocurre cuando se rechaza la hipótesis nula cuando en realidad es verdadera, sugiriendo erróneamente que hay un efecto o diferencia cuando no lo hay (Green et al., 2014). La probabilidad de cometer este error se denota como α, y a menudo se establece en un nivel de 0.05. El segundo error es el Error Tipo II, que sucede cuando no se rechaza la hipótesis nula cuando en realidad es falsa, lo que significa que no se detecta un efecto o diferencia cuando en realidad sí existe (Kelter, 2020). La probabilidad de cometer un error Tipo II se denota como β . El poder estadístico, que es la probabilidad de rechazar correctamente la hipótesis nula cuando es falsa, se define como (1−β).
Una mayor potencia en la Prueba de Hipótesis se obtiene mediante:
Aumentar el tamaño de la muestra.
Reducir la desviación estándar (variabilidad) de los datos obtenidos utilizando unidades muestrales más homogéneas, mejorando las técnicas de muestreo y la calibración de los instrumentos de medición.
Resolver, en grupos de tres estudiantes, los siguientes
ejercicios:
Ejercicio 1. Para cada una de las siguientes situaciones plantee, en símbolos y en palabras, hipótesis nula, hipótesis alternativa y represente gráficamente la región de rechazo y no rechazo:
Ejercicio 2. El gerente de producción de una planta de empaque de cereal deseaba determinar si el proceso de llenado de las cajas de cereal se encontraba bajo control o no, es decir, si el contenido promedio por caja en todo el proceso de llenado seguía una distribución normal con una media de 368.0 gr., como está especificado, o si había que efectuar correcciones. Para estudiar la situación, tomó una muestra aleatoria de 25 cajas, que arrojaron una medida de 372.5 gr. Por experiencias anteriores se sabe que la desviación estándar poblacional para este proceso de llenado es de 15 gr.α = 0.05.
Ejercicio 3. Un criador de pollos parrilleros sabe que el peso promedio de los mismos a los dos meses es 2,5 k faenado, y sigue una distribución normal. Para lograr aumentar el peso de dichas aves, decide agregarle un nuevo componente a la ración de alimento. Luego de dos meses, tomó una muestra de 10 individuos obteniendo los siguientes pesos expresados en Kilogramos:
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|
| 2,52 | 2,60 | 2,48 | 2,55 | 2,60 | 2,70 | 2,40 | 2,60 | 2,57 | 2,45 |
Responder:
Realice un análisis descriptivo de la variable de interés.
Ponga a prueba, con un nivel de significación del 5%, la hipótesis de que la nueva ración aumenta el peso de los pollos.
Ahora, realice nuevamente el test de hipótesis, pero use un nivel de significación del 1% y concluya.
¿Cuál es el error de Tipo I en el contexto de la situación planteada?
¿Cuál es el error de Tipo II?
Ejercicio 4: Un productor decide probar el funcionamiento de su máquina y para ello, luego de cosechar una parcela, cuenta en 10 unidades de 1 m2 la cantidad de semillas que quedan en el suelo. Las normas técnicas indican que la media del número de semillas caídas por m2 no debería ser superior a 80. Los resultados, en semillas/m2 , fueron:
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|
| 77 | 73 | 82 | 82 | 79 | 81 | 78 | 76 | 76 | 75 |
Responder:
Ejercicio 5. Para conocer la homogeneidad en la fertilidad de un suelo, en cuanto al contenido de Nitrógeno se refiere, un ingeniero agrónomo extrajo 20 muestras de tierra a una profundidad de 0-20 cm. Luego, las mismas fueron enviadas al laboratorio de edafología de la Facultad de Ciencias Agrarias, en donde se determinó el contenido de Nitrógeno total aplicando el método de Kjeldahl. Los resultados obtenidos, expresados en ppm, fueron:
| 0.50 | 0.48 | 0.39 | 0.41 | 0.43 | 0.58 | 0.74 | 0.24 | 0.57 | 0.61 |
| 0.49 | 0.47 | 0.47 | 0.45 | 0.40 | 0.38 | 0.50 | 0.51 | 0.32 | 0.55 |
Responder:
Se acepta que, un suelo es homogéneo en fertilidad, si el contenido de nitrógeno presenta una varianza de a lo sumo 0,005. ¿Qué conclusiones podrá sacar el ingeniero agrónomo con base en los resultados obtenidos del laboratorio? α=0,10
Ejercicio 6. Los siguientes datos corresponden a los valores de porcentaje de proteína en leche registrados en la producción de 13 hembras de la raza caprina Saanen:
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3.61 | 3.22 | 3.59 | 3.32 | 3.56 | 3.67 | 3.71 | 3.33 | 3.72 | 3.46 | 3.69 | 3.46 | 3.62 |
Responder:
Un establecimiento lechero que compra este insumo asegura que la leche que proviene de estos animales producen un porcentaje de proteína promedio inferior a 3,6 %. Decidir con un nivel de significación del 10 %, mediante un test de hipótesis, si esta afirmación es correcta e indicar cual sería el Error Tipo I y Tipo II.
Ejercicio 7. Se conoce que la altura promedio de los estudiantes que cursan Estadística y Biometría es de 1,65 mts. Teniendo en cuenta la base de datos ALUMNOS_2024, responder:
¿Los estudiantes de este año tienen, en promedio, la misma altura que la media histórica?
¿Las mujeres de este año son más bajas que las de años anteriores?
¿Los hombres de este año son más altos que las de años anteriores?
Indique el Error Tipo I y Tipo II en los tres casos anteriores.
Balzarini, M., Di Rienzo, J. Tablada, M. González, L. Bruno, C., Córdoba, M. Robledo, W., Casanoves, F. (2016). Estadística y biometría: ilustraciones del uso de InfoStat en problemas de agronomía - 2a ed. Córdoba: Editorial Brujas; UNC.
Batista, W. B., (2018). Introducción a la inferencia estadística aplicada: teoría, cálculo e interpretación - 1a ed. Ciudad Autónoma de Buenos Aires: Editorial Facultad de Agronomía.
Boos, D. D., y Stefanski, L. A. (2011). P-Value Precision and Reproducibility. The American Statistician, 65(4), 213-221. Recuperado de: https://doi.org/10.1198/tas.2011.10129