[apuntes de latex]https://metodos.fam.cie.uva.es/~latex/apuntes/apuntes3.pdf
La regresión lineal simple es una técnica estadística que modela la relación entre dos variables cuantitativas: una variable independiente o explicativa (\((X)\)) y una variable dependiente o respuesta (\((Y)\)). Su objetivo es encontrar la recta que mejor se ajusta a los datos observados, permitiendo predecir el valor de \(Y\) a partir de un valor dado de \(X\). Es “simple” porque involucra solo una variable predictora.
El modelo de regresión lineal simple se expresa como:
\[ Y = \beta_0 + \beta_1 X + \varepsilon \]
donde:
Para que la inferencia sea válida, se deben cumplir ciertos supuestos: - Linealidad: La relación entre \(X\) e \(Y\) es lineal. - Independencia: Las observaciones son independientes entre sí. - Homocedasticidad: La varianza de los errores es constante para todos los niveles de \(X\). - Normalidad: Los errores siguen una distribución normal (necesario para pruebas de hipótesis y construcción de intervalos de confianza).
Contexto: Un ingeniero agrícola desea estudiar cómo influye la dosis de fertilizante nitrogenado (en kg/ha) en el rendimiento de un cultivo de maíz (en toneladas por hectárea). Se realizó un experimento con 5 parcelas experimentales, obteniendo los siguientes datos:
| Dosis de fertilizante (\(X\)) | Rendimiento (\(Y\)) |
|---|---|
| 50 | 2.5 |
| 60 | 3.2 |
| 70 | 3.8 |
| 80 | 4.3 |
| 90 | 4.9 |
A partir de estos datos, se ajusta un modelo de regresión lineal simple. Los cálculos (usando mínimos cuadrados) proporcionan las siguientes estimaciones:
La recta ajustada es:
\[ \hat{Y} = -0.3 + 0.058\,X \]
Interpretación en el contexto agrícola: - Pendiente (\(\hat{\beta}_1 = 0.058\)): Por cada kg/ha adicional de fertilizante nitrogenado, el rendimiento del maíz aumenta en promedio 0.058 toneladas por hectárea (es decir, 58 kg/ha). - Intercepto (\(\hat{\beta}_0 = -0.3\)): Teóricamente, si no se aplicara fertilizante (\(X=0\)), el rendimiento esperado sería negativo, lo cual no tiene sentido físico. Esto ocurre porque el rango de dosis evaluado no incluye valores cercanos a cero y la relación lineal solo es válida dentro del rango observado (50 a 90 kg/ha). Fuera de ese intervalo, la extrapolación no es recomendable.
Con este modelo, el ingeniero puede predecir el rendimiento para dosis no ensayadas (por ejemplo, para 75 kg/ha: \(\hat{Y} = -0.3 + 0.058 \times 75 = 4.05\) ton/ha) y cuantificar el impacto del fertilizante, lo que ayuda a tomar decisiones sobre la dosis óptima desde el punto de vista productivo y económico.
La regresión lineal simple es una herramienta fundamental en Ingeniería Agrícola para modelar relaciones entre variables, como dosis de insumos y rendimientos, condiciones climáticas y crecimiento de cultivos, o características del suelo y productividad. Su correcta aplicación, verificando los supuestos subyacentes, permite realizar predicciones y tomar decisiones basadas en datos.