La regresión lineal simple es un modelo estadístico que se utiliza para entender y cuantificar la relación lineal entre dos variables cuantitativas. Su objetivo principal es predecir el valor de una variable (llamada variable dependiente o respuesta) a partir del valor de otra variable (llamada variable independiente, predictora o explicativa).
La idea central es encontrar la línea recta que mejor se ajuste a un conjunto de puntos en un gráfico de dispersión. Esta línea, conocida como línea de regresión, resume la tendencia general de los datos y nos permite hacer predicciones.
La ecuación de la línea de regresión lineal simple se expresa de la siguiente manera en formato LaTeX:
\(y = \beta_0 + \beta_1 x + \varepsilon\)$
O, cuando hablamos del modelo ajustado (es decir, la línea que hemos calculado a partir de los datos), solemos escribirla como:
\(\hat{y} = b_0 + b_1 x\)
o alternativamente:
\(\hat{y} = \hat{\beta}_0 + \hat{\beta}_1 x\)
Contexto: Un ingeniero agrícola quiere estudiar cómo influye la cantidad de agua de riego aplicada en el rendimiento de un cultivo de maíz.
El ingeniero realiza un experimento en parcelas de prueba con diferentes cantidades de riego y obtiene los siguientes datos. Al aplicar el método de regresión lineal (por ejemplo, mediante el método de mínimos cuadrados), obtiene la siguiente ecuación ajustada:
\(\hat{y} = 2.5 + 0.015x\)
Intercepto (\(b_0 = 2.5\)): Según el modelo, si no se aplicara nada de agua de riego (\(x = 0\)), se esperaría un rendimiento base de 2.5 toneladas por hectárea. Esto podría deberse a la humedad natural del suelo o a las precipitaciones, pero hay que tener cuidado al interpretar el intercepto si \(x=0\) no está dentro del rango de los datos observados.
Pendiente (\(b_1 = 0.015\)): Este es el dato clave. Indica que por cada \(m^3/ha\) adicional de agua de riego, el rendimiento del cultivo aumenta, en promedio, en 0.015 toneladas por hectárea. Si lo expresamos en kilogramos, sería un aumento de 15 kg/ha por cada \(m^3/ha\) de agua.
Aplicación práctica (Predicción):
El ingeniero quiere predecir el rendimiento esperado si aplica una cantidad de riego de \(300 \, m^3/ha\).
Simplemente sustituye el valor de \(x\) en la ecuación:
\(\hat{y} = 2.5 + 0.015 * 300\) \(\hat{y} = 2.5 + 4.5\) \(\hat{y} = 7.0\)
Por lo tanto, el modelo predice que, para una dosis de riego de \(300 \, m^3/ha\), el rendimiento esperado del cultivo de maíz será de aproximadamente 7.0 toneladas por hectárea.