REGRESIÓN LINEAL

¿Qué es la regresión lineal simple?

La Regresión Lineal Simple es una técnica estadística utilizada para modelar la relación entre dos variables. Su objetivo principal es entender cómo los cambios en una variable independiente (o predictora) afectan a una variable dependiente (o de respuesta), trazando la línea recta que mejor se ajuste a los datos.

En esencia, buscamos una “tendencia” que nos permita predecir resultados futuros basados en observaciones pasadas.


La Ecuación Matemática

La relación se expresa mediante la siguiente ecuación lineal:

\[y = \beta_0 + \beta_1 x + \epsilon\]

Interpretación de los parámetros:

  • \(y\) (Variable Dependiente): Es el factor que estamos tratando de predecir o explicar (ej. el rendimiento de un cultivo).
  • \(x\) (Variable Independiente): Es el factor que sospechamos que causa el cambio (ej. la cantidad de fertilizante).
  • \(\beta_0\) (Intercepto): Representa el valor esperado de \(y\) cuando \(x\) es igual a cero. En términos gráficos, es donde la recta corta el eje vertical.
  • \(\beta_1\) (Pendiente o Coeficiente): Es el parámetro más importante. Indica cuánto cambia \(y\) por cada unidad que aumenta \(x\). Si es positivo, la relación es directa; si es negativo, es inversa.
  • \(\epsilon\) (Error aleatorio): Representa la diferencia entre los valores observados y los predichos por el modelo, ya que en la vida real los puntos rara vez caen exactamente sobre una línea recta.

Ejemplo Aplicado: Ingeniería Agrícola

Imagina que eres un ingeniero agrícola que busca optimizar la producción de maíz en una región específica. Quieres determinar si existe una relación lineal entre el volumen de agua de riego aplicado (\(x\)) y la biomasa producida (\(y\)).

Escenario de estudio:

Supongamos que tras recolectar datos, obtienes la siguiente ecuación:

\[y = 500 + 15x\]

Parámetro Valor Interpretación Técnica
Intercepto (\(\beta_0\)) 500 kg Es la producción base (biomasa) que se obtendría solo con la humedad natural del suelo, sin riego adicional.
Pendiente (\(\beta_1\)) 15 kg/m³ Por cada metro cúbico extra de agua aplicada por hectárea, la producción de biomasa aumenta en 15 kg.

Utilidad del modelo:

Con este modelo, si decides aplicar 20 m³ de agua, podrías predecir una producción aproximada de:

\[y = 500 + 15(20) = 800 \text{ kg}\]

Esto permite al ingeniero realizar un análisis de costo-beneficio: ¿el precio de esos 20 m³ de agua es menor al valor de los 300 kg adicionales de maíz obtenidos?