REGRESIÓN LINEAL

¿Qué es la Regresión Lineal Simple?

La regresión lineal simple es una técnica estadística que se utiliza para modelar la relación entre dos variables cuantitativas. Su objetivo es encontrar la mejor línea recta (la “línea de regresión”) que describe cómo una variable, llamada variable dependiente o de respuesta (Y) , cambia en función de otra, llamada variable independiente, explicativa o predictora (X) .

En esencia, busca responder preguntas como: “Por cada unidad que aumenta X, ¿cuánto aumenta o disminuye Y, en promedio?”.

La palabra “simple” se debe a que solo considera una variable independiente para hacer la predicción.

Ecuación Matemática

La relación lineal entre las variables se expresa mediante la siguiente ecuación:

\[Y = \alpha_0 + \beta_1 X + \varepsilon\]

En formato LaTeX:

Y = \beta_0 + \beta_1 X + \varepsilon

Interpretación de los Parámetros

\(Y\): Es la variable dependiente (o respuesta). Es el fenómeno que queremos explicar o predecir.
\(X\): Es la variable independiente (o predictora). Es la variable que usamos para explicar los cambios en Y.
\(\beta_0\) (Beta cero): Es el intercepto o término constante. Representa el valor esperado de \(Y\) cuando \(X\) es igual a cero. En algunos contextos, puede no tener un sentido práctico (por ejemplo, si X=0 está fuera del rango de los datos observados), pero es necesario para la definición de la línea.
\(\beta_1\) (Beta uno): Es la pendiente de la recta. Este es el parámetro más importante, ya que cuantifica la relación entre X e Y. Indica el cambio esperado (promedio) en \(Y\) por cada incremento de una unidad en \(X\).
- Si \(\beta_1 > 0\), la relación es directa (aumenta X, aumenta Y).
- Si \(\beta_1 < 0\), la relación es inversa (aumenta X, disminuye Y).
- Si \(\beta_1 = 0\), no existe una relación lineal entre las variables.
\(\varepsilon\) (Épsilon): Es el término de error o residuo. Representa la diferencia entre el valor real de \(Y\) y el valor predicho por el modelo en la recta (\(\hat{Y} = \beta_0 + \beta_1 X\)). Reconoce que el modelo no es perfecto y que existen otros factores que influyen en Y y que no están incluidos en el modelo.

Ejemplo Aplicado a Ingeniería Agrícola

Contexto: Un ingeniero agrícola quiere estimar la producción de un cultivo de maíz (en toneladas por hectárea) en función de la cantidad de un fertilizante específico aplicado (en kg/ha). Sospecha que, hasta cierto punto, a mayor fertilizante, mayor será la producción.

Variable Independiente (X): Dosis de fertilizante (kg/ha).
Variable Dependiente (Y): Rendimiento del cultivo (ton/ha).

Después de realizar un experimento en parcelas de prueba con diferentes dosis de fertilizante y analizar los datos con el método de regresión lineal simple, el ingeniero obtiene la siguiente ecuación:

\[ \hat{Y} = 2.5 + 0.03X \]

(Nota: El acento circunflejo sobre la Y, \(\hat{Y}\), indica que es un valor estimado* o predicho por el modelo).*

Interpretación de los Parámetros en este Ejemplo:

\(\hat{\beta}_0 = 2.5\) (Intercepto): Según el modelo, si no se aplicara nada de fertilizante (\(X = 0\)), se esperaría un rendimiento promedio de 2.5 toneladas por hectárea. Este sería el rendimiento base del suelo sin el aporte del fertilizante.
\(\hat{\beta}_1 = 0.03\) (Pendiente): Este es el dato clave. Indica que, por cada kilogramo adicional de fertilizante aplicado por hectárea, se espera un aumento promedio de 0.03 toneladas por hectárea en el rendimiento del maíz.

Para que la interpretación sea más clara, podemos multiplicar: si se aplican 100 kg/ha más de fertilizante, el modelo predice un aumento en la producción de: \[100 \text{ kg/ha} \times 0.03 \text{ (ton/ha)/(kg/ha)} = 3 \text{ toneladas por hectárea.}\]

Con esta información, el ingeniero puede predecir el rendimiento para una dosis específica y, lo que es más importante, puede empezar a realizar un análisis económico para determinar la dosis óptima de fertilizante que maximice la rentabilidad, considerando el costo del insumo y el precio de venta del maíz.

Regresion_Lineal_IA

Justo Fuentes 6820995

2026-02-25