Claro, profesor Fuentes. A continuación le explico detalladamente la regresión lineal simple, desde el planteamiento matemático hasta su interpretación, con un enfoque adecuado para su uso en docencia con Python o R.
La regresión lineal simple es un modelo estadístico que busca describir la relación entre una variable independiente \(x\) y una variable dependiente \(y\), a través de una línea recta que se ajusta lo mejor posible a los datos observados.
La forma general de la ecuación es:
\[ \hat{y} = \beta_0 + \beta_1 x \]
Donde:
Se obtienen minimizando los errores (diferencias entre \(y\) observado y \(\hat{y}\)) con el método de mínimos cuadrados:
\[ \beta_1 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n}(x_i - \bar{x})^2} \]
\[ \beta_0 = \bar{y} - \beta_1 \bar{x} \]
Donde:
Supongamos los siguientes datos:
x | y |
---|---|
1 | 2 |
2 | 3 |
3 | 5 |
\[ \bar{x} = \frac{1+2+3}{3} = 2 \quad ; \quad \bar{y} = \frac{2+3+5}{3} = 3.33 \]
\[ \beta_1 = \frac{(1-2)(2-3.33)+(2-2)(3-3.33)+(3-2)(5-3.33)}{(1-2)^2+(2-2)^2+(3-2)^2} \]
\[ = \frac{(-1)(-1.33)+0(-0.33)+1(1.67)}{1+0+1} = \frac{1.33 + 0 + 1.67}{2} = \frac{3}{2} = 1.5 \]
\[ \beta_0 = 3.33 - 1.5(2) = 3.33 - 3 = 0.33 \]
\[ \hat{y} = 0.33 + 1.5x \]
El error se mide con:
\[ R^2 = 1 - \frac{\text{Suma de errores cuadrados}}{\text{Suma total de cuadrados}} \]
¿Desea que continúe con una implementación en Python o R usando estos datos o con datos reales? También puedo extender a regresión múltiple si lo considera útil.