El modelo de regresión lineal es escrito como \(\hat{y}=\beta_{0}+\beta_{1}x_{i}\) los errores son la diferencia entre el valor real y el valor generado a través, del modelo y se escriben como:
\(\epsilon_{i} =\hat{y}-y_{i}\) se correra el modelo con los datos del ejemplo cars tomado de r, cuya grafica se presenta a contiunación, se observa que su coeficiente de correlación es de 0.8068949 lo cual quiere decir que a medida que se aumenta la velocidad, la distancia tambien aumenta, lo cual es lógico.
plot(cars$speed,cars$dist)
correlación=cor(cars$speed,cars$dist)
El valor para los estimadores de la pendiente \(\beta_{0}\) y el interseccto, \(\beta_{1}\) se realiza usando el método de mínimos cuadrados ordinarios, lo cual se presentara a continuación, buscando minimizar la suma de cuadrados del error, esto es:\(\sum_{i=1}^{n}\epsilon_{i}^{2}=\sum_{i=1}^{n}(\hat{y}-y_{i})^{2}\)
Para minimizar suma de cuadrados del erro, derivamos parcialmente con respecto a las costantens \(\beta_{0}\) y \(\beta_{1}\) y luego igualamos a cero, para finalizar debemos despejar los valores de estas contas, lo cual constituy e las fórmulas del estimador.
\(\partial\frac{(\sum_{i=1}^{n}\epsilon_{i}^{2})}{\beta_{0}}=\partial\frac{(\sum_{i=1}^{n}(\hat{y}-y_{i})^{2})}{\beta_{0}}={2*\sum_{i=1}^{n}(\beta_{0}+\beta_{1}x_{i}-y_{i})}*1=0\)
\({{\beta_{0}}+{\beta_{i}}\partial\frac{(\sum_{xi})}{n}-\partial\frac{(\sum_{yi})}{n}=0}\)
\({\beta_{0}}={\bar{y}}-{\beta_{1}}+{\bar{x}}\)