5 de febrero de 2019

Regresión lineal

La regresión lineal es un método estadístico utilizado para conocer la asociación entre variables. En este análisis se valora la contribución de la variable independiente (X) sobre la variable dependiente (Y).

\[Y_i=\beta_0+\beta_1X_i+\epsilon_i\]

La regresión lineal al igual que otros modelos estadísticos requiere que se cumplan ciertas condiciones para su aplicación.

Supuestos de la regresión

  1. Linealidad

  2. Independencia

  3. Homocedasticidad

  4. Normalidad

Supuesto de linealidad

La ecuación de la regresión adopta la forma de una recta conjuntando los valores observados en la variable independiente el origen de la recta y los residuos. Si los datos no se comportan linealmente podemos hablar de un problema de especificación.

Supuesto de independencia

Los residuos representan la varianza no explicada por el modelo. Estos residuos deben ser independientes, es decir, no debe existir un patrón en los residuos.

Si \(\hat{Y}_i=\hat\beta_0+\hat\beta_1X_i\) entonces los residuos son \(e=Y_i-\hat{Y}_i\)

Supuesto de homocedasticidad

Para cada valor de la variable independiente la varianza de los residuos es constante.

Supuesto de normalidad

Para cada valor de la variable independiente los residuos se distribuyen de forma normal.

Inferencias de la regresión

Considerando que conocemos el modelo verdadero (\(R^2=1\)) y que se consideraron tanto los intervalos de confianza como la prueba de hipótesis antes de realizar el análisis.

\[\hat\beta_0=\bar{Y}-\hat\beta_1\hat{X}\]

y

\[\hat\beta_1=Cor(Y,X){DE(Y) \over DE(X)}\]

Regresión a la media