Regresión lineal
Maestría en Gobierno y Políticas Públicas
Diego Solís Delgadillo
El grado en que dos eventos ocurren al mismo tiempo
La correlación no implica causalidad
Tip
\(Z\) es una variable confusora
Mejor Línea de ajuste
Resultado \((Y)\): es la variable que queremos explicar o predecir
Predictor \((X)\): es la variable que utilizamos para explicar la variabilidad en \(Y\)
\[ Y=Modelo+Error \]
Warning
El efecto causal requeriría comparar:
Uno de los dos no es observable
Importante!
Correlación requiere variación
\[ Presupuesto_i = \alpha + \beta_1 Matricula_i \]
\[ Y_i = \alpha + \beta_1 x_i \]
\[ residuo_i = presupuesto_i - predicción_i \]
Calculamos el residuo para cada punto
Algunos valores serán positivos y otros negativos
Para que todos sean positivos los elevamos al cuadrado
Se le conoce así a la suma de errores individuales
Diferente líneas de ajuste tienen distintas SSE
Tip
X | Y |
---|---|
1 | 2 |
2 | 4 |
3 | 5 |
4 | 4 |
5 | 5 |
Calculamos las medias
Important
Note
Primero calculamos las distancias entre \(x\) y \(\bar{x}\)
X | Y | \(x-\bar{x}\) |
---|---|---|
1 | 2 | -2 |
2 | 4 | -1 |
3 | 5 | 0 |
4 | 4 | 1 |
5 | 5 | 2 |
Hacemos lo mismos con las distancias entre \(y\) y \(\bar{y}\)
X | Y | \(x-\bar{x}\) | \(y-\bar{y}\) |
---|---|---|---|
1 | 2 | -2 | -2 |
2 | 4 | -1 | 0 |
3 | 5 | 0 | 1 |
4 | 4 | 1 | 0 |
5 | 5 | 2 | 1 |
X | Y | \(x-\bar{x}\) | \(y-\bar{y}\) | \((x-\bar{x})^2\) | \((x-\bar{x})(y-\bar{y})\) |
---|---|---|---|---|---|
1 | 2 | -2 | -2 | 4 | 4 |
2 | 4 | -1 | 0 | 1 | 0 |
3 | 5 | 0 | 1 | 0 | 0 |
4 | 4 | 1 | 0 | 1 | 0 |
5 | 5 | 2 | 1 | 4 | 2 |
Total | 10 | 6 |
\[ \beta=\frac{\Sigma(x-\bar{x})(y-\bar{y}) }{\Sigma(x-\bar{x})^2} \] \[ \beta=\frac{6}{10}=0.6 \]
\[ y= \alpha+\beta x \] \[ 4= \alpha+0.6(3) \] \[ \alpha= 4-1.8=2.2 \]
Con diferentes muestras podemos obtener diferentes estimadores
Al repetir el ejercicio obtenemos una distribución muestral de estimadores
Tip
Valor verdadero
Si los estimadores no están sesgados la media de la distribución es igual al valor verdadero
Error estándar grande
Error estándar pequeño
Important
Tip
\(\beta_1 = 0\) vs \(\beta_1 \neq 0\)