Modelo de regresión simple o con un único regresor

Francisco Orlando Rosales

Calculo de los estimadores \(\beta_0\) y \(\beta_1\)

Primero partimos de las ecuaciones

\[ \begin{aligned} \text{Estimando el } \beta_1\\ \widehat{\beta}_1=\frac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^n(x_i-\bar{x})^2} \end{aligned} \]

a partir de esta ecuación estimo el parametro \(\beta_1\) con los datos de california

Sintaxis y vizualización de los estimadores

pacman::p_load(AER,
               tidyverse,
               stargazer)
data("CASchools")

CASchools %>%
  mutate(Notas=(read+math)/2,
         REM=students/teachers,
         b1=sum((REM-mean(REM))*(Notas-mean(Notas)))/sum((REM-mean(REM))^2),
         b0=mean(Notas)-b1*mean(REM)) %>% 
  select(b0,b1) %>% 
  head(1) %>% 
  round(2) %>% 
  print()
      b0    b1
1 698.93 -2.28

Presentación de los resultados

\[ \widehat{Notas}_i=698.93-2.28REM_i \] Interpretación ceteris paribus

Si se añade un alumno por clase, en promedio las notas caen en 2.28 puntos

Modelo para pronosticar

\[ \begin{aligned} \text{ El distrio X tiene un valor de }REM=14\\ \text{¿cuál es el valor pronosticado de sus notas promedio?}\\ \widehat{Notas}_i=698.93-2.28\times 14= 667.01 \end{aligned} \]

[1] 667.01

Mas interpretaciones

  • Si la REM aumenta en 2 unidades, las notas bajan, en promedio en \(-2,28\times2=4.56\)

  • \(\widehat{\beta}_0\): distritos con cero estudiantes por profesor tendrían una nota media predicha de \(698.93\) puntos. Esta estimación no tiene sentido, simplemente extrapola la linea fuera del rango de valores reales

Estimación del modelo usando comandos en R


Call:
lm(formula = Notas ~ REM, data = CASchools)

Residuals:
    Min      1Q  Median      3Q     Max 
-47.727 -14.251   0.483  12.822  48.540 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 698.9329     9.4675  73.825  < 2e-16 ***
REM          -2.2798     0.4798  -4.751 2.78e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 18.58 on 418 degrees of freedom
Multiple R-squared:  0.05124,   Adjusted R-squared:  0.04897 
F-statistic: 22.58 on 1 and 418 DF,  p-value: 2.783e-06
                2.5 %     97.5 %
(Intercept) 680.32312 717.542775
REM          -3.22298  -1.336636

Presentación completa

\[ \begin{aligned} \widehat{Notas}_i&=698.93-2.28REM_i\\ &\hspace{0.5cm}(9.4675)(0.4798)\\ &R^2=0.05 \hspace{0.3cm} n=420 \end{aligned} \]

Regresión con variable binaria

\[ \beta_1=E(Y_i|X_i=1)-E(Y_i|X_i=1) \] Es decir equivale a una diferencia de medias

Aplicación usando R


===============================================
                        Dependent variable:    
                    ---------------------------
                               Notas           
-----------------------------------------------
D                              7.169           
                              (1.847)          
                             t = 3.882         
                                               
Constant                      650.077          
                              (1.393)          
                            t = 466.666        
                                               
-----------------------------------------------
Observations                    420            
R2                             0.035           
Adjusted R2                    0.032           
Residual Std. Error      18.741 (df = 418)     
F Statistic           15.073*** (df = 1; 418)  
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

¿Cómo interpretas \(\beta_1\)?

Como es una diferencia de medias se interpreta asi:

Los distritos que tienen una REM pequeña (\(<20\)) en promedio, alcanzaron 7.2 puntos mas en las calificaicones que los distritos con la REM grande (\(\geq 20\)), esto es signficativo el 1% (\(p<0.01\)) o (\(|t^{act}\approx 3.9|>2.58\Rightarrow \text{REchazar }H_0\))

[1] 2.575829