Estadística para el Análisis Político | Lección 11 Regresión Lineal Múltiple

Marylia Cruz

Estadística Bivariada

  • La elección de tipo de prueba para el análisis bivariado depende del tipo de las variables.

¿Para qué sirven los modelos de regresión lineal?

Introducción

¿Cuál es la variable que van a explicar en sus trabajos grupales?

¿Cuáles son sus variables independientes?

Regresión lineal múltiple

  • Un modelo de regresión lineal tiene como variable dependiente una variable numérica o intervalar

  • Las variables explicativas (independientes) que son parte del modelo suelen ser numéricas o intervalares; sin embargo, es posible incorporar variables explicativas ordinales o categóricas Un modelo de regresión lineal puede ser bivariado o multivariado

Nota: El modelo de regresión lineal que se va a considerar aquí es el que se establece a partir del método de la recta de mínimos cuadrados

Modelo estadístico

Regresión lineal múltiple : Gráficas

Prueba Global

Estimadores/Coeficientes

R cuadrado

Una regresión lineal genera:

  • Un coeficiente de regresión (lineal) que estima el efecto de la variable independiente sobre la variable dependiente.

  • Una medida (R cuadrado) que indica en qué medida la variable independiente explica la variación en la variable dependiente

R cuadrado

  • Siempre y cuando se observe (o exista) una relación lineal, se puede calcular una ecuación lineal que predice los cambios en Y a partir de los cambios en X

  • Una regresión lineal a partir de la recta de mínimos cuadrados es aquella en la cual la ecuación que predice los cambios es la “mejor” línea en cuanto a la reducción de las distancias entre los valores observados y los valores que se predicen (suma de errores al cuadrado).

R cuadrado

Ejemplo

A partir de la lectura de Pavimentando con votos comprueba las hipótesis.

library(rio)
data <- import("pavimentando con votos.sav")
names(data)
[1] "poblacioncienmil" "nbi"              "consejocomunal"   "priorizado"      
[5] "uribista"         "ejecucion"        "apropiaciondolar" "pctopo"          
[9] "inversion"       

Ejemplo : Formateo de variables

Indicar el formato de las variables

data$poblacioncienmil=as.numeric(data$poblacioncienmil)
data$nbi=as.numeric(data$nbi)
data$consejocomunal=as.factor(data$consejocomunal)
data$priorizado=as.factor(data$priorizado)
data$uribista=as.numeric(data$uribista)
data$ejecucion=as.factor(data$ejecucion)
data$apropiaciondolar=as.numeric(data$apropiaciondolar)
data$pctopo=as.numeric(data$pctopo)

Ejemplo : Hipótesis 1 La asignación presupuestal se debe a criterios técnicos

modelo1=lm(apropiaciondolar~priorizado,data = data)
summary(modelo1)

Call:
lm(formula = apropiaciondolar ~ priorizado, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
 -8.277  -8.277  -8.272   1.108 124.371 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.277427   0.560554  14.766   <2e-16 ***
priorizado1 -0.005434   1.117040  -0.005    0.996    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.05 on 1094 degrees of freedom
Multiple R-squared:  2.163e-08, Adjusted R-squared:  -0.0009141 
F-statistic: 2.367e-05 on 1 and 1094 DF,  p-value: 0.9961

Ejemplo :

HIPOTESIS 2 : La asignación presupuestal en infraestructura vial en Colombia r esponde a negociaciones bilaterales entre el ejecutivo y el legislativo basadas en necesidades políticas y electorales de corto plazo

modelo2=lm(apropiaciondolar~uribista+pctopo,data = data)
summary(modelo2)

Call:
lm(formula = apropiaciondolar ~ uribista + pctopo, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-11.939  -8.803  -7.585   2.127 122.158 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 11.93907    1.18455  10.079  < 2e-16 ***
uribista    -3.04661    1.17808  -2.586  0.00987 ** 
pctopo      -0.04209    0.02282  -1.845  0.06539 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.74 on 885 degrees of freedom
  (208 observations deleted due to missingness)
Multiple R-squared:  0.009834,  Adjusted R-squared:  0.007596 
F-statistic: 4.395 on 2 and 885 DF,  p-value: 0.01261

Ejemplo:

HIPOTESIS 3 :la asignación presupuestal en infraestructura vial en Colombia responde al esfuerzo del gobierno por fortalecer su base social de apoyo local a través de los Consejos Comunales de Gobierno.

modelo3=lm(apropiaciondolar~consejocomunal+ejecucion,data = data)
summary(modelo3)

Call:
lm(formula = apropiaciondolar ~ consejocomunal + ejecucion, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-23.924  -7.321  -7.321   0.773 125.321 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)       7.3214     0.4928  14.855  < 2e-16 ***
consejocomunal1  16.6023     2.0734   8.007 2.98e-15 ***
ejecucion1        1.2232     2.4855   0.492    0.623    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 15.6 on 1093 degrees of freedom
Multiple R-squared:  0.05592,   Adjusted R-squared:  0.05419 
F-statistic: 32.37 on 2 and 1093 DF,  p-value: 2.198e-14

Ejemplo:

HIPOTESIS GENERAL: La asignación presupuestal se debe a criterios técnicas, políticos y populistas.

modelo4=lm(apropiaciondolar~priorizado+uribista+pctopo+consejocomunal+ejecucion+poblacioncienmil+nbi,data = data)
summary(modelo4)

Call:
lm(formula = apropiaciondolar ~ priorizado + uribista + pctopo + 
    consejocomunal + ejecucion + poblacioncienmil + nbi, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-60.201  -8.207  -5.875   2.505  92.488 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)      14.13181    1.67651   8.429  < 2e-16 ***
priorizado1      -2.21395    1.18715  -1.865  0.06253 .  
uribista         -2.57184    1.09188  -2.355  0.01872 *  
pctopo           -0.03096    0.02126  -1.456  0.14563    
consejocomunal1  14.05017    2.32452   6.044 2.23e-09 ***
ejecucion1        2.95688    2.80758   1.053  0.29255    
poblacioncienmil  1.83866    0.20024   9.182  < 2e-16 ***
nbi              -0.09292    0.02941  -3.160  0.00163 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 15.38 on 868 degrees of freedom
  (220 observations deleted due to missingness)
Multiple R-squared:  0.1751,    Adjusted R-squared:  0.1684 
F-statistic: 26.32 on 7 and 868 DF,  p-value: < 2.2e-16

Gráfico

library(jtools)
plot_coefs(modelo4)