Modelo de Regresión Lineal Simple y Múltiple

Ejercicio 1

Modelo de regresión lineal simple

Primero, vamos a calcular 01 modelo de regresión lineal simple para la esperanza de vida de las mujeres según la tasa de fertilidad. Considere las siguientes variables:

Variable dependiente: Expectativa de vida (“lifExpFem”)

Variable independiente: Tasa de fecundidad (“tfr”)

Exploración gráfica

Presente el diagrama de dispersión correspondiente y responda preliminarmente si un modelo de regresión lineal podría ajustar bien los datos presentados.

#Gráfico 1

ggplot(data1519, aes(x=tfr, y=lifExpFem)) +
    geom_point() + 
    geom_smooth(method="lm", se = F) + 
    xlab("Número de hijos por mujer") +
    ylab("Esperanza de vida en años") +
    ggtitle("Mundo 2015-2019: Esperanza de vida al nacer de las mujeres según \ntasa global de fecundidad") +
  theme_classic()

Estimación de parámetros y bondad de ajuste

Calcule los coeficientes del modelo

reg_evida1 <- lm(lifExpFem ~ tfr, data = data1519)

summary(reg_evida1)

## 
## Call:
## lm(formula = lifExpFem ~ tfr, data = data1519)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -16.1850  -2.2070   0.2299   2.8533  10.9325 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  88.6175     0.7295  121.47   <2e-16 ***
## tfr          -5.1858     0.2364  -21.93   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.251 on 182 degrees of freedom
##   (10 observations deleted due to missingness)
## Multiple R-squared:  0.7255, Adjusted R-squared:  0.724 
## F-statistic:   481 on 1 and 182 DF,  p-value: < 2.2e-16

Evalúe el ajuste/desempeño del modelo: F y R ²
Evalúe si la variable independiente tiene un “efecto” estadísticamente significativo sobre la variable dependiente. Considere el siguiente juego de hipótesis específicas:

H0: B1 = 0; H1: B1 < 0

Modelo de regresión lineal múltiple

Ahora, vamos calcular 01 modelo de regresión lineal múltiple para la esperanza de vida de las mujeres según la tasa de fertilidad y el porcentaje de contracepción. Considere las siguientes variables:

Variable dependiente: Expectativa de vida (“lifExpFem”)

Variable independiente: Tasa de fecundidad (“tfr”)

Variable independiente: Porcentaje de contracepción (“contracep”)

Exploración gráfica

Presente el diagrama de dispersión correspondiente a la segunda variable independiente y responda preliminarmente si un modelo de regresión lineal podría ajustar bien los datos presentados.

#Gráfico 2

ggplot(data1519, aes(x=contracep, y=lifExpFem)) +
    geom_point() + 
    geom_smooth(method="lm", se = F) + 
    xlab("Número de hijos por mujer") +
    ylab("Esperanza de vida en años") +
    ggtitle("Mundo 2015-2019: Esperanza de vida al nacer de las mujeres según \nContracepción") + 
  theme_classic()

Estimación de parámetros y bondad de ajuste

Calcule los coeficientes del segundo modelo

reg_evida2 <- lm(lifExpFem ~ tfr + contracep, data = data1519)

summary(reg_evida2)

## 
## Call:
## lm(formula = lifExpFem ~ tfr + contracep, data = data1519)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.5628 -1.8275 -0.1801  2.5416  9.4862 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 79.45111    4.34713  18.277  < 2e-16 ***
## tfr         -3.71723    0.67542  -5.504 1.35e-06 ***
## contracep    0.08792    0.04642   1.894   0.0641 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.306 on 49 degrees of freedom
##   (142 observations deleted due to missingness)
## Multiple R-squared:  0.7584, Adjusted R-squared:  0.7485 
## F-statistic: 76.89 on 2 and 49 DF,  p-value: 7.721e-16

Evalúe el ajuste/desempeño del modelo: R ²
Evalúe si la variable independiente tiene un “efecto” estadísticamente significativa sobre la variable dependiente. Considere:

H0: B1 = 0; H1: B1 < 0

H0: B2 = 0; H1: B2 > 0

library(stargazer)

stargazer(reg_evida1 , reg_evida2  , type = "text",
        omit.stat=c("ser", "f"), 
        dep.var.labels = "Expectativa de vida femenina",
        dep.var.caption = "Variable dependiente:",
        star.cutoffs = c(0.05, 0.01, 0.001))

## 
## ===========================================
##                  Variable dependiente:     
##              ------------------------------
##               Expectativa de vida femenina 
##                    (1)             (2)     
## -------------------------------------------
## tfr             -5.186***       -3.717***  
##                  (0.236)         (0.675)   
##                                            
## contracep                         0.088    
##                                  (0.046)   
##                                            
## Constant        88.617***       79.451***  
##                  (0.730)         (4.347)   
##                                            
## -------------------------------------------
## Observations       184             52      
## R2                0.725           0.758    
## Adjusted R2       0.724           0.748    
## ===========================================
## Note:         *p<0.05; **p<0.01; ***p<0.001

Comparación de modelos de regresión simple y múltiple

¿Qué cambios puede usted observar entre los dos modelos de regresión lineal? Utilice el coeficiente de bondad de ajuste.

Estimación puntual

Durante el quinquenio 2015-2019:

¿Cuál sería la esperanza de vida de las mujeres en un país con una tasa de fecundidad de 4 hijos por mujer y 70 (%) en contracepción?

new.data <- data.frame(tfr = 4 , contracep = 70)
predict(reg_evida2 , new.data, type = "response")

##        1 
## 70.73641

¿Cuál sería en un país con 5 hijos por mujer, mientras que el otro indicador se mantiene constante?

new.data <- data.frame(tfr = 5, contracep = 70)
predict(reg_evida2 , new.data, type = "response")

##        1 
## 67.01918

Ejercicio 2

Calcule un modelo 3 de regresión lineal simple que considere las siguientes variables:
- Dependiente: Tasa de fertilidad(“tfr”)
- Independiente: Participación femenina en la fuerza laboral(“femWork”)

¿El ajuste del modelo es adecuado (Prueba F)?
Ahora, incluya en el modelo anterior el porcentaje de personas que viven con menos de US$ 1.90 al día (“extPov”)
- Calcule el modelo 4 de regresión múltiple
- ¿El ajuste del modelo 4 es adecuado?
- ¿Cuánta varianza de la variable dependiente explica el modelo 2?
- ¿Las variables independientes presentan un “efecto” real sobre la variable dependiente?

Ejercicio 3

Calcule un modelo 5 de regresión lineal simple que considere las siguientes variables:
- Dependiente: Tasa de fertilidad (“tfr”)
- Independiente 1: % Mujeres que utilizan anticonceptivos(“contracep”)
- Independiente 2: cobertura de servicios básicos(%)(“sanitat”)
¿Cuál de los predictores es el más importante en el modelo 5?
Finalmente, incluya una variable más que, según su criterio, tenga un “efecto” real en la tasa de fertilidad:
- Calcule un modelo 6
- Compare el desempéño de ambos modelos

Modelo de Regresión Lineal Simple y Múltiple

César Córdova Cáceres

12/4/2021

Ejercicio 1

Ejercicio 2

Ejercicio 3