Regresión Múltiple

Regresión de la desición de continuar estudios superiores

  1. Cargamos la base de datos CASEN
library(haven)
Casen_2017 <- read_dta("D:/DESCARGAS/Casen 2017.dta")
View(Casen_2017)
  1. Establecemos las variables explicativas: Se establecen como variables explicativas: Sexo, Ytoth y HH_DSERVBAS, y la variable dependiente: “educ”:
educ <- c(Casen_2017$educ)
sexo <- c(Casen_2017$sexo)
ingreso <- c(Casen_2017$ytoth)
hogar_carente <- c(Casen_2017$hh_d_servbas)
  1. Tras crear las variables del estudio, se ha de generar un dataframe con todos los datos correspondientes y aplicamos la regresión:
datos <- data.frame(sexo,ingreso,hogar_carente,educ)
datos
RMULTIPLE <- lm(educ ~ sexo + ingreso + hogar_carente , data = datos)
RMULTIPLE
## 
## Call:
## lm(formula = educ ~ sexo + ingreso + hogar_carente, data = datos)
## 
## Coefficients:
##   (Intercept)           sexo        ingreso  hogar_carente  
##     3.965e+00      1.069e-01      5.813e-07     -1.296e+00
summary(RMULTIPLE)
## 
## Call:
## lm(formula = educ ~ sexo + ingreso + hogar_carente, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -50.839  -3.317  -1.194   1.527  96.131 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    3.965e+00  5.410e-02   73.29  < 2e-16 ***
## sexo           1.069e-01  3.240e-02    3.30 0.000967 ***
## ingreso        5.813e-07  1.150e-08   50.54  < 2e-16 ***
## hogar_carente -1.296e+00  5.666e-02  -22.87  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.521 on 216108 degrees of freedom
##   (327 observations deleted due to missingness)
## Multiple R-squared:  0.01506,    Adjusted R-squared:  0.01505 
## F-statistic:  1102 on 3 and 216108 DF,  p-value: < 2.2e-16