Taller Final
library(MASS)
library(ISLR)
library(readxl)
library(readxl)
library(corrplot)
## corrplot 0.95 loaded
Datos <- read_excel("Datos_Modelo_de_Regresion_Lineal_Multiple.xlsx" , na = "-")
str(Datos)
## tibble [546,212 × 25] (S3: tbl_df/tbl/data.frame)
## $ ESTU_GENERO : chr [1:546212] "M" "M" "M" "M" ...
## $ PERIODO : num [1:546212] 20194 20194 20194 20194 20194 ...
## $ ESTU_TIENEETNIA : chr [1:546212] "No" "No" "No" "Si" ...
## $ ESTU_DEPTO_RESIDE : chr [1:546212] "MAGDALENA" "BOGOTÃ\u0081" "BOLIVAR" "BOGOTÃ\u0081" ...
## $ ESTU_COD_RESIDE_DEPTO : num [1:546212] 47 11 13 11 11 8 76 68 25 70 ...
## $ FAMI_ESTRATOVIVIENDA : chr [1:546212] "Estrato 3" "Estrato 3" "Estrato 1" "Estrato 3" ...
## $ COLE_NATURALEZA : chr [1:546212] "OFICIAL" "NO OFICIAL" "OFICIAL" "OFICIAL" ...
## $ COLE_CALENDARIO : chr [1:546212] "A" "A" "A" "A" ...
## $ PUNT_LECTURA_CRITICA : num [1:546212] 47 60 66 62 63 49 76 57 62 68 ...
## $ PERCENTIL_LECTURA_CRITICA : num [1:546212] 33 76 91 81 85 37 100 67 83 94 ...
## $ DESEMP_LECTURA_CRITICA : num [1:546212] 2 3 4 3 3 2 4 3 3 4 ...
## $ PUNT_MATEMATICAS : num [1:546212] 48 65 57 54 57 29 70 65 62 66 ...
## $ PERCENTIL_MATEMATICAS : num [1:546212] 42 88 70 60 70 4 96 88 82 91 ...
## $ DESEMP_MATEMATICAS : num [1:546212] 2 3 3 3 3 1 3 3 3 3 ...
## $ PUNT_C_NATURALES : num [1:546212] 37 54 41 61 55 41 70 63 66 63 ...
## $ PERCENTIL_C_NATURALES : num [1:546212] 15 71 29 87 74 26 98 90 95 91 ...
## $ DESEMP_C_NATURALES : num [1:546212] 1 2 2 3 2 2 3 3 3 3 ...
## $ PUNT_SOCIALES_CIUDADANAS : num [1:546212] 30 59 74 73 57 41 68 66 39 77 ...
## $ PERCENTIL_SOCIALES_CIUDADANAS: num [1:546212] 8 83 99 99 79 39 96 95 33 100 ...
## $ DESEMP_SOCIALES_CIUDADANAS : num [1:546212] 1 3 4 4 3 2 3 3 1 4 ...
## $ PUNT_INGLES : num [1:546212] 54 63 64 53 52 35 72 60 63 51 ...
## $ PERCENTIL_INGLES : num [1:546212] 67 88 89 67 63 14 96 83 88 61 ...
## $ DESEMP_INGLES : chr [1:546212] "A1" "A2" "A2" "A1" ...
## $ PUNT_GLOBAL : num [1:546212] 208 299 299 309 288 198 355 313 288 336 ...
## $ PERCENTIL_GLOBAL : num [1:546212] 25 83 84 88 78 19 99 89 78 95 ...
summary(Datos$ESTU_GENERO)
## Length Class Mode
## 546212 character character
Datos$ESTU_GENERO <- as.factor(Datos$ESTU_GENERO)
Datos$ESTU_TIENEETNIA <- as.factor(Datos$ESTU_TIENEETNIA)
Datos$ESTU_DEPTO_RESIDE <- as.factor(Datos$ESTU_DEPTO_RESIDE)
Datos$FAMI_ESTRATOVIVIENDA <- as.factor(Datos$FAMI_ESTRATOVIVIENDA)
Datos$COLE_NATURALEZA <- as.factor(Datos$COLE_NATURALEZA)
Datos$COLE_CALENDARIO <- as.factor(Datos$COLE_CALENDARIO)
# Resumen después de conversión
summary(Datos)
## ESTU_GENERO PERIODO ESTU_TIENEETNIA ESTU_DEPTO_RESIDE
## F :295994 Min. :20194 No :506074 BOGOTÃ\u0081: 83600
## M :250097 1st Qu.:20194 Si : 39761 ANTIOQUIA : 74228
## NA's: 121 Median :20194 NA's: 377 VALLE : 38640
## Mean :20194 CUNDINAMARCA: 36196
## 3rd Qu.:20194 ATLANTICO : 32179
## Max. :20194 (Other) :280992
## NA's : 377
## ESTU_COD_RESIDE_DEPTO FAMI_ESTRATOVIVIENDA COLE_NATURALEZA
## Min. : 5.00 Estrato 2 :188314 NO OFICIAL:130201
## 1st Qu.: 11.00 Estrato 1 :159977 OFICIAL :416011
## Median : 20.00 Estrato 3 :108692
## Mean : 57.03 Estrato 4 : 25810
## 3rd Qu.: 54.00 Sin Estrato: 17177
## Max. :99999.00 (Other) : 11735
## NA's :377 NA's : 34507
## COLE_CALENDARIO PUNT_LECTURA_CRITICA PERCENTIL_LECTURA_CRITICA
## A :541901 Min. : 0.00 Min. : 1.00
## B : 1140 1st Qu.: 45.00 1st Qu.: 25.00
## OTRO: 3171 Median : 52.00 Median : 50.00
## Mean : 52.16 Mean : 50.11
## 3rd Qu.: 60.00 3rd Qu.: 75.00
## Max. :100.00 Max. :100.00
##
## DESEMP_LECTURA_CRITICA PUNT_MATEMATICAS PERCENTIL_MATEMATICAS
## Min. :1.000 Min. : 0.00 Min. : 1.00
## 1st Qu.:2.000 1st Qu.: 42.00 1st Qu.: 25.00
## Median :3.000 Median : 51.00 Median : 50.00
## Mean :2.613 Mean : 50.61 Mean : 50.11
## 3rd Qu.:3.000 3rd Qu.: 59.00 3rd Qu.: 75.00
## Max. :4.000 Max. :100.00 Max. :100.00
##
## DESEMP_MATEMATICAS PUNT_C_NATURALES PERCENTIL_C_NATURALES DESEMP_C_NATURALES
## Min. :1.000 Min. : 0.00 Min. : 1.00 Min. :1.000
## 1st Qu.:2.000 1st Qu.: 40.00 1st Qu.: 25.00 1st Qu.:1.000
## Median :3.000 Median : 48.00 Median : 50.00 Median :2.000
## Mean :2.441 Mean : 48.23 Mean : 50.16 Mean :2.021
## 3rd Qu.:3.000 3rd Qu.: 56.00 3rd Qu.: 75.00 3rd Qu.:3.000
## Max. :4.000 Max. :100.00 Max. :100.00 Max. :4.000
##
## PUNT_SOCIALES_CIUDADANAS PERCENTIL_SOCIALES_CIUDADANAS
## Min. : 0.00 Min. : 1.00
## 1st Qu.: 37.00 1st Qu.: 25.00
## Median : 45.00 Median : 50.00
## Mean : 46.22 Mean : 50.18
## 3rd Qu.: 55.00 3rd Qu.: 75.00
## Max. :100.00 Max. :100.00
##
## DESEMP_SOCIALES_CIUDADANAS PUNT_INGLES PERCENTIL_INGLES
## Min. :1.000 Min. : 0.00 Min. : 1.0
## 1st Qu.:1.000 1st Qu.: 39.00 1st Qu.: 25.0
## Median :2.000 Median : 48.00 Median : 50.0
## Mean :1.902 Mean : 48.42 Mean : 50.1
## 3rd Qu.:2.000 3rd Qu.: 56.00 3rd Qu.: 75.0
## Max. :4.000 Max. :100.00 Max. :100.0
## NA's :19
## DESEMP_INGLES PUNT_GLOBAL PERCENTIL_GLOBAL
## Length:546212 Min. : 0.0 Min. : 1.00
## Class :character 1st Qu.:207.0 1st Qu.: 25.00
## Mode :character Median :243.0 Median : 50.00
## Mean :246.2 Mean : 49.99
## 3rd Qu.:282.0 3rd Qu.: 75.00
## Max. :477.0 Max. :100.00
## NA's :19
# Seleccionar solo las variables numéricas
numeric_data <- subset(Datos, select = c(PUNT_LECTURA_CRITICA, PUNT_MATEMATICAS,
PUNT_C_NATURALES, PUNT_SOCIALES_CIUDADANAS,
PUNT_INGLES))
# Matriz de correlación
cor_matrix <- cor(numeric_data, method = "pearson")
corrplot(round(cor_matrix, 3), type = "lower")
Datos_clean <- na.omit(Datos)
# Modelo inicial
modelo.lineal <- lm(PUNT_MATEMATICAS ~ ., data = Datos_clean)
summary(modelo.lineal)
##
## Call:
## lm(formula = PUNT_MATEMATICAS ~ ., data = Datos_clean)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.65535 -0.21382 -0.00161 0.21419 0.93561
##
## Coefficients: (2 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.799e-01 1.408e-02 12.781 < 2e-16 ***
## ESTU_GENEROM 1.398e-03 7.118e-04 1.964 0.04957 *
## PERIODO NA NA NA NA
## ESTU_TIENEETNIASi 1.363e-03 1.521e-03 0.897 0.36988
## ESTU_DEPTO_RESIDEANTIOQUIA -7.596e-03 9.363e-03 -0.811 0.41722
## ESTU_DEPTO_RESIDEARAUCA -3.895e-03 1.031e-02 -0.378 0.70542
## ESTU_DEPTO_RESIDEATLANTICO -7.800e-03 9.424e-03 -0.828 0.40785
## ESTU_DEPTO_RESIDEBOGOTÃ\u0081 -8.194e-03 9.365e-03 -0.875 0.38159
## ESTU_DEPTO_RESIDEBOLIVAR -5.268e-03 9.448e-03 -0.558 0.57714
## ESTU_DEPTO_RESIDEBOYACA -7.976e-03 9.524e-03 -0.837 0.40234
## ESTU_DEPTO_RESIDECALDAS -7.323e-03 9.639e-03 -0.760 0.44744
## ESTU_DEPTO_RESIDECAQUETA -3.867e-03 1.004e-02 -0.385 0.70019
## ESTU_DEPTO_RESIDECASANARE -6.857e-03 9.877e-03 -0.694 0.48751
## ESTU_DEPTO_RESIDECAUCA -5.493e-03 9.553e-03 -0.575 0.56526
## ESTU_DEPTO_RESIDECESAR -4.341e-03 9.571e-03 -0.454 0.65014
## ESTU_DEPTO_RESIDECHOCO -8.552e-03 1.003e-02 -0.852 0.39398
## ESTU_DEPTO_RESIDECORDOBA -5.181e-03 9.478e-03 -0.547 0.58467
## ESTU_DEPTO_RESIDECUNDINAMARCA -7.832e-03 9.416e-03 -0.832 0.40551
## ESTU_DEPTO_RESIDEEXTRANJERO -5.294e-03 2.442e-02 -0.217 0.82837
## ESTU_DEPTO_RESIDEGUAINIA -5.373e-03 1.832e-02 -0.293 0.76937
## ESTU_DEPTO_RESIDEGUAVIARE -1.246e-02 1.230e-02 -1.013 0.31088
## ESTU_DEPTO_RESIDEHUILA -9.243e-03 9.565e-03 -0.966 0.33389
## ESTU_DEPTO_RESIDELA GUAJIRA -8.079e-03 9.697e-03 -0.833 0.40474
## ESTU_DEPTO_RESIDEMAGDALENA -5.938e-03 9.524e-03 -0.624 0.53293
## ESTU_DEPTO_RESIDEMETA -7.192e-03 9.591e-03 -0.750 0.45334
## ESTU_DEPTO_RESIDENARIÑO -6.808e-03 9.513e-03 -0.716 0.47425
## ESTU_DEPTO_RESIDENORTE SANTANDER -5.419e-03 9.535e-03 -0.568 0.56980
## ESTU_DEPTO_RESIDEPUTUMAYO -5.479e-03 1.016e-02 -0.539 0.58978
## ESTU_DEPTO_RESIDEQUINDIO -8.731e-03 9.852e-03 -0.886 0.37551
## ESTU_DEPTO_RESIDERISARALDA -6.655e-03 9.633e-03 -0.691 0.48967
## ESTU_DEPTO_RESIDESAN ANDRES -8.136e-03 1.372e-02 -0.593 0.55306
## ESTU_DEPTO_RESIDESANTANDER -8.559e-03 9.456e-03 -0.905 0.36539
## ESTU_DEPTO_RESIDESUCRE -8.217e-03 9.620e-03 -0.854 0.39304
## ESTU_DEPTO_RESIDETOLIMA -6.484e-03 9.522e-03 -0.681 0.49592
## ESTU_DEPTO_RESIDEVALLE -8.071e-03 9.404e-03 -0.858 0.39073
## ESTU_DEPTO_RESIDEVAUPES 2.147e-02 1.737e-02 1.236 0.21664
## ESTU_DEPTO_RESIDEVICHADA 5.063e-03 1.474e-02 0.344 0.73119
## ESTU_COD_RESIDE_DEPTO NA NA NA NA
## FAMI_ESTRATOVIVIENDAEstrato 2 -9.779e-04 8.807e-04 -1.110 0.26684
## FAMI_ESTRATOVIVIENDAEstrato 3 -7.300e-04 1.061e-03 -0.688 0.49157
## FAMI_ESTRATOVIVIENDAEstrato 4 -8.749e-04 1.759e-03 -0.497 0.61899
## FAMI_ESTRATOVIVIENDAEstrato 5 2.072e-03 2.898e-03 0.715 0.47463
## FAMI_ESTRATOVIVIENDAEstrato 6 -8.463e-03 4.145e-03 -2.042 0.04115 *
## FAMI_ESTRATOVIVIENDASin Estrato -1.182e-03 2.028e-03 -0.583 0.56013
## COLE_NATURALEZAOFICIAL -2.616e-04 9.155e-04 -0.286 0.77509
## COLE_CALENDARIOB 8.012e-04 7.830e-03 0.102 0.91849
## COLE_CALENDARIOOTRO -2.087e-03 4.751e-03 -0.439 0.66050
## PUNT_LECTURA_CRITICA -9.784e-01 3.108e-04 -3148.177 < 2e-16 ***
## PERCENTIL_LECTURA_CRITICA -8.505e-04 9.407e-05 -9.041 < 2e-16 ***
## DESEMP_LECTURA_CRITICA -1.523e-03 1.186e-03 -1.284 0.19916
## PERCENTIL_MATEMATICAS 6.701e-03 9.473e-05 70.741 < 2e-16 ***
## DESEMP_MATEMATICAS 3.531e-02 1.171e-03 30.147 < 2e-16 ***
## PUNT_C_NATURALES -9.751e-01 3.449e-04 -2827.344 < 2e-16 ***
## PERCENTIL_C_NATURALES -2.001e-03 1.090e-04 -18.353 < 2e-16 ***
## DESEMP_C_NATURALES 4.798e-03 1.201e-03 3.995 6.48e-05 ***
## PUNT_SOCIALES_CIUDADANAS -9.795e-01 3.065e-04 -3195.874 < 2e-16 ***
## PERCENTIL_SOCIALES_CIUDADANAS -4.570e-04 1.200e-04 -3.808 0.00014 ***
## DESEMP_SOCIALES_CIUDADANAS -2.444e-03 1.196e-03 -2.044 0.04095 *
## PUNT_INGLES -3.264e-01 2.529e-04 -1290.545 < 2e-16 ***
## PERCENTIL_INGLES -1.192e-04 1.072e-04 -1.113 0.26586
## DESEMP_INGLESA1 -3.382e-03 1.538e-03 -2.199 0.02791 *
## DESEMP_INGLESA2 -7.378e-03 2.226e-03 -3.314 0.00092 ***
## DESEMP_INGLESB+ 3.587e-03 5.373e-03 0.668 0.50435
## DESEMP_INGLESB1 -4.822e-03 2.979e-03 -1.619 0.10551
## PUNT_GLOBAL 8.504e-01 1.649e-04 5158.261 < 2e-16 ***
## PERCENTIL_GLOBAL -5.697e-04 2.247e-04 -2.535 0.01124 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2471 on 511169 degrees of freedom
## Multiple R-squared: 0.9996, Adjusted R-squared: 0.9996
## F-statistic: 1.883e+07 on 63 and 511169 DF, p-value: < 2.2e-16
# Selección regresion stepwise
modelo.step <- stepAIC(modelo.lineal, direction = "both")
## Start: AIC=-1429374
## PUNT_MATEMATICAS ~ ESTU_GENERO + PERIODO + ESTU_TIENEETNIA +
## ESTU_DEPTO_RESIDE + ESTU_COD_RESIDE_DEPTO + FAMI_ESTRATOVIVIENDA +
## COLE_NATURALEZA + COLE_CALENDARIO + PUNT_LECTURA_CRITICA +
## PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS +
## DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES +
## DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES +
## DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
##
##
## Step: AIC=-1429374
## PUNT_MATEMATICAS ~ ESTU_GENERO + PERIODO + ESTU_TIENEETNIA +
## ESTU_DEPTO_RESIDE + FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA +
## COLE_CALENDARIO + PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA +
## DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS +
## PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES +
## PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES +
## DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
##
##
## Step: AIC=-1429374
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + ESTU_DEPTO_RESIDE +
## FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA + COLE_CALENDARIO +
## PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA +
## PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + PUNT_C_NATURALES +
## PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS +
## PERCENTIL_SOCIALES_CIUDADANAS + DESEMP_SOCIALES_CIUDADANAS +
## PUNT_INGLES + PERCENTIL_INGLES + DESEMP_INGLES + PUNT_GLOBAL +
## PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - ESTU_DEPTO_RESIDE 33 1 31208 -1429423
## - FAMI_ESTRATOVIVIENDA 6 0 31207 -1429380
## - COLE_CALENDARIO 2 0 31207 -1429378
## - COLE_NATURALEZA 1 0 31207 -1429376
## - ESTU_TIENEETNIA 1 0 31207 -1429376
## - PERCENTIL_INGLES 1 0 31207 -1429375
## - DESEMP_LECTURA_CRITICA 1 0 31207 -1429375
## <none> 31207 -1429374
## - ESTU_GENERO 1 0 31207 -1429372
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31207 -1429372
## - PERCENTIL_GLOBAL 1 0 31207 -1429370
## - DESEMP_INGLES 4 1 31208 -1429367
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31208 -1429362
## - DESEMP_C_NATURALES 1 1 31208 -1429360
## - PERCENTIL_LECTURA_CRITICA 1 5 31212 -1429295
## - PERCENTIL_C_NATURALES 1 21 31227 -1429040
## - DESEMP_MATEMATICAS 1 55 31262 -1428468
## - PERCENTIL_MATEMATICAS 1 306 31512 -1424396
## - PUNT_INGLES 1 101679 132886 -688674
## - PUNT_C_NATURALES 1 488027 519234 8065
## - PUNT_LECTURA_CRITICA 1 605069 636276 111987
## - PUNT_SOCIALES_CIUDADANAS 1 623542 654749 126619
## - PUNT_GLOBAL 1 1624400 1655607 600875
##
## Step: AIC=-1429423
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + FAMI_ESTRATOVIVIENDA +
## COLE_NATURALEZA + COLE_CALENDARIO + PUNT_LECTURA_CRITICA +
## PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS +
## DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES +
## DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES +
## DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - FAMI_ESTRATOVIVIENDA 6 0 31208 -1429427
## - COLE_CALENDARIO 2 0 31208 -1429426
## - COLE_NATURALEZA 1 0 31208 -1429425
## - PERCENTIL_INGLES 1 0 31208 -1429423
## - ESTU_TIENEETNIA 1 0 31208 -1429423
## - DESEMP_LECTURA_CRITICA 1 0 31208 -1429423
## <none> 31208 -1429423
## + ESTU_COD_RESIDE_DEPTO 1 0 31208 -1429421
## - ESTU_GENERO 1 0 31208 -1429421
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31208 -1429421
## - PERCENTIL_GLOBAL 1 0 31208 -1429418
## - DESEMP_INGLES 4 1 31209 -1429415
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31209 -1429410
## - DESEMP_C_NATURALES 1 1 31209 -1429409
## + ESTU_DEPTO_RESIDE 33 1 31207 -1429374
## - PERCENTIL_LECTURA_CRITICA 1 5 31213 -1429343
## - PERCENTIL_C_NATURALES 1 21 31229 -1429087
## - DESEMP_MATEMATICAS 1 56 31264 -1428516
## - PERCENTIL_MATEMATICAS 1 306 31514 -1424444
## - PUNT_INGLES 1 101712 132920 -688610
## - PUNT_C_NATURALES 1 488288 519496 8256
## - PUNT_LECTURA_CRITICA 1 605281 636489 112092
## - PUNT_SOCIALES_CIUDADANAS 1 623891 655099 126826
## - PUNT_GLOBAL 1 1625421 1656629 601124
##
## Step: AIC=-1429427
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + COLE_NATURALEZA +
## COLE_CALENDARIO + PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA +
## DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS +
## PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES +
## PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES +
## DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - COLE_CALENDARIO 2 0 31208 -1429431
## - COLE_NATURALEZA 1 0 31208 -1429429
## - PERCENTIL_INGLES 1 0 31209 -1429428
## - DESEMP_LECTURA_CRITICA 1 0 31209 -1429428
## - ESTU_TIENEETNIA 1 0 31209 -1429427
## <none> 31208 -1429427
## - ESTU_GENERO 1 0 31209 -1429425
## + ESTU_COD_RESIDE_DEPTO 1 0 31208 -1429425
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31209 -1429425
## + FAMI_ESTRATOVIVIENDA 6 0 31208 -1429423
## - PERCENTIL_GLOBAL 1 0 31209 -1429423
## - DESEMP_INGLES 4 1 31209 -1429419
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31209 -1429415
## - DESEMP_C_NATURALES 1 1 31209 -1429413
## + ESTU_DEPTO_RESIDE 33 1 31207 -1429380
## - PERCENTIL_LECTURA_CRITICA 1 5 31213 -1429347
## - PERCENTIL_C_NATURALES 1 21 31229 -1429092
## - DESEMP_MATEMATICAS 1 56 31264 -1428520
## - PERCENTIL_MATEMATICAS 1 306 31514 -1424448
## - PUNT_INGLES 1 101885 133093 -687958
## - PUNT_C_NATURALES 1 488367 519576 8323
## - PUNT_LECTURA_CRITICA 1 605520 636729 112273
## - PUNT_SOCIALES_CIUDADANAS 1 624154 655362 127019
## - PUNT_GLOBAL 1 1625730 1656938 601208
##
## Step: AIC=-1429431
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + COLE_NATURALEZA +
## PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA +
## PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + PUNT_C_NATURALES +
## PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS +
## PERCENTIL_SOCIALES_CIUDADANAS + DESEMP_SOCIALES_CIUDADANAS +
## PUNT_INGLES + PERCENTIL_INGLES + DESEMP_INGLES + PUNT_GLOBAL +
## PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - COLE_NATURALEZA 1 0 31208 -1429433
## - PERCENTIL_INGLES 1 0 31209 -1429432
## - DESEMP_LECTURA_CRITICA 1 0 31209 -1429431
## - ESTU_TIENEETNIA 1 0 31209 -1429431
## <none> 31208 -1429431
## - ESTU_GENERO 1 0 31209 -1429429
## + ESTU_COD_RESIDE_DEPTO 1 0 31208 -1429429
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31209 -1429429
## + COLE_CALENDARIO 2 0 31208 -1429427
## + FAMI_ESTRATOVIVIENDA 6 0 31208 -1429426
## - PERCENTIL_GLOBAL 1 0 31209 -1429426
## - DESEMP_INGLES 4 1 31209 -1429423
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31209 -1429419
## - DESEMP_C_NATURALES 1 1 31209 -1429417
## + ESTU_DEPTO_RESIDE 33 1 31207 -1429384
## - PERCENTIL_LECTURA_CRITICA 1 5 31213 -1429351
## - PERCENTIL_C_NATURALES 1 21 31229 -1429095
## - DESEMP_MATEMATICAS 1 56 31264 -1428524
## - PERCENTIL_MATEMATICAS 1 306 31514 -1424452
## - PUNT_INGLES 1 101889 133097 -687945
## - PUNT_C_NATURALES 1 488368 519577 8321
## - PUNT_LECTURA_CRITICA 1 605532 636740 112278
## - PUNT_SOCIALES_CIUDADANAS 1 624155 655363 127016
## - PUNT_GLOBAL 1 1625760 1656968 601213
##
## Step: AIC=-1429433
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA +
## PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS +
## DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES +
## DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES +
## DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - PERCENTIL_INGLES 1 0 31209 -1429434
## - DESEMP_LECTURA_CRITICA 1 0 31209 -1429433
## - ESTU_TIENEETNIA 1 0 31209 -1429433
## <none> 31208 -1429433
## - ESTU_GENERO 1 0 31209 -1429431
## + COLE_NATURALEZA 1 0 31208 -1429431
## + ESTU_COD_RESIDE_DEPTO 1 0 31208 -1429431
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31209 -1429431
## + COLE_CALENDARIO 2 0 31208 -1429429
## + FAMI_ESTRATOVIVIENDA 6 0 31208 -1429428
## - PERCENTIL_GLOBAL 1 0 31209 -1429428
## - DESEMP_INGLES 4 1 31209 -1429425
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31209 -1429420
## - DESEMP_C_NATURALES 1 1 31209 -1429419
## + ESTU_DEPTO_RESIDE 33 1 31207 -1429386
## - PERCENTIL_LECTURA_CRITICA 1 5 31213 -1429353
## - PERCENTIL_C_NATURALES 1 21 31229 -1429097
## - DESEMP_MATEMATICAS 1 56 31264 -1428526
## - PERCENTIL_MATEMATICAS 1 306 31514 -1424454
## - PUNT_INGLES 1 101920 133128 -687829
## - PUNT_C_NATURALES 1 488376 519585 8326
## - PUNT_LECTURA_CRITICA 1 605550 636759 112291
## - PUNT_SOCIALES_CIUDADANAS 1 624156 655365 127015
## - PUNT_GLOBAL 1 1625770 1656978 601214
##
## Step: AIC=-1429434
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA +
## PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS +
## DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES +
## DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + DESEMP_INGLES +
## PUNT_GLOBAL + PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - DESEMP_LECTURA_CRITICA 1 0 31209 -1429434
## - ESTU_TIENEETNIA 1 0 31209 -1429434
## <none> 31209 -1429434
## + PERCENTIL_INGLES 1 0 31208 -1429433
## - ESTU_GENERO 1 0 31209 -1429432
## + COLE_NATURALEZA 1 0 31209 -1429432
## + ESTU_COD_RESIDE_DEPTO 1 0 31209 -1429432
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31209 -1429431
## + COLE_CALENDARIO 2 0 31209 -1429430
## + FAMI_ESTRATOVIVIENDA 6 0 31208 -1429429
## - PERCENTIL_GLOBAL 1 0 31209 -1429428
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31209 -1429422
## - DESEMP_C_NATURALES 1 1 31210 -1429420
## - DESEMP_INGLES 4 3 31211 -1429396
## + ESTU_DEPTO_RESIDE 33 1 31207 -1429387
## - PERCENTIL_LECTURA_CRITICA 1 5 31214 -1429354
## - PERCENTIL_C_NATURALES 1 21 31229 -1429099
## - DESEMP_MATEMATICAS 1 56 31264 -1428525
## - PERCENTIL_MATEMATICAS 1 309 31517 -1424405
## - PUNT_C_NATURALES 1 488385 519594 8333
## - PUNT_INGLES 1 499776 530984 19419
## - PUNT_LECTURA_CRITICA 1 605567 636776 112303
## - PUNT_SOCIALES_CIUDADANAS 1 624157 655366 127014
## - PUNT_GLOBAL 1 1627234 1658443 601664
##
## Step: AIC=-1429434
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA +
## PERCENTIL_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS +
## PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES +
## PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + DESEMP_INGLES +
## PUNT_GLOBAL + PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## - ESTU_TIENEETNIA 1 0 31209 -1429434
## <none> 31209 -1429434
## + DESEMP_LECTURA_CRITICA 1 0 31209 -1429434
## + PERCENTIL_INGLES 1 0 31209 -1429433
## - ESTU_GENERO 1 0 31209 -1429432
## + COLE_NATURALEZA 1 0 31209 -1429432
## + ESTU_COD_RESIDE_DEPTO 1 0 31209 -1429432
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31209 -1429432
## + COLE_CALENDARIO 2 0 31209 -1429430
## + FAMI_ESTRATOVIVIENDA 6 0 31208 -1429430
## - PERCENTIL_GLOBAL 1 0 31209 -1429428
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31210 -1429422
## - DESEMP_C_NATURALES 1 1 31210 -1429420
## - DESEMP_INGLES 4 3 31211 -1429397
## + ESTU_DEPTO_RESIDE 33 1 31207 -1429387
## - PERCENTIL_LECTURA_CRITICA 1 5 31214 -1429354
## - PERCENTIL_C_NATURALES 1 21 31229 -1429100
## - DESEMP_MATEMATICAS 1 56 31264 -1428526
## - PERCENTIL_MATEMATICAS 1 309 31517 -1424404
## - PUNT_C_NATURALES 1 488395 519603 8341
## - PUNT_INGLES 1 499776 530984 19417
## - PUNT_SOCIALES_CIUDADANAS 1 624158 655367 127013
## - PUNT_LECTURA_CRITICA 1 640755 671964 139798
## - PUNT_GLOBAL 1 1627251 1658459 601667
##
## Step: AIC=-1429434
## PUNT_MATEMATICAS ~ ESTU_GENERO + PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA +
## PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + PUNT_C_NATURALES +
## PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS +
## PERCENTIL_SOCIALES_CIUDADANAS + DESEMP_SOCIALES_CIUDADANAS +
## PUNT_INGLES + DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
##
## Df Sum of Sq RSS AIC
## <none> 31209 -1429434
## + ESTU_TIENEETNIA 1 0 31209 -1429434
## + DESEMP_LECTURA_CRITICA 1 0 31209 -1429434
## + PERCENTIL_INGLES 1 0 31209 -1429433
## - ESTU_GENERO 1 0 31209 -1429432
## + COLE_NATURALEZA 1 0 31209 -1429432
## + ESTU_COD_RESIDE_DEPTO 1 0 31209 -1429432
## - DESEMP_SOCIALES_CIUDADANAS 1 0 31209 -1429432
## + COLE_CALENDARIO 2 0 31209 -1429430
## + FAMI_ESTRATOVIVIENDA 6 0 31208 -1429430
## - PERCENTIL_GLOBAL 1 0 31209 -1429428
## - PERCENTIL_SOCIALES_CIUDADANAS 1 1 31210 -1429422
## - DESEMP_C_NATURALES 1 1 31210 -1429420
## - DESEMP_INGLES 4 3 31212 -1429397
## + ESTU_DEPTO_RESIDE 33 1 31208 -1429388
## - PERCENTIL_LECTURA_CRITICA 1 5 31214 -1429355
## - PERCENTIL_C_NATURALES 1 21 31229 -1429100
## - DESEMP_MATEMATICAS 1 56 31264 -1428527
## - PERCENTIL_MATEMATICAS 1 309 31518 -1424403
## - PUNT_C_NATURALES 1 488425 519634 8368
## - PUNT_INGLES 1 499939 531148 19573
## - PUNT_SOCIALES_CIUDADANAS 1 624325 655534 127141
## - PUNT_LECTURA_CRITICA 1 640838 672047 139860
## - PUNT_GLOBAL 1 1627439 1658647 601723
summary(modelo.step)
##
## Call:
## lm(formula = PUNT_MATEMATICAS ~ ESTU_GENERO + PUNT_LECTURA_CRITICA +
## PERCENTIL_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS +
## PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES +
## PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS +
## DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + DESEMP_INGLES +
## PUNT_GLOBAL + PERCENTIL_GLOBAL, data = Datos_clean)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.65554 -0.21388 -0.00168 0.21424 0.94312
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.789e-01 9.166e-03 19.514 < 2e-16 ***
## ESTU_GENEROM 1.389e-03 7.094e-04 1.958 0.050213 .
## PUNT_LECTURA_CRITICA -9.785e-01 3.020e-04 -3239.941 < 2e-16 ***
## PERCENTIL_LECTURA_CRITICA -8.450e-04 9.373e-05 -9.015 < 2e-16 ***
## PERCENTIL_MATEMATICAS 6.711e-03 9.436e-05 71.118 < 2e-16 ***
## DESEMP_MATEMATICAS 3.532e-02 1.171e-03 30.167 < 2e-16 ***
## PUNT_C_NATURALES -9.751e-01 3.448e-04 -2828.537 < 2e-16 ***
## PERCENTIL_C_NATURALES -1.996e-03 1.088e-04 -18.344 < 2e-16 ***
## DESEMP_C_NATURALES 4.809e-03 1.201e-03 4.005 6.21e-05 ***
## PUNT_SOCIALES_CIUDADANAS -9.795e-01 3.063e-04 -3197.926 < 2e-16 ***
## PERCENTIL_SOCIALES_CIUDADANAS -4.484e-04 1.196e-04 -3.748 0.000178 ***
## DESEMP_SOCIALES_CIUDADANAS -2.421e-03 1.195e-03 -2.026 0.042771 *
## PUNT_INGLES -3.267e-01 1.141e-04 -2861.684 < 2e-16 ***
## DESEMP_INGLESA1 -4.338e-03 1.334e-03 -3.252 0.001148 **
## DESEMP_INGLESA2 -8.561e-03 2.014e-03 -4.250 2.13e-05 ***
## DESEMP_INGLESB+ 6.140e-03 4.718e-03 1.301 0.193159
## DESEMP_INGLESB1 -4.690e-03 2.934e-03 -1.598 0.110013
## PUNT_GLOBAL 8.504e-01 1.647e-04 5163.157 < 2e-16 ***
## PERCENTIL_GLOBAL -6.233e-04 2.208e-04 -2.823 0.004756 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2471 on 511214 degrees of freedom
## Multiple R-squared: 0.9996, Adjusted R-squared: 0.9996
## F-statistic: 6.591e+07 on 18 and 511214 DF, p-value: < 2.2e-16