Taller Final

library(MASS)
library(ISLR)
library(readxl)
library(readxl)
library(corrplot)
## corrplot 0.95 loaded
Datos <- read_excel("Datos_Modelo_de_Regresion_Lineal_Multiple.xlsx" , na = "-")
str(Datos)
## tibble [546,212 × 25] (S3: tbl_df/tbl/data.frame)
##  $ ESTU_GENERO                  : chr [1:546212] "M" "M" "M" "M" ...
##  $ PERIODO                      : num [1:546212] 20194 20194 20194 20194 20194 ...
##  $ ESTU_TIENEETNIA              : chr [1:546212] "No" "No" "No" "Si" ...
##  $ ESTU_DEPTO_RESIDE            : chr [1:546212] "MAGDALENA" "BOGOTÃ\u0081" "BOLIVAR" "BOGOTÃ\u0081" ...
##  $ ESTU_COD_RESIDE_DEPTO        : num [1:546212] 47 11 13 11 11 8 76 68 25 70 ...
##  $ FAMI_ESTRATOVIVIENDA         : chr [1:546212] "Estrato 3" "Estrato 3" "Estrato 1" "Estrato 3" ...
##  $ COLE_NATURALEZA              : chr [1:546212] "OFICIAL" "NO OFICIAL" "OFICIAL" "OFICIAL" ...
##  $ COLE_CALENDARIO              : chr [1:546212] "A" "A" "A" "A" ...
##  $ PUNT_LECTURA_CRITICA         : num [1:546212] 47 60 66 62 63 49 76 57 62 68 ...
##  $ PERCENTIL_LECTURA_CRITICA    : num [1:546212] 33 76 91 81 85 37 100 67 83 94 ...
##  $ DESEMP_LECTURA_CRITICA       : num [1:546212] 2 3 4 3 3 2 4 3 3 4 ...
##  $ PUNT_MATEMATICAS             : num [1:546212] 48 65 57 54 57 29 70 65 62 66 ...
##  $ PERCENTIL_MATEMATICAS        : num [1:546212] 42 88 70 60 70 4 96 88 82 91 ...
##  $ DESEMP_MATEMATICAS           : num [1:546212] 2 3 3 3 3 1 3 3 3 3 ...
##  $ PUNT_C_NATURALES             : num [1:546212] 37 54 41 61 55 41 70 63 66 63 ...
##  $ PERCENTIL_C_NATURALES        : num [1:546212] 15 71 29 87 74 26 98 90 95 91 ...
##  $ DESEMP_C_NATURALES           : num [1:546212] 1 2 2 3 2 2 3 3 3 3 ...
##  $ PUNT_SOCIALES_CIUDADANAS     : num [1:546212] 30 59 74 73 57 41 68 66 39 77 ...
##  $ PERCENTIL_SOCIALES_CIUDADANAS: num [1:546212] 8 83 99 99 79 39 96 95 33 100 ...
##  $ DESEMP_SOCIALES_CIUDADANAS   : num [1:546212] 1 3 4 4 3 2 3 3 1 4 ...
##  $ PUNT_INGLES                  : num [1:546212] 54 63 64 53 52 35 72 60 63 51 ...
##  $ PERCENTIL_INGLES             : num [1:546212] 67 88 89 67 63 14 96 83 88 61 ...
##  $ DESEMP_INGLES                : chr [1:546212] "A1" "A2" "A2" "A1" ...
##  $ PUNT_GLOBAL                  : num [1:546212] 208 299 299 309 288 198 355 313 288 336 ...
##  $ PERCENTIL_GLOBAL             : num [1:546212] 25 83 84 88 78 19 99 89 78 95 ...
summary(Datos$ESTU_GENERO)
##    Length     Class      Mode 
##    546212 character character
Datos$ESTU_GENERO <- as.factor(Datos$ESTU_GENERO)
Datos$ESTU_TIENEETNIA <- as.factor(Datos$ESTU_TIENEETNIA)
Datos$ESTU_DEPTO_RESIDE <- as.factor(Datos$ESTU_DEPTO_RESIDE)
Datos$FAMI_ESTRATOVIVIENDA <- as.factor(Datos$FAMI_ESTRATOVIVIENDA)
Datos$COLE_NATURALEZA <- as.factor(Datos$COLE_NATURALEZA)
Datos$COLE_CALENDARIO <- as.factor(Datos$COLE_CALENDARIO)

# Resumen después de conversión
summary(Datos)
##  ESTU_GENERO      PERIODO      ESTU_TIENEETNIA ESTU_DEPTO_RESIDE    
##  F   :295994   Min.   :20194   No  :506074     BOGOTÃ\u0081: 83600  
##  M   :250097   1st Qu.:20194   Si  : 39761     ANTIOQUIA   : 74228  
##  NA's:   121   Median :20194   NA's:   377     VALLE       : 38640  
##                Mean   :20194                   CUNDINAMARCA: 36196  
##                3rd Qu.:20194                   ATLANTICO   : 32179  
##                Max.   :20194                   (Other)     :280992  
##                                                NA's        :   377  
##  ESTU_COD_RESIDE_DEPTO  FAMI_ESTRATOVIVIENDA   COLE_NATURALEZA  
##  Min.   :    5.00      Estrato 2  :188314    NO OFICIAL:130201  
##  1st Qu.:   11.00      Estrato 1  :159977    OFICIAL   :416011  
##  Median :   20.00      Estrato 3  :108692                       
##  Mean   :   57.03      Estrato 4  : 25810                       
##  3rd Qu.:   54.00      Sin Estrato: 17177                       
##  Max.   :99999.00      (Other)    : 11735                       
##  NA's   :377           NA's       : 34507                       
##  COLE_CALENDARIO PUNT_LECTURA_CRITICA PERCENTIL_LECTURA_CRITICA
##  A   :541901     Min.   :  0.00       Min.   :  1.00           
##  B   :  1140     1st Qu.: 45.00       1st Qu.: 25.00           
##  OTRO:  3171     Median : 52.00       Median : 50.00           
##                  Mean   : 52.16       Mean   : 50.11           
##                  3rd Qu.: 60.00       3rd Qu.: 75.00           
##                  Max.   :100.00       Max.   :100.00           
##                                                                
##  DESEMP_LECTURA_CRITICA PUNT_MATEMATICAS PERCENTIL_MATEMATICAS
##  Min.   :1.000          Min.   :  0.00   Min.   :  1.00       
##  1st Qu.:2.000          1st Qu.: 42.00   1st Qu.: 25.00       
##  Median :3.000          Median : 51.00   Median : 50.00       
##  Mean   :2.613          Mean   : 50.61   Mean   : 50.11       
##  3rd Qu.:3.000          3rd Qu.: 59.00   3rd Qu.: 75.00       
##  Max.   :4.000          Max.   :100.00   Max.   :100.00       
##                                                               
##  DESEMP_MATEMATICAS PUNT_C_NATURALES PERCENTIL_C_NATURALES DESEMP_C_NATURALES
##  Min.   :1.000      Min.   :  0.00   Min.   :  1.00        Min.   :1.000     
##  1st Qu.:2.000      1st Qu.: 40.00   1st Qu.: 25.00        1st Qu.:1.000     
##  Median :3.000      Median : 48.00   Median : 50.00        Median :2.000     
##  Mean   :2.441      Mean   : 48.23   Mean   : 50.16        Mean   :2.021     
##  3rd Qu.:3.000      3rd Qu.: 56.00   3rd Qu.: 75.00        3rd Qu.:3.000     
##  Max.   :4.000      Max.   :100.00   Max.   :100.00        Max.   :4.000     
##                                                                              
##  PUNT_SOCIALES_CIUDADANAS PERCENTIL_SOCIALES_CIUDADANAS
##  Min.   :  0.00           Min.   :  1.00               
##  1st Qu.: 37.00           1st Qu.: 25.00               
##  Median : 45.00           Median : 50.00               
##  Mean   : 46.22           Mean   : 50.18               
##  3rd Qu.: 55.00           3rd Qu.: 75.00               
##  Max.   :100.00           Max.   :100.00               
##                                                        
##  DESEMP_SOCIALES_CIUDADANAS  PUNT_INGLES     PERCENTIL_INGLES
##  Min.   :1.000              Min.   :  0.00   Min.   :  1.0   
##  1st Qu.:1.000              1st Qu.: 39.00   1st Qu.: 25.0   
##  Median :2.000              Median : 48.00   Median : 50.0   
##  Mean   :1.902              Mean   : 48.42   Mean   : 50.1   
##  3rd Qu.:2.000              3rd Qu.: 56.00   3rd Qu.: 75.0   
##  Max.   :4.000              Max.   :100.00   Max.   :100.0   
##                             NA's   :19                       
##  DESEMP_INGLES       PUNT_GLOBAL    PERCENTIL_GLOBAL
##  Length:546212      Min.   :  0.0   Min.   :  1.00  
##  Class :character   1st Qu.:207.0   1st Qu.: 25.00  
##  Mode  :character   Median :243.0   Median : 50.00  
##                     Mean   :246.2   Mean   : 49.99  
##                     3rd Qu.:282.0   3rd Qu.: 75.00  
##                     Max.   :477.0   Max.   :100.00  
##                                     NA's   :19
# Seleccionar solo las variables numéricas
numeric_data <- subset(Datos, select = c(PUNT_LECTURA_CRITICA, PUNT_MATEMATICAS, 
                                         PUNT_C_NATURALES, PUNT_SOCIALES_CIUDADANAS, 
                                         PUNT_INGLES))

# Matriz de correlación
cor_matrix <- cor(numeric_data, method = "pearson")
corrplot(round(cor_matrix, 3), type = "lower")

Datos_clean <- na.omit(Datos)

# Modelo inicial
modelo.lineal <- lm(PUNT_MATEMATICAS ~ ., data = Datos_clean)
summary(modelo.lineal)
## 
## Call:
## lm(formula = PUNT_MATEMATICAS ~ ., data = Datos_clean)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.65535 -0.21382 -0.00161  0.21419  0.93561 
## 
## Coefficients: (2 not defined because of singularities)
##                                    Estimate Std. Error   t value Pr(>|t|)    
## (Intercept)                       1.799e-01  1.408e-02    12.781  < 2e-16 ***
## ESTU_GENEROM                      1.398e-03  7.118e-04     1.964  0.04957 *  
## PERIODO                                  NA         NA        NA       NA    
## ESTU_TIENEETNIASi                 1.363e-03  1.521e-03     0.897  0.36988    
## ESTU_DEPTO_RESIDEANTIOQUIA       -7.596e-03  9.363e-03    -0.811  0.41722    
## ESTU_DEPTO_RESIDEARAUCA          -3.895e-03  1.031e-02    -0.378  0.70542    
## ESTU_DEPTO_RESIDEATLANTICO       -7.800e-03  9.424e-03    -0.828  0.40785    
## ESTU_DEPTO_RESIDEBOGOTÃ\u0081    -8.194e-03  9.365e-03    -0.875  0.38159    
## ESTU_DEPTO_RESIDEBOLIVAR         -5.268e-03  9.448e-03    -0.558  0.57714    
## ESTU_DEPTO_RESIDEBOYACA          -7.976e-03  9.524e-03    -0.837  0.40234    
## ESTU_DEPTO_RESIDECALDAS          -7.323e-03  9.639e-03    -0.760  0.44744    
## ESTU_DEPTO_RESIDECAQUETA         -3.867e-03  1.004e-02    -0.385  0.70019    
## ESTU_DEPTO_RESIDECASANARE        -6.857e-03  9.877e-03    -0.694  0.48751    
## ESTU_DEPTO_RESIDECAUCA           -5.493e-03  9.553e-03    -0.575  0.56526    
## ESTU_DEPTO_RESIDECESAR           -4.341e-03  9.571e-03    -0.454  0.65014    
## ESTU_DEPTO_RESIDECHOCO           -8.552e-03  1.003e-02    -0.852  0.39398    
## ESTU_DEPTO_RESIDECORDOBA         -5.181e-03  9.478e-03    -0.547  0.58467    
## ESTU_DEPTO_RESIDECUNDINAMARCA    -7.832e-03  9.416e-03    -0.832  0.40551    
## ESTU_DEPTO_RESIDEEXTRANJERO      -5.294e-03  2.442e-02    -0.217  0.82837    
## ESTU_DEPTO_RESIDEGUAINIA         -5.373e-03  1.832e-02    -0.293  0.76937    
## ESTU_DEPTO_RESIDEGUAVIARE        -1.246e-02  1.230e-02    -1.013  0.31088    
## ESTU_DEPTO_RESIDEHUILA           -9.243e-03  9.565e-03    -0.966  0.33389    
## ESTU_DEPTO_RESIDELA GUAJIRA      -8.079e-03  9.697e-03    -0.833  0.40474    
## ESTU_DEPTO_RESIDEMAGDALENA       -5.938e-03  9.524e-03    -0.624  0.53293    
## ESTU_DEPTO_RESIDEMETA            -7.192e-03  9.591e-03    -0.750  0.45334    
## ESTU_DEPTO_RESIDENARIÑO         -6.808e-03  9.513e-03    -0.716  0.47425    
## ESTU_DEPTO_RESIDENORTE SANTANDER -5.419e-03  9.535e-03    -0.568  0.56980    
## ESTU_DEPTO_RESIDEPUTUMAYO        -5.479e-03  1.016e-02    -0.539  0.58978    
## ESTU_DEPTO_RESIDEQUINDIO         -8.731e-03  9.852e-03    -0.886  0.37551    
## ESTU_DEPTO_RESIDERISARALDA       -6.655e-03  9.633e-03    -0.691  0.48967    
## ESTU_DEPTO_RESIDESAN ANDRES      -8.136e-03  1.372e-02    -0.593  0.55306    
## ESTU_DEPTO_RESIDESANTANDER       -8.559e-03  9.456e-03    -0.905  0.36539    
## ESTU_DEPTO_RESIDESUCRE           -8.217e-03  9.620e-03    -0.854  0.39304    
## ESTU_DEPTO_RESIDETOLIMA          -6.484e-03  9.522e-03    -0.681  0.49592    
## ESTU_DEPTO_RESIDEVALLE           -8.071e-03  9.404e-03    -0.858  0.39073    
## ESTU_DEPTO_RESIDEVAUPES           2.147e-02  1.737e-02     1.236  0.21664    
## ESTU_DEPTO_RESIDEVICHADA          5.063e-03  1.474e-02     0.344  0.73119    
## ESTU_COD_RESIDE_DEPTO                    NA         NA        NA       NA    
## FAMI_ESTRATOVIVIENDAEstrato 2    -9.779e-04  8.807e-04    -1.110  0.26684    
## FAMI_ESTRATOVIVIENDAEstrato 3    -7.300e-04  1.061e-03    -0.688  0.49157    
## FAMI_ESTRATOVIVIENDAEstrato 4    -8.749e-04  1.759e-03    -0.497  0.61899    
## FAMI_ESTRATOVIVIENDAEstrato 5     2.072e-03  2.898e-03     0.715  0.47463    
## FAMI_ESTRATOVIVIENDAEstrato 6    -8.463e-03  4.145e-03    -2.042  0.04115 *  
## FAMI_ESTRATOVIVIENDASin Estrato  -1.182e-03  2.028e-03    -0.583  0.56013    
## COLE_NATURALEZAOFICIAL           -2.616e-04  9.155e-04    -0.286  0.77509    
## COLE_CALENDARIOB                  8.012e-04  7.830e-03     0.102  0.91849    
## COLE_CALENDARIOOTRO              -2.087e-03  4.751e-03    -0.439  0.66050    
## PUNT_LECTURA_CRITICA             -9.784e-01  3.108e-04 -3148.177  < 2e-16 ***
## PERCENTIL_LECTURA_CRITICA        -8.505e-04  9.407e-05    -9.041  < 2e-16 ***
## DESEMP_LECTURA_CRITICA           -1.523e-03  1.186e-03    -1.284  0.19916    
## PERCENTIL_MATEMATICAS             6.701e-03  9.473e-05    70.741  < 2e-16 ***
## DESEMP_MATEMATICAS                3.531e-02  1.171e-03    30.147  < 2e-16 ***
## PUNT_C_NATURALES                 -9.751e-01  3.449e-04 -2827.344  < 2e-16 ***
## PERCENTIL_C_NATURALES            -2.001e-03  1.090e-04   -18.353  < 2e-16 ***
## DESEMP_C_NATURALES                4.798e-03  1.201e-03     3.995 6.48e-05 ***
## PUNT_SOCIALES_CIUDADANAS         -9.795e-01  3.065e-04 -3195.874  < 2e-16 ***
## PERCENTIL_SOCIALES_CIUDADANAS    -4.570e-04  1.200e-04    -3.808  0.00014 ***
## DESEMP_SOCIALES_CIUDADANAS       -2.444e-03  1.196e-03    -2.044  0.04095 *  
## PUNT_INGLES                      -3.264e-01  2.529e-04 -1290.545  < 2e-16 ***
## PERCENTIL_INGLES                 -1.192e-04  1.072e-04    -1.113  0.26586    
## DESEMP_INGLESA1                  -3.382e-03  1.538e-03    -2.199  0.02791 *  
## DESEMP_INGLESA2                  -7.378e-03  2.226e-03    -3.314  0.00092 ***
## DESEMP_INGLESB+                   3.587e-03  5.373e-03     0.668  0.50435    
## DESEMP_INGLESB1                  -4.822e-03  2.979e-03    -1.619  0.10551    
## PUNT_GLOBAL                       8.504e-01  1.649e-04  5158.261  < 2e-16 ***
## PERCENTIL_GLOBAL                 -5.697e-04  2.247e-04    -2.535  0.01124 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2471 on 511169 degrees of freedom
## Multiple R-squared:  0.9996, Adjusted R-squared:  0.9996 
## F-statistic: 1.883e+07 on 63 and 511169 DF,  p-value: < 2.2e-16
# Selección regresion stepwise
modelo.step <- stepAIC(modelo.lineal, direction = "both")
## Start:  AIC=-1429374
## PUNT_MATEMATICAS ~ ESTU_GENERO + PERIODO + ESTU_TIENEETNIA + 
##     ESTU_DEPTO_RESIDE + ESTU_COD_RESIDE_DEPTO + FAMI_ESTRATOVIVIENDA + 
##     COLE_NATURALEZA + COLE_CALENDARIO + PUNT_LECTURA_CRITICA + 
##     PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + 
##     DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES + 
##     DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES + 
##     DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
## 
## Step:  AIC=-1429374
## PUNT_MATEMATICAS ~ ESTU_GENERO + PERIODO + ESTU_TIENEETNIA + 
##     ESTU_DEPTO_RESIDE + FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA + 
##     COLE_CALENDARIO + PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + 
##     DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + 
##     PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + 
##     PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES + 
##     DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
## 
## Step:  AIC=-1429374
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + ESTU_DEPTO_RESIDE + 
##     FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA + COLE_CALENDARIO + 
##     PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + 
##     PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + PUNT_C_NATURALES + 
##     PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + 
##     PERCENTIL_SOCIALES_CIUDADANAS + DESEMP_SOCIALES_CIUDADANAS + 
##     PUNT_INGLES + PERCENTIL_INGLES + DESEMP_INGLES + PUNT_GLOBAL + 
##     PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - ESTU_DEPTO_RESIDE             33         1   31208 -1429423
## - FAMI_ESTRATOVIVIENDA           6         0   31207 -1429380
## - COLE_CALENDARIO                2         0   31207 -1429378
## - COLE_NATURALEZA                1         0   31207 -1429376
## - ESTU_TIENEETNIA                1         0   31207 -1429376
## - PERCENTIL_INGLES               1         0   31207 -1429375
## - DESEMP_LECTURA_CRITICA         1         0   31207 -1429375
## <none>                                         31207 -1429374
## - ESTU_GENERO                    1         0   31207 -1429372
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31207 -1429372
## - PERCENTIL_GLOBAL               1         0   31207 -1429370
## - DESEMP_INGLES                  4         1   31208 -1429367
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31208 -1429362
## - DESEMP_C_NATURALES             1         1   31208 -1429360
## - PERCENTIL_LECTURA_CRITICA      1         5   31212 -1429295
## - PERCENTIL_C_NATURALES          1        21   31227 -1429040
## - DESEMP_MATEMATICAS             1        55   31262 -1428468
## - PERCENTIL_MATEMATICAS          1       306   31512 -1424396
## - PUNT_INGLES                    1    101679  132886  -688674
## - PUNT_C_NATURALES               1    488027  519234     8065
## - PUNT_LECTURA_CRITICA           1    605069  636276   111987
## - PUNT_SOCIALES_CIUDADANAS       1    623542  654749   126619
## - PUNT_GLOBAL                    1   1624400 1655607   600875
## 
## Step:  AIC=-1429423
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + FAMI_ESTRATOVIVIENDA + 
##     COLE_NATURALEZA + COLE_CALENDARIO + PUNT_LECTURA_CRITICA + 
##     PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + 
##     DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES + 
##     DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES + 
##     DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - FAMI_ESTRATOVIVIENDA           6         0   31208 -1429427
## - COLE_CALENDARIO                2         0   31208 -1429426
## - COLE_NATURALEZA                1         0   31208 -1429425
## - PERCENTIL_INGLES               1         0   31208 -1429423
## - ESTU_TIENEETNIA                1         0   31208 -1429423
## - DESEMP_LECTURA_CRITICA         1         0   31208 -1429423
## <none>                                         31208 -1429423
## + ESTU_COD_RESIDE_DEPTO          1         0   31208 -1429421
## - ESTU_GENERO                    1         0   31208 -1429421
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31208 -1429421
## - PERCENTIL_GLOBAL               1         0   31208 -1429418
## - DESEMP_INGLES                  4         1   31209 -1429415
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31209 -1429410
## - DESEMP_C_NATURALES             1         1   31209 -1429409
## + ESTU_DEPTO_RESIDE             33         1   31207 -1429374
## - PERCENTIL_LECTURA_CRITICA      1         5   31213 -1429343
## - PERCENTIL_C_NATURALES          1        21   31229 -1429087
## - DESEMP_MATEMATICAS             1        56   31264 -1428516
## - PERCENTIL_MATEMATICAS          1       306   31514 -1424444
## - PUNT_INGLES                    1    101712  132920  -688610
## - PUNT_C_NATURALES               1    488288  519496     8256
## - PUNT_LECTURA_CRITICA           1    605281  636489   112092
## - PUNT_SOCIALES_CIUDADANAS       1    623891  655099   126826
## - PUNT_GLOBAL                    1   1625421 1656629   601124
## 
## Step:  AIC=-1429427
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + COLE_NATURALEZA + 
##     COLE_CALENDARIO + PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + 
##     DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + 
##     PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + 
##     PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES + 
##     DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - COLE_CALENDARIO                2         0   31208 -1429431
## - COLE_NATURALEZA                1         0   31208 -1429429
## - PERCENTIL_INGLES               1         0   31209 -1429428
## - DESEMP_LECTURA_CRITICA         1         0   31209 -1429428
## - ESTU_TIENEETNIA                1         0   31209 -1429427
## <none>                                         31208 -1429427
## - ESTU_GENERO                    1         0   31209 -1429425
## + ESTU_COD_RESIDE_DEPTO          1         0   31208 -1429425
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31209 -1429425
## + FAMI_ESTRATOVIVIENDA           6         0   31208 -1429423
## - PERCENTIL_GLOBAL               1         0   31209 -1429423
## - DESEMP_INGLES                  4         1   31209 -1429419
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31209 -1429415
## - DESEMP_C_NATURALES             1         1   31209 -1429413
## + ESTU_DEPTO_RESIDE             33         1   31207 -1429380
## - PERCENTIL_LECTURA_CRITICA      1         5   31213 -1429347
## - PERCENTIL_C_NATURALES          1        21   31229 -1429092
## - DESEMP_MATEMATICAS             1        56   31264 -1428520
## - PERCENTIL_MATEMATICAS          1       306   31514 -1424448
## - PUNT_INGLES                    1    101885  133093  -687958
## - PUNT_C_NATURALES               1    488367  519576     8323
## - PUNT_LECTURA_CRITICA           1    605520  636729   112273
## - PUNT_SOCIALES_CIUDADANAS       1    624154  655362   127019
## - PUNT_GLOBAL                    1   1625730 1656938   601208
## 
## Step:  AIC=-1429431
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + COLE_NATURALEZA + 
##     PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + 
##     PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + PUNT_C_NATURALES + 
##     PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + 
##     PERCENTIL_SOCIALES_CIUDADANAS + DESEMP_SOCIALES_CIUDADANAS + 
##     PUNT_INGLES + PERCENTIL_INGLES + DESEMP_INGLES + PUNT_GLOBAL + 
##     PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - COLE_NATURALEZA                1         0   31208 -1429433
## - PERCENTIL_INGLES               1         0   31209 -1429432
## - DESEMP_LECTURA_CRITICA         1         0   31209 -1429431
## - ESTU_TIENEETNIA                1         0   31209 -1429431
## <none>                                         31208 -1429431
## - ESTU_GENERO                    1         0   31209 -1429429
## + ESTU_COD_RESIDE_DEPTO          1         0   31208 -1429429
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31209 -1429429
## + COLE_CALENDARIO                2         0   31208 -1429427
## + FAMI_ESTRATOVIVIENDA           6         0   31208 -1429426
## - PERCENTIL_GLOBAL               1         0   31209 -1429426
## - DESEMP_INGLES                  4         1   31209 -1429423
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31209 -1429419
## - DESEMP_C_NATURALES             1         1   31209 -1429417
## + ESTU_DEPTO_RESIDE             33         1   31207 -1429384
## - PERCENTIL_LECTURA_CRITICA      1         5   31213 -1429351
## - PERCENTIL_C_NATURALES          1        21   31229 -1429095
## - DESEMP_MATEMATICAS             1        56   31264 -1428524
## - PERCENTIL_MATEMATICAS          1       306   31514 -1424452
## - PUNT_INGLES                    1    101889  133097  -687945
## - PUNT_C_NATURALES               1    488368  519577     8321
## - PUNT_LECTURA_CRITICA           1    605532  636740   112278
## - PUNT_SOCIALES_CIUDADANAS       1    624155  655363   127016
## - PUNT_GLOBAL                    1   1625760 1656968   601213
## 
## Step:  AIC=-1429433
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA + 
##     PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + 
##     DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES + 
##     DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + PERCENTIL_INGLES + 
##     DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - PERCENTIL_INGLES               1         0   31209 -1429434
## - DESEMP_LECTURA_CRITICA         1         0   31209 -1429433
## - ESTU_TIENEETNIA                1         0   31209 -1429433
## <none>                                         31208 -1429433
## - ESTU_GENERO                    1         0   31209 -1429431
## + COLE_NATURALEZA                1         0   31208 -1429431
## + ESTU_COD_RESIDE_DEPTO          1         0   31208 -1429431
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31209 -1429431
## + COLE_CALENDARIO                2         0   31208 -1429429
## + FAMI_ESTRATOVIVIENDA           6         0   31208 -1429428
## - PERCENTIL_GLOBAL               1         0   31209 -1429428
## - DESEMP_INGLES                  4         1   31209 -1429425
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31209 -1429420
## - DESEMP_C_NATURALES             1         1   31209 -1429419
## + ESTU_DEPTO_RESIDE             33         1   31207 -1429386
## - PERCENTIL_LECTURA_CRITICA      1         5   31213 -1429353
## - PERCENTIL_C_NATURALES          1        21   31229 -1429097
## - DESEMP_MATEMATICAS             1        56   31264 -1428526
## - PERCENTIL_MATEMATICAS          1       306   31514 -1424454
## - PUNT_INGLES                    1    101920  133128  -687829
## - PUNT_C_NATURALES               1    488376  519585     8326
## - PUNT_LECTURA_CRITICA           1    605550  636759   112291
## - PUNT_SOCIALES_CIUDADANAS       1    624156  655365   127015
## - PUNT_GLOBAL                    1   1625770 1656978   601214
## 
## Step:  AIC=-1429434
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA + 
##     PERCENTIL_LECTURA_CRITICA + DESEMP_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + 
##     DESEMP_MATEMATICAS + PUNT_C_NATURALES + PERCENTIL_C_NATURALES + 
##     DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + DESEMP_INGLES + 
##     PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - DESEMP_LECTURA_CRITICA         1         0   31209 -1429434
## - ESTU_TIENEETNIA                1         0   31209 -1429434
## <none>                                         31209 -1429434
## + PERCENTIL_INGLES               1         0   31208 -1429433
## - ESTU_GENERO                    1         0   31209 -1429432
## + COLE_NATURALEZA                1         0   31209 -1429432
## + ESTU_COD_RESIDE_DEPTO          1         0   31209 -1429432
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31209 -1429431
## + COLE_CALENDARIO                2         0   31209 -1429430
## + FAMI_ESTRATOVIVIENDA           6         0   31208 -1429429
## - PERCENTIL_GLOBAL               1         0   31209 -1429428
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31209 -1429422
## - DESEMP_C_NATURALES             1         1   31210 -1429420
## - DESEMP_INGLES                  4         3   31211 -1429396
## + ESTU_DEPTO_RESIDE             33         1   31207 -1429387
## - PERCENTIL_LECTURA_CRITICA      1         5   31214 -1429354
## - PERCENTIL_C_NATURALES          1        21   31229 -1429099
## - DESEMP_MATEMATICAS             1        56   31264 -1428525
## - PERCENTIL_MATEMATICAS          1       309   31517 -1424405
## - PUNT_C_NATURALES               1    488385  519594     8333
## - PUNT_INGLES                    1    499776  530984    19419
## - PUNT_LECTURA_CRITICA           1    605567  636776   112303
## - PUNT_SOCIALES_CIUDADANAS       1    624157  655366   127014
## - PUNT_GLOBAL                    1   1627234 1658443   601664
## 
## Step:  AIC=-1429434
## PUNT_MATEMATICAS ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA + 
##     PERCENTIL_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + 
##     PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + 
##     PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + DESEMP_INGLES + 
##     PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## - ESTU_TIENEETNIA                1         0   31209 -1429434
## <none>                                         31209 -1429434
## + DESEMP_LECTURA_CRITICA         1         0   31209 -1429434
## + PERCENTIL_INGLES               1         0   31209 -1429433
## - ESTU_GENERO                    1         0   31209 -1429432
## + COLE_NATURALEZA                1         0   31209 -1429432
## + ESTU_COD_RESIDE_DEPTO          1         0   31209 -1429432
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31209 -1429432
## + COLE_CALENDARIO                2         0   31209 -1429430
## + FAMI_ESTRATOVIVIENDA           6         0   31208 -1429430
## - PERCENTIL_GLOBAL               1         0   31209 -1429428
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31210 -1429422
## - DESEMP_C_NATURALES             1         1   31210 -1429420
## - DESEMP_INGLES                  4         3   31211 -1429397
## + ESTU_DEPTO_RESIDE             33         1   31207 -1429387
## - PERCENTIL_LECTURA_CRITICA      1         5   31214 -1429354
## - PERCENTIL_C_NATURALES          1        21   31229 -1429100
## - DESEMP_MATEMATICAS             1        56   31264 -1428526
## - PERCENTIL_MATEMATICAS          1       309   31517 -1424404
## - PUNT_C_NATURALES               1    488395  519603     8341
## - PUNT_INGLES                    1    499776  530984    19417
## - PUNT_SOCIALES_CIUDADANAS       1    624158  655367   127013
## - PUNT_LECTURA_CRITICA           1    640755  671964   139798
## - PUNT_GLOBAL                    1   1627251 1658459   601667
## 
## Step:  AIC=-1429434
## PUNT_MATEMATICAS ~ ESTU_GENERO + PUNT_LECTURA_CRITICA + PERCENTIL_LECTURA_CRITICA + 
##     PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + PUNT_C_NATURALES + 
##     PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + 
##     PERCENTIL_SOCIALES_CIUDADANAS + DESEMP_SOCIALES_CIUDADANAS + 
##     PUNT_INGLES + DESEMP_INGLES + PUNT_GLOBAL + PERCENTIL_GLOBAL
## 
##                                 Df Sum of Sq     RSS      AIC
## <none>                                         31209 -1429434
## + ESTU_TIENEETNIA                1         0   31209 -1429434
## + DESEMP_LECTURA_CRITICA         1         0   31209 -1429434
## + PERCENTIL_INGLES               1         0   31209 -1429433
## - ESTU_GENERO                    1         0   31209 -1429432
## + COLE_NATURALEZA                1         0   31209 -1429432
## + ESTU_COD_RESIDE_DEPTO          1         0   31209 -1429432
## - DESEMP_SOCIALES_CIUDADANAS     1         0   31209 -1429432
## + COLE_CALENDARIO                2         0   31209 -1429430
## + FAMI_ESTRATOVIVIENDA           6         0   31208 -1429430
## - PERCENTIL_GLOBAL               1         0   31209 -1429428
## - PERCENTIL_SOCIALES_CIUDADANAS  1         1   31210 -1429422
## - DESEMP_C_NATURALES             1         1   31210 -1429420
## - DESEMP_INGLES                  4         3   31212 -1429397
## + ESTU_DEPTO_RESIDE             33         1   31208 -1429388
## - PERCENTIL_LECTURA_CRITICA      1         5   31214 -1429355
## - PERCENTIL_C_NATURALES          1        21   31229 -1429100
## - DESEMP_MATEMATICAS             1        56   31264 -1428527
## - PERCENTIL_MATEMATICAS          1       309   31518 -1424403
## - PUNT_C_NATURALES               1    488425  519634     8368
## - PUNT_INGLES                    1    499939  531148    19573
## - PUNT_SOCIALES_CIUDADANAS       1    624325  655534   127141
## - PUNT_LECTURA_CRITICA           1    640838  672047   139860
## - PUNT_GLOBAL                    1   1627439 1658647   601723
summary(modelo.step)
## 
## Call:
## lm(formula = PUNT_MATEMATICAS ~ ESTU_GENERO + PUNT_LECTURA_CRITICA + 
##     PERCENTIL_LECTURA_CRITICA + PERCENTIL_MATEMATICAS + DESEMP_MATEMATICAS + 
##     PUNT_C_NATURALES + PERCENTIL_C_NATURALES + DESEMP_C_NATURALES + 
##     PUNT_SOCIALES_CIUDADANAS + PERCENTIL_SOCIALES_CIUDADANAS + 
##     DESEMP_SOCIALES_CIUDADANAS + PUNT_INGLES + DESEMP_INGLES + 
##     PUNT_GLOBAL + PERCENTIL_GLOBAL, data = Datos_clean)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.65554 -0.21388 -0.00168  0.21424  0.94312 
## 
## Coefficients:
##                                 Estimate Std. Error   t value Pr(>|t|)    
## (Intercept)                    1.789e-01  9.166e-03    19.514  < 2e-16 ***
## ESTU_GENEROM                   1.389e-03  7.094e-04     1.958 0.050213 .  
## PUNT_LECTURA_CRITICA          -9.785e-01  3.020e-04 -3239.941  < 2e-16 ***
## PERCENTIL_LECTURA_CRITICA     -8.450e-04  9.373e-05    -9.015  < 2e-16 ***
## PERCENTIL_MATEMATICAS          6.711e-03  9.436e-05    71.118  < 2e-16 ***
## DESEMP_MATEMATICAS             3.532e-02  1.171e-03    30.167  < 2e-16 ***
## PUNT_C_NATURALES              -9.751e-01  3.448e-04 -2828.537  < 2e-16 ***
## PERCENTIL_C_NATURALES         -1.996e-03  1.088e-04   -18.344  < 2e-16 ***
## DESEMP_C_NATURALES             4.809e-03  1.201e-03     4.005 6.21e-05 ***
## PUNT_SOCIALES_CIUDADANAS      -9.795e-01  3.063e-04 -3197.926  < 2e-16 ***
## PERCENTIL_SOCIALES_CIUDADANAS -4.484e-04  1.196e-04    -3.748 0.000178 ***
## DESEMP_SOCIALES_CIUDADANAS    -2.421e-03  1.195e-03    -2.026 0.042771 *  
## PUNT_INGLES                   -3.267e-01  1.141e-04 -2861.684  < 2e-16 ***
## DESEMP_INGLESA1               -4.338e-03  1.334e-03    -3.252 0.001148 ** 
## DESEMP_INGLESA2               -8.561e-03  2.014e-03    -4.250 2.13e-05 ***
## DESEMP_INGLESB+                6.140e-03  4.718e-03     1.301 0.193159    
## DESEMP_INGLESB1               -4.690e-03  2.934e-03    -1.598 0.110013    
## PUNT_GLOBAL                    8.504e-01  1.647e-04  5163.157  < 2e-16 ***
## PERCENTIL_GLOBAL              -6.233e-04  2.208e-04    -2.823 0.004756 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2471 on 511214 degrees of freedom
## Multiple R-squared:  0.9996, Adjusted R-squared:  0.9996 
## F-statistic: 6.591e+07 on 18 and 511214 DF,  p-value: < 2.2e-16