SOLUCION DEL TALLER UNO

1. Objetivo del análisis estadístico del conjunto de datos.

El estudio tiene como objetivo evaluar las causas de los efectos del alcohol en el estudio, teniendo en cuenta el análisis de tipo cuantitativo y descriptivo. La muestra incluyó 395 estudiantes (53% del sexo femenino y 47% del sexo masculino), con edades entre 15 y 22 años. Esta discriminación existe entre los adolescentes antes de tener experiencias significativas con el consumo de alcohol y aumentan con la edad.

2. Descripción del contexto al que pertenecen los datos.

Estos datos abordan el rendimiento de los estudiantes en la educación secundaria de dos escuelas portuguesas (Gabriel PereiraY Mousinho da Silveira). Los atributos de los datos incluyen calificaciones de los estudiantes, características demográficas, sociales y relacionadas con la escuela y se recopilaron mediante el uso de informes y cuestionarios escolares. Se proporcionan dos conjuntos de datos sobre el rendimiento de materia de Matemáticas (MATHS). [Cortez and Silva, 2008].

3. Descripción y escala de medición de las variables consideradas.

3.1.1 Variables de estudio

3.1.2 Estas calificaciones están relacionadas con la materia del curso de Matemáticas

library(readr)
Maths <- read_csv("C:/Users/Admin/Desktop/UNIVERSIDAD/ESPECIALIZACON EN ESTADISTICA/ANALISIS DE REGRESION/TALLERES/Maths.csv")
## Rows: 395 Columns: 33
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (17): school, sex, address, famsize, Pstatus, Mjob, Fjob, reason, guardi...
## dbl (16): age, Medu, Fedu, traveltime, studytime, failures, famrel, freetime...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
##View(Maths)
str(Maths)
## spec_tbl_df [395 × 33] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ school    : chr [1:395] "GP" "GP" "GP" "GP" ...
##  $ sex       : chr [1:395] "F" "F" "F" "F" ...
##  $ age       : num [1:395] 18 17 15 15 16 16 16 17 15 15 ...
##  $ address   : chr [1:395] "U" "U" "U" "U" ...
##  $ famsize   : chr [1:395] "GT3" "GT3" "LE3" "GT3" ...
##  $ Pstatus   : chr [1:395] "A" "T" "T" "T" ...
##  $ Medu      : num [1:395] 4 1 1 4 3 4 2 4 3 3 ...
##  $ Fedu      : num [1:395] 4 1 1 2 3 3 2 4 2 4 ...
##  $ Mjob      : chr [1:395] "at_home" "at_home" "at_home" "health" ...
##  $ Fjob      : chr [1:395] "teacher" "other" "other" "services" ...
##  $ reason    : chr [1:395] "course" "course" "other" "home" ...
##  $ guardian  : chr [1:395] "mother" "father" "mother" "mother" ...
##  $ traveltime: num [1:395] 2 1 1 1 1 1 1 2 1 1 ...
##  $ studytime : num [1:395] 2 2 2 3 2 2 2 2 2 2 ...
##  $ failures  : num [1:395] 0 0 3 0 0 0 0 0 0 0 ...
##  $ schoolsup : chr [1:395] "yes" "no" "yes" "no" ...
##  $ famsup    : chr [1:395] "no" "yes" "no" "yes" ...
##  $ paid      : chr [1:395] "no" "no" "yes" "yes" ...
##  $ activities: chr [1:395] "no" "no" "no" "yes" ...
##  $ nursery   : chr [1:395] "yes" "no" "yes" "yes" ...
##  $ higher    : chr [1:395] "yes" "yes" "yes" "yes" ...
##  $ internet  : chr [1:395] "no" "yes" "yes" "yes" ...
##  $ romantic  : chr [1:395] "no" "no" "no" "yes" ...
##  $ famrel    : num [1:395] 4 5 4 3 4 5 4 4 4 5 ...
##  $ freetime  : num [1:395] 3 3 3 2 3 4 4 1 2 5 ...
##  $ goout     : num [1:395] 4 3 2 2 2 2 4 4 2 1 ...
##  $ Dalc      : num [1:395] 1 1 2 1 1 1 1 1 1 1 ...
##  $ Walc      : num [1:395] 1 1 3 1 2 2 1 1 1 1 ...
##  $ health    : num [1:395] 3 3 3 5 5 5 3 1 1 5 ...
##  $ absences  : num [1:395] 6 4 10 2 4 10 0 6 0 0 ...
##  $ G1        : num [1:395] 5 5 7 15 6 15 12 6 16 14 ...
##  $ G2        : num [1:395] 6 5 8 14 10 15 12 5 18 15 ...
##  $ G3        : num [1:395] 6 6 10 15 10 15 11 6 19 15 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   school = col_character(),
##   ..   sex = col_character(),
##   ..   age = col_double(),
##   ..   address = col_character(),
##   ..   famsize = col_character(),
##   ..   Pstatus = col_character(),
##   ..   Medu = col_double(),
##   ..   Fedu = col_double(),
##   ..   Mjob = col_character(),
##   ..   Fjob = col_character(),
##   ..   reason = col_character(),
##   ..   guardian = col_character(),
##   ..   traveltime = col_double(),
##   ..   studytime = col_double(),
##   ..   failures = col_double(),
##   ..   schoolsup = col_character(),
##   ..   famsup = col_character(),
##   ..   paid = col_character(),
##   ..   activities = col_character(),
##   ..   nursery = col_character(),
##   ..   higher = col_character(),
##   ..   internet = col_character(),
##   ..   romantic = col_character(),
##   ..   famrel = col_double(),
##   ..   freetime = col_double(),
##   ..   goout = col_double(),
##   ..   Dalc = col_double(),
##   ..   Walc = col_double(),
##   ..   health = col_double(),
##   ..   absences = col_double(),
##   ..   G1 = col_double(),
##   ..   G2 = col_double(),
##   ..   G3 = col_double()
##   .. )
##  - attr(*, "problems")=<externalptr>
summary(Maths)
##     school              sex                 age         address         
##  Length:395         Length:395         Min.   :15.0   Length:395        
##  Class :character   Class :character   1st Qu.:16.0   Class :character  
##  Mode  :character   Mode  :character   Median :17.0   Mode  :character  
##                                        Mean   :16.7                     
##                                        3rd Qu.:18.0                     
##                                        Max.   :22.0                     
##    famsize            Pstatus               Medu            Fedu      
##  Length:395         Length:395         Min.   :0.000   Min.   :0.000  
##  Class :character   Class :character   1st Qu.:2.000   1st Qu.:2.000  
##  Mode  :character   Mode  :character   Median :3.000   Median :2.000  
##                                        Mean   :2.749   Mean   :2.522  
##                                        3rd Qu.:4.000   3rd Qu.:3.000  
##                                        Max.   :4.000   Max.   :4.000  
##      Mjob               Fjob              reason            guardian        
##  Length:395         Length:395         Length:395         Length:395        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##    traveltime      studytime        failures       schoolsup        
##  Min.   :1.000   Min.   :1.000   Min.   :0.0000   Length:395        
##  1st Qu.:1.000   1st Qu.:1.000   1st Qu.:0.0000   Class :character  
##  Median :1.000   Median :2.000   Median :0.0000   Mode  :character  
##  Mean   :1.448   Mean   :2.035   Mean   :0.3342                     
##  3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:0.0000                     
##  Max.   :4.000   Max.   :4.000   Max.   :3.0000                     
##     famsup              paid            activities          nursery         
##  Length:395         Length:395         Length:395         Length:395        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     higher            internet           romantic             famrel     
##  Length:395         Length:395         Length:395         Min.   :1.000  
##  Class :character   Class :character   Class :character   1st Qu.:4.000  
##  Mode  :character   Mode  :character   Mode  :character   Median :4.000  
##                                                           Mean   :3.944  
##                                                           3rd Qu.:5.000  
##                                                           Max.   :5.000  
##     freetime         goout            Dalc            Walc      
##  Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:3.000   1st Qu.:2.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :3.000   Median :3.000   Median :1.000   Median :2.000  
##  Mean   :3.235   Mean   :3.109   Mean   :1.481   Mean   :2.291  
##  3rd Qu.:4.000   3rd Qu.:4.000   3rd Qu.:2.000   3rd Qu.:3.000  
##  Max.   :5.000   Max.   :5.000   Max.   :5.000   Max.   :5.000  
##      health         absences            G1              G2       
##  Min.   :1.000   Min.   : 0.000   Min.   : 3.00   Min.   : 0.00  
##  1st Qu.:3.000   1st Qu.: 0.000   1st Qu.: 8.00   1st Qu.: 9.00  
##  Median :4.000   Median : 4.000   Median :11.00   Median :11.00  
##  Mean   :3.554   Mean   : 5.709   Mean   :10.91   Mean   :10.71  
##  3rd Qu.:5.000   3rd Qu.: 8.000   3rd Qu.:13.00   3rd Qu.:13.00  
##  Max.   :5.000   Max.   :75.000   Max.   :19.00   Max.   :19.00  
##        G3       
##  Min.   : 0.00  
##  1st Qu.: 8.00  
##  Median :11.00  
##  Mean   :10.42  
##  3rd Qu.:14.00  
##  Max.   :20.00
Maths$school<-as.factor(Maths$school)
Maths$sex<-as.factor(Maths$sex)
Maths$address<-as.factor(Maths$address)
Maths$famsize<-as.factor(Maths$famsize)
Maths$Pstatus<-as.factor(Maths$Pstatus)
Maths$Mjob<-as.factor(Maths$Mjob)
Maths$Fjob<-as.factor(Maths$Fjob)
Maths$reason<-as.factor(Maths$reason)
Maths$guardian<-as.factor(Maths$guardian)
Maths$schoolsup<-as.factor(Maths$schoolsup)
Maths$famsup<-as.factor(Maths$famsup)
Maths$paid<-as.factor(Maths$paid)
Maths$activities<-as.factor(Maths$activities)
Maths$nursery<-as.factor(Maths$nursery)
Maths$higher<-as.factor(Maths$higher)
Maths$internet<-as.factor(Maths$internet)
Maths$romantic<-as.factor(Maths$romantic)

escuela=Maths$school
sexo=Maths$sex
age=Maths$age
Direccion=Maths$address
familia=Maths$famsize
Pstatus=Maths$Pstatus
Medu=Maths$Medu
Federal=Maths$Fedu
Mjob=Maths$Mjob
Fojob=Maths$Fjob
razon=Maths$reason
guardian=Maths$guardian
traveltime=Maths$traveltime
studytime=Maths$studytime
fallas=Maths$failures
escuelas=Maths$schoolsup
famsup=Maths$famsup
pagado=Maths$paid
actividades=Maths$activities
guarderia=Maths$nursery
higher=Maths$higher
Internet=Maths$internet
romantico=Maths$romantic
familia=Maths$famrel
freetime=Maths$freetime
salir=Maths$goout
Dalc=Maths$Dalc
Walc=Maths$Walc
salud=Maths$health
ausencia=Maths$absences


Maths=data.frame(escuela,sexo,age,Direccion,familia,Pstatus,Medu,Federal,Mjob,Fojob,razon,                 guardian,traveltime,studytime,fallas,escuela,famsup,pagado,actividades,guarderia,higher,Internet,romantico,familia,freetime,salir,Dalc,Walc,salud,ausencia)

3.2.1 Analisis Descriptivo Variables Cuantitativas

summary(age)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    15.0    16.0    17.0    16.7    18.0    22.0
summary(Medu)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   3.000   2.749   4.000   4.000
summary(Federal)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   2.000   2.522   3.000   4.000
summary(traveltime)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   1.000   1.448   2.000   4.000
summary(studytime)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   2.000   2.035   2.000   4.000
summary(fallas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.3342  0.0000  3.0000
summary(familia)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   4.000   4.000   3.944   5.000   5.000
summary(freetime)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   3.000   3.000   3.235   4.000   5.000
summary(salir)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   2.000   3.000   3.109   4.000   5.000
summary(Dalc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   1.000   1.481   2.000   5.000
summary(Walc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   2.000   2.291   3.000   5.000
summary(salud)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   3.000   4.000   3.554   5.000   5.000
summary(ausencia)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   4.000   5.709   8.000  75.000

3.2.2 Analisis Descriptivo Variables Cualitativas

table(escuela)
## escuela
##  GP  MS 
## 349  46
table(sexo)
## sexo
##   F   M 
## 208 187
table(Direccion)
## Direccion
##   R   U 
##  88 307
table(familia)
## familia
##   1   2   3   4   5 
##   8  18  68 195 106
table(Pstatus)
## Pstatus
##   A   T 
##  41 354
table(Mjob)
## Mjob
##  at_home   health    other services  teacher 
##       59       34      141      103       58
table(Fojob)
## Fojob
##  at_home   health    other services  teacher 
##       20       18      217      111       29
table(razon)
## razon
##     course       home      other reputation 
##        145        109         36        105
table(guardian)
## guardian
## father mother  other 
##     90    273     32
table(escuelas)
## escuelas
##  no yes 
## 344  51
table(famsup)
## famsup
##  no yes 
## 153 242
table(pagado)
## pagado
##  no yes 
## 214 181
table(actividades)
## actividades
##  no yes 
## 194 201
table(guarderia)
## guarderia
##  no yes 
##  81 314
table(higher)
## higher
##  no yes 
##  20 375
table(Internet)
## Internet
##  no yes 
##  66 329
table(romantico)
## romantico
##  no yes 
## 263 132

3.2.3 Histogramas de las variables mas representativas

hist(age)

hist(Medu)

hist(Federal)

hist(traveltime)

hist(studytime)

hist(fallas)

hist(familia)

hist(freetime)

hist(salir)

hist(Dalc)

hist(Walc)

hist(salud)

hist(ausencia)

3.2.4 Diagrama de Caja y bigotes de las variables mas representativas

boxplot(age~salud, col = "red", main= "Box-plot para Años VS Condiciones de salud")

boxplot(age~fallas, col = "green", main= "Box-plot para Años VS fallas de clases")

boxplot(age~freetime, col = "purple", main= "Box-plot para Años VS tiempo libre")

boxplot(age~ausencia, col = "purple", main= "Box-plot para Años VS ausencia")

4. Estimación e interpretación de modelos estadísticos de regresión lineal simple para la variable respuesta elegida.

Modelo 0:Para el modelo de regresión lineal simple se tuvo en cuenta como variable de respuesta Y (la Edad de los estudiantes) y la variable Salud. Como se puede evidenciar el R-squared: 0.003867 el modelo no explica mucho y el p-value = 0.2175 es mayor de 0.05, no podemos rechazar la hipótesis nula. Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de normalidad. Por ende, quiere decir que entre más Edad tienen los estudiantes va a decaer el estado de salud.

mod0=lm(age~salud)
summary(mod0) 
## 
## Call:
## lm(formula = age ~ salud)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.8420 -0.7849  0.1580  1.2151  5.1580 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 16.89908    0.17633  95.837   <2e-16 ***
## salud       -0.05708    0.04621  -1.235    0.217    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.275 on 393 degrees of freedom
## Multiple R-squared:  0.003867,   Adjusted R-squared:  0.001333 
## F-statistic: 1.526 on 1 and 393 DF,  p-value: 0.2175

SOLUCION DEL TALLER DOS

1.Estimación e interpretación de modelos estadísticos de regresión lineal múltiple para la(s) variable(s) respuesta elegida(s)

mod1=lm(age~.,data = Maths)
summary(mod1)
## 
## Call:
## lm(formula = age ~ ., data = Maths)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1689 -0.7611 -0.0125  0.6205  3.4620 
## 
## Coefficients: (2 not defined because of singularities)
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     17.234767   0.600701  28.691  < 2e-16 ***
## escuelaMS        1.360086   0.183042   7.430 8.02e-13 ***
## sexoM           -0.010536   0.123492  -0.085 0.932056    
## DireccionU      -0.136667   0.144303  -0.947 0.344236    
## familia          0.129798   0.060836   2.134 0.033556 *  
## PstatusT         0.227169   0.177791   1.278 0.202171    
## Medu            -0.064324   0.079826  -0.806 0.420887    
## Federal         -0.045715   0.069074  -0.662 0.508507    
## Mjobhealth       0.102000   0.276875   0.368 0.712795    
## Mjobother       -0.017878   0.177581  -0.101 0.919865    
## Mjobservices     0.109034   0.197759   0.551 0.581737    
## Mjobteacher      0.221395   0.255622   0.866 0.387015    
## Fojobhealth     -0.754489   0.355353  -2.123 0.034422 *  
## Fojobother      -0.334262   0.253920  -1.316 0.188879    
## Fojobservices   -0.467604   0.261346  -1.789 0.074426 .  
## Fojobteacher    -0.262930   0.321338  -0.818 0.413767    
## razonhome       -0.043273   0.137834  -0.314 0.753745    
## razonother      -0.154842   0.203153  -0.762 0.446445    
## razonreputation  0.051814   0.143518   0.361 0.718291    
## guardianmother   0.029724   0.135858   0.219 0.826942    
## guardianother    1.562533   0.234625   6.660 1.03e-10 ***
## traveltime      -0.163037   0.083783  -1.946 0.052444 .  
## studytime        0.110087   0.071382   1.542 0.123900    
## fallas           0.081421   0.082623   0.985 0.325070    
## escuela.1MS            NA         NA      NA       NA    
## famsupyes       -0.168014   0.118252  -1.421 0.156240    
## pagadoyes        0.042063   0.118899   0.354 0.723720    
## actividadesyes  -0.089624   0.110438  -0.812 0.417596    
## guarderiayes     0.060646   0.135943   0.446 0.655786    
## higheryes       -0.958510   0.263573  -3.637 0.000317 ***
## Internetyes     -0.270080   0.153613  -1.758 0.079571 .  
## romanticoyes     0.215522   0.115775   1.862 0.063484 .  
## familia.1              NA         NA      NA       NA    
## freetime        -0.103046   0.058834  -1.751 0.080722 .  
## salir            0.139042   0.055412   2.509 0.012541 *  
## Dalc             0.067237   0.081928   0.821 0.412373    
## Walc             0.043105   0.061623   0.699 0.484695    
## salud           -0.038495   0.039927  -0.964 0.335636    
## ausencia         0.022729   0.007097   3.203 0.001483 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.023 on 358 degrees of freedom
## Multiple R-squared:  0.416,  Adjusted R-squared:  0.3572 
## F-statistic: 7.082 on 36 and 358 DF,  p-value: < 2.2e-16

2. Pruebas de significancia global e individual

3. Depuración del modelo

step(mod1,data=datos)
## Start:  AIC=53.15
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu + 
##     Federal + Mjob + Fojob + razon + guardian + traveltime + 
##     studytime + fallas + escuela.1 + famsup + pagado + actividades + 
##     guarderia + higher + Internet + romantico + familia.1 + freetime + 
##     salir + Dalc + Walc + salud + ausencia
## 
## 
## Step:  AIC=53.15
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu + 
##     Federal + Mjob + Fojob + razon + guardian + traveltime + 
##     studytime + fallas + escuela.1 + famsup + pagado + actividades + 
##     guarderia + higher + Internet + romantico + freetime + salir + 
##     Dalc + Walc + salud + ausencia
## 
## 
## Step:  AIC=53.15
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu + 
##     Federal + Mjob + Fojob + razon + guardian + traveltime + 
##     studytime + fallas + famsup + pagado + actividades + guarderia + 
##     higher + Internet + romantico + freetime + salir + Dalc + 
##     Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS     AIC
## - Mjob         4     1.596 376.29  46.828
## - razon        3     1.124 375.81  48.332
## - sexo         1     0.008 374.70  51.157
## - pagado       1     0.131 374.82  51.287
## - guarderia    1     0.208 374.90  51.368
## - Fojob        4     6.138 380.83  51.568
## - Federal      1     0.458 375.15  51.632
## - Walc         1     0.512 375.20  51.688
## - Medu         1     0.680 375.37  51.865
## - actividades  1     0.689 375.38  51.875
## - Dalc         1     0.705 375.39  51.891
## - Direccion    1     0.939 375.63  52.137
## - salud        1     0.973 375.66  52.173
## - fallas       1     1.016 375.71  52.219
## - Pstatus      1     1.709 376.40  52.946
## <none>                     374.69  53.149
## - famsup       1     2.113 376.80  53.370
## - studytime    1     2.489 377.18  53.764
## - freetime     1     3.211 377.90  54.519
## - Internet     1     3.235 377.92  54.545
## - romantico    1     3.627 378.32  54.954
## - traveltime   1     3.963 378.65  55.305
## - familia      1     4.764 379.45  56.140
## - salir        1     6.590 381.28  58.035
## - ausencia     1    10.736 385.43  62.308
## - higher       1    13.841 388.53  65.477
## - guardian     2    55.582 430.27 103.785
## - escuela      1    57.786 432.48 107.803
## 
## Step:  AIC=46.83
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu + 
##     Federal + Fojob + razon + guardian + traveltime + studytime + 
##     fallas + famsup + pagado + actividades + guarderia + higher + 
##     Internet + romantico + freetime + salir + Dalc + Walc + salud + 
##     ausencia
## 
##               Df Sum of Sq    RSS     AIC
## - razon        3     1.170 377.46  42.054
## - Fojob        4     5.678 381.96  44.744
## - sexo         1     0.000 376.29  44.829
## - Medu         1     0.121 376.41  44.956
## - pagado       1     0.257 376.54  45.098
## - guarderia    1     0.281 376.57  45.123
## - actividades  1     0.531 376.82  45.386
## - Dalc         1     0.556 376.84  45.411
## - Federal      1     0.613 376.90  45.471
## - Walc         1     0.679 376.97  45.541
## - salud        1     0.774 377.06  45.640
## - Direccion    1     0.883 377.17  45.754
## - fallas       1     1.094 377.38  45.975
## - Pstatus      1     1.886 378.17  46.803
## <none>                     376.29  46.828
## - famsup       1     2.015 378.30  46.937
## - studytime    1     2.325 378.61  47.261
## - Internet     1     2.849 379.14  47.808
## - freetime     1     2.871 379.16  47.830
## - romantico    1     3.104 379.39  48.074
## - traveltime   1     4.010 380.30  49.015
## - familia      1     4.554 380.84  49.580
## - salir        1     6.119 382.40  51.200
## - ausencia     1    10.449 386.73  55.647
## - higher       1    13.853 390.14  59.109
## - guardian     2    57.004 433.29  98.546
## - escuela      1    58.490 434.78 101.898
## 
## Step:  AIC=42.05
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu + 
##     Federal + Fojob + guardian + traveltime + studytime + fallas + 
##     famsup + pagado + actividades + guarderia + higher + Internet + 
##     romantico + freetime + salir + Dalc + Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - sexo         1     0.000 377.46 40.054
## - Fojob        4     5.790 383.25 40.068
## - Medu         1     0.114 377.57 40.173
## - pagado       1     0.156 377.61 40.218
## - guarderia    1     0.275 377.73 40.342
## - Dalc         1     0.388 377.84 40.460
## - actividades  1     0.496 377.95 40.573
## - Federal      1     0.545 378.00 40.624
## - Walc         1     0.701 378.16 40.787
## - salud        1     0.885 378.34 40.979
## - Direccion    1     1.070 378.53 41.172
## - fallas       1     1.175 378.63 41.282
## - famsup       1     1.817 379.27 41.951
## - Pstatus      1     1.851 379.31 41.987
## <none>                     377.46 42.054
## - Internet     1     2.789 380.25 42.963
## - studytime    1     2.790 380.25 42.963
## - freetime     1     2.825 380.28 42.999
## - romantico    1     2.848 380.30 43.024
## - traveltime   1     3.777 381.23 43.987
## - familia      1     4.511 381.97 44.747
## - salir        1     6.314 383.77 46.607
## - ausencia     1    10.660 388.12 51.055
## - higher       1    13.538 390.99 53.973
## - guardian     2    57.187 434.64 93.778
## - escuela      1    57.516 434.97 96.076
## 
## Step:  AIC=40.05
## age ~ escuela + Direccion + familia + Pstatus + Medu + Federal + 
##     Fojob + guardian + traveltime + studytime + fallas + famsup + 
##     pagado + actividades + guarderia + higher + Internet + romantico + 
##     freetime + salir + Dalc + Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - Fojob        4     5.790 383.25 38.068
## - Medu         1     0.114 377.57 38.174
## - pagado       1     0.156 377.61 38.218
## - guarderia    1     0.277 377.73 38.344
## - Dalc         1     0.395 377.85 38.468
## - actividades  1     0.501 377.96 38.578
## - Federal      1     0.547 378.00 38.626
## - Walc         1     0.716 378.17 38.803
## - salud        1     0.891 378.35 38.986
## - Direccion    1     1.072 378.53 39.175
## - fallas       1     1.175 378.63 39.282
## - famsup       1     1.846 379.30 39.982
## - Pstatus      1     1.852 379.31 39.987
## <none>                     377.46 40.054
## - Internet     1     2.803 380.26 40.976
## - romantico    1     2.871 380.33 41.047
## - freetime     1     2.878 380.33 41.055
## - studytime    1     2.911 380.37 41.089
## - traveltime   1     3.777 381.23 41.987
## - familia      1     4.532 381.99 42.768
## - salir        1     6.366 383.82 44.661
## - ausencia     1    10.807 388.26 49.204
## - higher       1    13.775 391.23 52.213
## - guardian     2    57.195 434.65 91.785
## - escuela      1    57.628 435.08 94.178
## 
## Step:  AIC=38.07
## age ~ escuela + Direccion + familia + Pstatus + Medu + Federal + 
##     guardian + traveltime + studytime + fallas + famsup + pagado + 
##     actividades + guarderia + higher + Internet + romantico + 
##     freetime + salir + Dalc + Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - pagado       1     0.062 383.31 36.132
## - Medu         1     0.145 383.39 36.217
## - guarderia    1     0.400 383.65 36.479
## - Walc         1     0.409 383.66 36.489
## - Dalc         1     0.460 383.71 36.542
## - actividades  1     0.615 383.86 36.701
## - Federal      1     0.803 384.05 36.895
## - fallas       1     0.923 384.17 37.018
## - salud        1     1.078 384.32 37.177
## - Direccion    1     1.310 384.56 37.416
## - Pstatus      1     1.671 384.92 37.787
## - famsup       1     1.751 385.00 37.868
## <none>                     383.25 38.068
## - freetime     1     2.058 385.30 38.184
## - studytime    1     2.301 385.55 38.432
## - Internet     1     2.698 385.94 38.839
## - romantico    1     3.236 386.48 39.389
## - familia      1     3.833 387.08 39.998
## - traveltime   1     3.884 387.13 40.051
## - salir        1     6.522 389.77 42.733
## - ausencia     1    10.439 393.68 46.683
## - higher       1    13.405 396.65 49.648
## - guardian     2    57.823 441.07 89.575
## - escuela      1    59.786 443.03 93.329
## 
## Step:  AIC=36.13
## age ~ escuela + Direccion + familia + Pstatus + Medu + Federal + 
##     guardian + traveltime + studytime + fallas + famsup + actividades + 
##     guarderia + higher + Internet + romantico + freetime + salir + 
##     Dalc + Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - Medu         1     0.134 383.44 34.269
## - guarderia    1     0.433 383.74 34.577
## - Walc         1     0.457 383.76 34.602
## - Dalc         1     0.475 383.78 34.621
## - actividades  1     0.629 383.94 34.780
## - Federal      1     0.833 384.14 34.989
## - fallas       1     0.877 384.19 35.035
## - salud        1     1.117 384.43 35.282
## - Direccion    1     1.295 384.60 35.464
## - famsup       1     1.704 385.01 35.884
## - Pstatus      1     1.721 385.03 35.902
## <none>                     383.31 36.132
## - freetime     1     2.125 385.43 36.315
## - studytime    1     2.401 385.71 36.599
## - Internet     1     2.642 385.95 36.845
## - romantico    1     3.244 386.55 37.461
## - familia      1     3.868 387.18 38.098
## - traveltime   1     3.951 387.26 38.182
## - salir        1     6.487 389.80 40.761
## - ausencia     1    10.399 393.71 44.705
## - higher       1    13.373 396.68 47.678
## - guardian     2    58.265 441.57 88.026
## - escuela      1    60.352 443.66 91.888
## 
## Step:  AIC=34.27
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian + 
##     traveltime + studytime + fallas + famsup + actividades + 
##     guarderia + higher + Internet + romantico + freetime + salir + 
##     Dalc + Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - guarderia    1     0.397 383.84 32.678
## - Dalc         1     0.435 383.88 32.717
## - Walc         1     0.496 383.94 32.780
## - actividades  1     0.656 384.10 32.944
## - fallas       1     0.917 384.36 33.212
## - salud        1     1.083 384.52 33.383
## - Direccion    1     1.368 384.81 33.676
## - famsup       1     1.769 385.21 34.088
## - Pstatus      1     1.797 385.24 34.116
## - Federal      1     1.851 385.29 34.172
## <none>                     383.44 34.269
## - freetime     1     2.191 385.63 34.520
## - studytime    1     2.347 385.79 34.680
## - Internet     1     2.807 386.25 35.151
## - romantico    1     3.214 386.66 35.566
## - familia      1     3.892 387.33 36.259
## - traveltime   1     3.910 387.35 36.277
## - salir        1     6.443 389.88 38.851
## - ausencia     1    10.270 393.71 42.710
## - higher       1    13.530 396.97 45.967
## - guardian     2    58.907 442.35 86.719
## - escuela      1    60.531 443.97 90.166
## 
## Step:  AIC=32.68
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian + 
##     traveltime + studytime + fallas + famsup + actividades + 
##     higher + Internet + romantico + freetime + salir + Dalc + 
##     Walc + salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - Dalc         1     0.424 384.26 31.113
## - Walc         1     0.440 384.28 31.130
## - actividades  1     0.688 384.53 31.385
## - fallas       1     0.925 384.76 31.629
## - salud        1     1.102 384.94 31.810
## - Direccion    1     1.305 385.14 32.019
## - Federal      1     1.661 385.50 32.383
## - Pstatus      1     1.689 385.53 32.412
## - famsup       1     1.753 385.59 32.478
## <none>                     383.84 32.678
## - freetime     1     2.154 385.99 32.888
## - studytime    1     2.491 386.33 33.233
## - Internet     1     2.889 386.73 33.640
## - romantico    1     3.311 387.15 34.070
## - traveltime   1     3.807 387.64 34.576
## - familia      1     3.874 387.71 34.644
## - salir        1     6.545 390.38 37.357
## - ausencia     1    10.456 394.29 41.293
## - higher       1    13.460 397.30 44.292
## - guardian     2    58.999 442.84 85.155
## - escuela      1    60.197 444.04 88.222
## 
## Step:  AIC=31.11
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian + 
##     traveltime + studytime + fallas + famsup + actividades + 
##     higher + Internet + romantico + freetime + salir + Walc + 
##     salud + ausencia
## 
##               Df Sum of Sq    RSS    AIC
## - actividades  1     0.753 385.02 29.887
## - fallas       1     0.960 385.22 30.099
## - salud        1     1.072 385.33 30.214
## - Direccion    1     1.339 385.60 30.487
## - Walc         1     1.606 385.87 30.761
## - Pstatus      1     1.612 385.87 30.767
## - Federal      1     1.617 385.88 30.772
## - famsup       1     1.706 385.97 30.864
## - freetime     1     1.914 386.18 31.076
## <none>                     384.26 31.113
## - studytime    1     2.465 386.73 31.639
## - Internet     1     2.779 387.04 31.960
## - romantico    1     3.321 387.58 32.512
## - traveltime   1     3.688 387.95 32.887
## - familia      1     3.812 388.07 33.012
## - salir        1     6.435 390.70 35.673
## - ausencia     1    10.594 394.86 39.856
## - higher       1    13.392 397.65 42.645
## - guardian     2    59.665 443.93 84.126
## - escuela      1    61.211 445.47 87.499
## 
## Step:  AIC=29.89
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian + 
##     traveltime + studytime + fallas + famsup + higher + Internet + 
##     romantico + freetime + salir + Walc + salud + ausencia
## 
##              Df Sum of Sq    RSS    AIC
## - fallas      1     0.979 385.99 28.891
## - salud       1     1.103 386.12 29.017
## - Direccion   1     1.170 386.19 29.085
## - Pstatus     1     1.399 386.41 29.320
## - famsup      1     1.552 386.57 29.476
## - Walc        1     1.722 386.74 29.649
## - Federal     1     1.887 386.90 29.818
## <none>                    385.02 29.887
## - freetime    1     2.198 387.21 30.136
## - studytime   1     2.290 387.31 30.229
## - Internet    1     2.845 387.86 30.795
## - romantico   1     3.205 388.22 31.161
## - familia     1     3.806 388.82 31.772
## - traveltime  1     3.810 388.83 31.776
## - salir       1     6.276 391.29 34.273
## - ausencia    1    10.586 395.60 38.601
## - higher      1    13.985 399.00 41.981
## - guardian    2    60.020 445.03 83.110
## - escuela     1    64.397 449.41 88.977
## 
## Step:  AIC=28.89
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian + 
##     traveltime + studytime + famsup + higher + Internet + romantico + 
##     freetime + salir + Walc + salud + ausencia
## 
##              Df Sum of Sq    RSS    AIC
## - salud       1     0.967 386.96 27.878
## - Pstatus     1     1.348 387.34 28.268
## - Direccion   1     1.360 387.35 28.279
## - famsup      1     1.489 387.48 28.411
## - Walc        1     1.805 387.80 28.734
## - studytime   1     1.928 387.92 28.859
## <none>                    385.99 28.891
## - freetime    1     2.180 388.17 29.115
## - Federal     1     2.628 388.62 29.570
## - Internet    1     2.879 388.87 29.825
## - romantico   1     3.384 389.38 30.338
## - familia     1     3.589 389.58 30.547
## - traveltime  1     3.896 389.89 30.858
## - salir       1     6.968 392.96 33.958
## - ausencia    1    10.520 396.51 37.512
## - higher      1    16.820 402.81 43.738
## - escuela     1    64.201 450.20 87.665
## - guardian    2    70.791 456.79 91.405
## 
## Step:  AIC=27.88
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian + 
##     traveltime + studytime + famsup + higher + Internet + romantico + 
##     freetime + salir + Walc + ausencia
## 
##              Df Sum of Sq    RSS    AIC
## - Direccion   1     1.285 388.25 27.188
## - Pstatus     1     1.308 388.27 27.212
## - Walc        1     1.553 388.51 27.460
## - famsup      1     1.600 388.56 27.508
## <none>                    386.96 27.878
## - studytime   1     2.093 389.05 28.009
## - freetime    1     2.367 389.33 28.288
## - Internet    1     2.599 389.56 28.523
## - Federal     1     2.658 389.62 28.583
## - romantico   1     3.169 390.13 29.100
## - familia     1     3.228 390.19 29.160
## - traveltime  1     3.841 390.80 29.780
## - salir       1     7.352 394.31 33.313
## - ausencia    1    10.737 397.70 36.689
## - higher      1    16.849 403.81 42.713
## - escuela     1    65.546 452.51 87.688
## - guardian    2    71.784 458.75 91.096
## 
## Step:  AIC=27.19
## age ~ escuela + familia + Pstatus + Federal + guardian + traveltime + 
##     studytime + famsup + higher + Internet + romantico + freetime + 
##     salir + Walc + ausencia
## 
##              Df Sum of Sq    RSS    AIC
## - Pstatus     1     1.459 389.71 26.670
## - famsup      1     1.538 389.78 26.750
## - Walc        1     1.934 390.18 27.151
## <none>                    388.25 27.188
## - freetime    1     2.350 390.60 27.572
## - studytime   1     2.517 390.76 27.741
## - Federal     1     2.564 390.81 27.789
## - traveltime  1     2.946 391.19 28.174
## - romantico   1     3.094 391.34 28.324
## - familia     1     3.352 391.60 28.584
## - Internet    1     3.423 391.67 28.656
## - salir       1     6.724 394.97 31.970
## - ausencia    1    11.361 399.61 36.581
## - higher      1    17.125 405.37 42.238
## - guardian    2    70.853 459.10 89.401
## - escuela     1    73.222 461.47 93.434
## 
## Step:  AIC=26.67
## age ~ escuela + familia + Federal + guardian + traveltime + studytime + 
##     famsup + higher + Internet + romantico + freetime + salir + 
##     Walc + ausencia
## 
##              Df Sum of Sq    RSS    AIC
## - famsup      1     1.422 391.13 26.109
## <none>                    389.71 26.670
## - Walc        1     1.987 391.69 26.679
## - freetime    1     2.273 391.98 26.967
## - studytime   1     2.610 392.32 27.307
## - traveltime  1     2.922 392.63 27.621
## - romantico   1     2.978 392.68 27.677
## - Federal     1     3.001 392.71 27.700
## - Internet    1     3.053 392.76 27.753
## - familia     1     3.442 393.15 28.143
## - salir       1     6.721 396.43 31.424
## - ausencia    1    10.577 400.28 35.248
## - higher      1    17.548 407.25 42.068
## - guardian    2    70.053 459.76 87.968
## - escuela     1    74.285 463.99 93.587
## 
## Step:  AIC=26.11
## age ~ escuela + familia + Federal + guardian + traveltime + studytime + 
##     higher + Internet + romantico + freetime + salir + Walc + 
##     ausencia
## 
##              Df Sum of Sq    RSS    AIC
## <none>                    391.13 26.109
## - Walc        1     2.187 393.31 26.311
## - studytime   1     2.198 393.33 26.322
## - freetime    1     2.480 393.61 26.606
## - romantico   1     2.971 394.10 27.097
## - Internet    1     3.335 394.46 27.462
## - traveltime  1     3.339 394.47 27.466
## - familia     1     3.677 394.80 27.805
## - Federal     1     3.871 395.00 27.999
## - salir       1     6.772 397.90 30.889
## - ausencia    1    10.440 401.57 34.514
## - higher      1    18.113 409.24 41.991
## - guardian    2    69.652 460.78 86.844
## - escuela     1    79.221 470.35 96.962
## 
## Call:
## lm(formula = age ~ escuela + familia + Federal + guardian + traveltime + 
##     studytime + higher + Internet + romantico + freetime + salir + 
##     Walc + ausencia, data = Maths)
## 
## Coefficients:
##    (Intercept)       escuelaMS         familia         Federal  guardianmother  
##       16.84529         1.46838         0.11099        -0.09544         0.07162  
##  guardianother      traveltime       studytime       higheryes     Internetyes  
##        1.64279        -0.13959         0.09508        -1.01941        -0.25481  
##   romanticoyes        freetime           salir            Walc        ausencia  
##        0.19048        -0.08545         0.13620         0.06794         0.02146
mod2=lm(age~escuela+familia+Federal+guardian+traveltime+studytime+higher+Internet+romantico+freetime+salir+Walc+ausencia)
summary(mod2)
## 
## Call:
## lm(formula = age ~ escuela + familia + Federal + guardian + traveltime + 
##     studytime + higher + Internet + romantico + freetime + salir + 
##     Walc + ausencia)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.0433 -0.7490 -0.0454  0.6272  3.7101 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    16.845285   0.453190  37.171  < 2e-16 ***
## escuelaMS       1.468383   0.167374   8.773  < 2e-16 ***
## familia         0.110995   0.058725   1.890  0.05951 .  
## Federal        -0.095444   0.049216  -1.939  0.05321 .  
## guardianmother  0.071621   0.125808   0.569  0.56950    
## guardianother   1.642791   0.217392   7.557 3.12e-13 ***
## traveltime     -0.139587   0.077504  -1.801  0.07249 .  
## studytime       0.095083   0.065074   1.461  0.14480    
## higheryes      -1.019412   0.243006  -4.195 3.40e-05 ***
## Internetyes    -0.254807   0.141562  -1.800  0.07266 .  
## romanticoyes    0.190482   0.112123   1.699  0.09016 .  
## freetime       -0.085445   0.055042  -1.552  0.12141    
## salir           0.136199   0.053098   2.565  0.01070 *  
## Walc            0.067944   0.046615   1.458  0.14579    
## ausencia        0.021463   0.006739   3.185  0.00157 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.015 on 380 degrees of freedom
## Multiple R-squared:  0.3903, Adjusted R-squared:  0.3679 
## F-statistic: 17.38 on 14 and 380 DF,  p-value: < 2.2e-16

El nuevo modelo 2 es el resultado de la depuracion del modelo global el cual explica el 39% segun R-squared: 0.3903 y tiene encuenta que en promedio la edad de 16 años los alumnos empiezan a consumir alcohol y a desminuir su salud y inasistencia y el tiepo que le invierten a sus estudios.

4. Interpretar el coeficiente de determinación

coef(mod2)
##    (Intercept)      escuelaMS        familia        Federal guardianmother 
##    16.84528539     1.46838286     0.11099497    -0.09544435     0.07162095 
##  guardianother     traveltime      studytime      higheryes    Internetyes 
##     1.64279128    -0.13958723     0.09508330    -1.01941212    -0.25480730 
##   romanticoyes       freetime          salir           Walc       ausencia 
##     0.19048178    -0.08544507     0.13619861     0.06794446     0.02146292

Se registra los coeficiente de determinacion a las variables del modelo dos ya que es el modelo depurado.hay que tener en cuenta que las variables escuelaMS, guardianother, higheryes deberan ser ajustadas debido a que se acercan a 1.