SOLUCION DEL TALLER UNO
1. Objetivo del análisis estadístico del conjunto de datos.
El estudio tiene como objetivo evaluar las causas de los efectos del alcohol en el estudio, teniendo en cuenta el análisis de tipo cuantitativo y descriptivo. La muestra incluyó 395 estudiantes (53% del sexo femenino y 47% del sexo masculino), con edades entre 15 y 22 años. Esta discriminación existe entre los adolescentes antes de tener experiencias significativas con el consumo de alcohol y aumentan con la edad.
2. Descripción del contexto al que pertenecen los datos.
Estos datos abordan el rendimiento de los estudiantes en la educación secundaria de dos escuelas portuguesas (Gabriel PereiraY Mousinho da Silveira). Los atributos de los datos incluyen calificaciones de los estudiantes, características demográficas, sociales y relacionadas con la escuela y se recopilaron mediante el uso de informes y cuestionarios escolares. Se proporcionan dos conjuntos de datos sobre el rendimiento de materia de Matemáticas (MATHS). [Cortez and Silva, 2008].
3. Descripción y escala de medición de las variables consideradas.
3.1.1 Variables de estudio
3.1.2 Estas calificaciones están relacionadas con la materia del curso de Matemáticas
library(readr)
Maths <- read_csv("C:/Users/Admin/Desktop/UNIVERSIDAD/ESPECIALIZACON EN ESTADISTICA/ANALISIS DE REGRESION/TALLERES/Maths.csv")
## Rows: 395 Columns: 33
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (17): school, sex, address, famsize, Pstatus, Mjob, Fjob, reason, guardi...
## dbl (16): age, Medu, Fedu, traveltime, studytime, failures, famrel, freetime...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
##View(Maths)
str(Maths)
## spec_tbl_df [395 × 33] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ school : chr [1:395] "GP" "GP" "GP" "GP" ...
## $ sex : chr [1:395] "F" "F" "F" "F" ...
## $ age : num [1:395] 18 17 15 15 16 16 16 17 15 15 ...
## $ address : chr [1:395] "U" "U" "U" "U" ...
## $ famsize : chr [1:395] "GT3" "GT3" "LE3" "GT3" ...
## $ Pstatus : chr [1:395] "A" "T" "T" "T" ...
## $ Medu : num [1:395] 4 1 1 4 3 4 2 4 3 3 ...
## $ Fedu : num [1:395] 4 1 1 2 3 3 2 4 2 4 ...
## $ Mjob : chr [1:395] "at_home" "at_home" "at_home" "health" ...
## $ Fjob : chr [1:395] "teacher" "other" "other" "services" ...
## $ reason : chr [1:395] "course" "course" "other" "home" ...
## $ guardian : chr [1:395] "mother" "father" "mother" "mother" ...
## $ traveltime: num [1:395] 2 1 1 1 1 1 1 2 1 1 ...
## $ studytime : num [1:395] 2 2 2 3 2 2 2 2 2 2 ...
## $ failures : num [1:395] 0 0 3 0 0 0 0 0 0 0 ...
## $ schoolsup : chr [1:395] "yes" "no" "yes" "no" ...
## $ famsup : chr [1:395] "no" "yes" "no" "yes" ...
## $ paid : chr [1:395] "no" "no" "yes" "yes" ...
## $ activities: chr [1:395] "no" "no" "no" "yes" ...
## $ nursery : chr [1:395] "yes" "no" "yes" "yes" ...
## $ higher : chr [1:395] "yes" "yes" "yes" "yes" ...
## $ internet : chr [1:395] "no" "yes" "yes" "yes" ...
## $ romantic : chr [1:395] "no" "no" "no" "yes" ...
## $ famrel : num [1:395] 4 5 4 3 4 5 4 4 4 5 ...
## $ freetime : num [1:395] 3 3 3 2 3 4 4 1 2 5 ...
## $ goout : num [1:395] 4 3 2 2 2 2 4 4 2 1 ...
## $ Dalc : num [1:395] 1 1 2 1 1 1 1 1 1 1 ...
## $ Walc : num [1:395] 1 1 3 1 2 2 1 1 1 1 ...
## $ health : num [1:395] 3 3 3 5 5 5 3 1 1 5 ...
## $ absences : num [1:395] 6 4 10 2 4 10 0 6 0 0 ...
## $ G1 : num [1:395] 5 5 7 15 6 15 12 6 16 14 ...
## $ G2 : num [1:395] 6 5 8 14 10 15 12 5 18 15 ...
## $ G3 : num [1:395] 6 6 10 15 10 15 11 6 19 15 ...
## - attr(*, "spec")=
## .. cols(
## .. school = col_character(),
## .. sex = col_character(),
## .. age = col_double(),
## .. address = col_character(),
## .. famsize = col_character(),
## .. Pstatus = col_character(),
## .. Medu = col_double(),
## .. Fedu = col_double(),
## .. Mjob = col_character(),
## .. Fjob = col_character(),
## .. reason = col_character(),
## .. guardian = col_character(),
## .. traveltime = col_double(),
## .. studytime = col_double(),
## .. failures = col_double(),
## .. schoolsup = col_character(),
## .. famsup = col_character(),
## .. paid = col_character(),
## .. activities = col_character(),
## .. nursery = col_character(),
## .. higher = col_character(),
## .. internet = col_character(),
## .. romantic = col_character(),
## .. famrel = col_double(),
## .. freetime = col_double(),
## .. goout = col_double(),
## .. Dalc = col_double(),
## .. Walc = col_double(),
## .. health = col_double(),
## .. absences = col_double(),
## .. G1 = col_double(),
## .. G2 = col_double(),
## .. G3 = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
summary(Maths)
## school sex age address
## Length:395 Length:395 Min. :15.0 Length:395
## Class :character Class :character 1st Qu.:16.0 Class :character
## Mode :character Mode :character Median :17.0 Mode :character
## Mean :16.7
## 3rd Qu.:18.0
## Max. :22.0
## famsize Pstatus Medu Fedu
## Length:395 Length:395 Min. :0.000 Min. :0.000
## Class :character Class :character 1st Qu.:2.000 1st Qu.:2.000
## Mode :character Mode :character Median :3.000 Median :2.000
## Mean :2.749 Mean :2.522
## 3rd Qu.:4.000 3rd Qu.:3.000
## Max. :4.000 Max. :4.000
## Mjob Fjob reason guardian
## Length:395 Length:395 Length:395 Length:395
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## traveltime studytime failures schoolsup
## Min. :1.000 Min. :1.000 Min. :0.0000 Length:395
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:0.0000 Class :character
## Median :1.000 Median :2.000 Median :0.0000 Mode :character
## Mean :1.448 Mean :2.035 Mean :0.3342
## 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:0.0000
## Max. :4.000 Max. :4.000 Max. :3.0000
## famsup paid activities nursery
## Length:395 Length:395 Length:395 Length:395
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## higher internet romantic famrel
## Length:395 Length:395 Length:395 Min. :1.000
## Class :character Class :character Class :character 1st Qu.:4.000
## Mode :character Mode :character Mode :character Median :4.000
## Mean :3.944
## 3rd Qu.:5.000
## Max. :5.000
## freetime goout Dalc Walc
## Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:3.000 1st Qu.:2.000 1st Qu.:1.000 1st Qu.:1.000
## Median :3.000 Median :3.000 Median :1.000 Median :2.000
## Mean :3.235 Mean :3.109 Mean :1.481 Mean :2.291
## 3rd Qu.:4.000 3rd Qu.:4.000 3rd Qu.:2.000 3rd Qu.:3.000
## Max. :5.000 Max. :5.000 Max. :5.000 Max. :5.000
## health absences G1 G2
## Min. :1.000 Min. : 0.000 Min. : 3.00 Min. : 0.00
## 1st Qu.:3.000 1st Qu.: 0.000 1st Qu.: 8.00 1st Qu.: 9.00
## Median :4.000 Median : 4.000 Median :11.00 Median :11.00
## Mean :3.554 Mean : 5.709 Mean :10.91 Mean :10.71
## 3rd Qu.:5.000 3rd Qu.: 8.000 3rd Qu.:13.00 3rd Qu.:13.00
## Max. :5.000 Max. :75.000 Max. :19.00 Max. :19.00
## G3
## Min. : 0.00
## 1st Qu.: 8.00
## Median :11.00
## Mean :10.42
## 3rd Qu.:14.00
## Max. :20.00
Maths$school<-as.factor(Maths$school)
Maths$sex<-as.factor(Maths$sex)
Maths$address<-as.factor(Maths$address)
Maths$famsize<-as.factor(Maths$famsize)
Maths$Pstatus<-as.factor(Maths$Pstatus)
Maths$Mjob<-as.factor(Maths$Mjob)
Maths$Fjob<-as.factor(Maths$Fjob)
Maths$reason<-as.factor(Maths$reason)
Maths$guardian<-as.factor(Maths$guardian)
Maths$schoolsup<-as.factor(Maths$schoolsup)
Maths$famsup<-as.factor(Maths$famsup)
Maths$paid<-as.factor(Maths$paid)
Maths$activities<-as.factor(Maths$activities)
Maths$nursery<-as.factor(Maths$nursery)
Maths$higher<-as.factor(Maths$higher)
Maths$internet<-as.factor(Maths$internet)
Maths$romantic<-as.factor(Maths$romantic)
escuela=Maths$school
sexo=Maths$sex
age=Maths$age
Direccion=Maths$address
familia=Maths$famsize
Pstatus=Maths$Pstatus
Medu=Maths$Medu
Federal=Maths$Fedu
Mjob=Maths$Mjob
Fojob=Maths$Fjob
razon=Maths$reason
guardian=Maths$guardian
traveltime=Maths$traveltime
studytime=Maths$studytime
fallas=Maths$failures
escuelas=Maths$schoolsup
famsup=Maths$famsup
pagado=Maths$paid
actividades=Maths$activities
guarderia=Maths$nursery
higher=Maths$higher
Internet=Maths$internet
romantico=Maths$romantic
familia=Maths$famrel
freetime=Maths$freetime
salir=Maths$goout
Dalc=Maths$Dalc
Walc=Maths$Walc
salud=Maths$health
ausencia=Maths$absences
Maths=data.frame(escuela,sexo,age,Direccion,familia,Pstatus,Medu,Federal,Mjob,Fojob,razon, guardian,traveltime,studytime,fallas,escuela,famsup,pagado,actividades,guarderia,higher,Internet,romantico,familia,freetime,salir,Dalc,Walc,salud,ausencia)
3.2.1 Analisis Descriptivo Variables Cuantitativas
summary(age)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 15.0 16.0 17.0 16.7 18.0 22.0
summary(Medu)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 2.000 3.000 2.749 4.000 4.000
summary(Federal)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 2.000 2.000 2.522 3.000 4.000
summary(traveltime)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 1.000 1.448 2.000 4.000
summary(studytime)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 2.035 2.000 4.000
summary(fallas)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 0.0000 0.3342 0.0000 3.0000
summary(familia)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 4.000 4.000 3.944 5.000 5.000
summary(freetime)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 3.000 3.000 3.235 4.000 5.000
summary(salir)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 3.000 3.109 4.000 5.000
summary(Dalc)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 1.000 1.481 2.000 5.000
summary(Walc)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 2.291 3.000 5.000
summary(salud)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 3.000 4.000 3.554 5.000 5.000
summary(ausencia)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 4.000 5.709 8.000 75.000
3.2.2 Analisis Descriptivo Variables Cualitativas
table(escuela)
## escuela
## GP MS
## 349 46
table(sexo)
## sexo
## F M
## 208 187
table(Direccion)
## Direccion
## R U
## 88 307
table(familia)
## familia
## 1 2 3 4 5
## 8 18 68 195 106
table(Pstatus)
## Pstatus
## A T
## 41 354
table(Mjob)
## Mjob
## at_home health other services teacher
## 59 34 141 103 58
table(Fojob)
## Fojob
## at_home health other services teacher
## 20 18 217 111 29
table(razon)
## razon
## course home other reputation
## 145 109 36 105
table(guardian)
## guardian
## father mother other
## 90 273 32
table(escuelas)
## escuelas
## no yes
## 344 51
table(famsup)
## famsup
## no yes
## 153 242
table(pagado)
## pagado
## no yes
## 214 181
table(actividades)
## actividades
## no yes
## 194 201
table(guarderia)
## guarderia
## no yes
## 81 314
table(higher)
## higher
## no yes
## 20 375
table(Internet)
## Internet
## no yes
## 66 329
table(romantico)
## romantico
## no yes
## 263 132
3.2.3 Histogramas de las variables mas representativas
hist(age)
hist(Medu)
hist(Federal)
hist(traveltime)
hist(studytime)
hist(fallas)
hist(familia)
hist(freetime)
hist(salir)
hist(Dalc)
hist(Walc)
hist(salud)
hist(ausencia)
3.2.4 Diagrama de Caja y bigotes de las variables mas
representativas
boxplot(age~salud, col = "red", main= "Box-plot para Años VS Condiciones de salud")
boxplot(age~fallas, col = "green", main= "Box-plot para Años VS fallas de clases")
boxplot(age~freetime, col = "purple", main= "Box-plot para Años VS tiempo libre")
boxplot(age~ausencia, col = "purple", main= "Box-plot para Años VS ausencia")
4. Estimación e interpretación de modelos estadísticos de regresión lineal simple para la variable respuesta elegida.
Modelo 0:Para el modelo de regresión lineal simple se tuvo en cuenta como variable de respuesta Y (la Edad de los estudiantes) y la variable Salud. Como se puede evidenciar el R-squared: 0.003867 el modelo no explica mucho y el p-value = 0.2175 es mayor de 0.05, no podemos rechazar la hipótesis nula. Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de normalidad. Por ende, quiere decir que entre más Edad tienen los estudiantes va a decaer el estado de salud.
mod0=lm(age~salud)
summary(mod0)
##
## Call:
## lm(formula = age ~ salud)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.8420 -0.7849 0.1580 1.2151 5.1580
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.89908 0.17633 95.837 <2e-16 ***
## salud -0.05708 0.04621 -1.235 0.217
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.275 on 393 degrees of freedom
## Multiple R-squared: 0.003867, Adjusted R-squared: 0.001333
## F-statistic: 1.526 on 1 and 393 DF, p-value: 0.2175
SOLUCION DEL TALLER DOS
1.Estimación e interpretación de modelos estadísticos de regresión lineal múltiple para la(s) variable(s) respuesta elegida(s)
mod1=lm(age~.,data = Maths)
summary(mod1)
##
## Call:
## lm(formula = age ~ ., data = Maths)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1689 -0.7611 -0.0125 0.6205 3.4620
##
## Coefficients: (2 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 17.234767 0.600701 28.691 < 2e-16 ***
## escuelaMS 1.360086 0.183042 7.430 8.02e-13 ***
## sexoM -0.010536 0.123492 -0.085 0.932056
## DireccionU -0.136667 0.144303 -0.947 0.344236
## familia 0.129798 0.060836 2.134 0.033556 *
## PstatusT 0.227169 0.177791 1.278 0.202171
## Medu -0.064324 0.079826 -0.806 0.420887
## Federal -0.045715 0.069074 -0.662 0.508507
## Mjobhealth 0.102000 0.276875 0.368 0.712795
## Mjobother -0.017878 0.177581 -0.101 0.919865
## Mjobservices 0.109034 0.197759 0.551 0.581737
## Mjobteacher 0.221395 0.255622 0.866 0.387015
## Fojobhealth -0.754489 0.355353 -2.123 0.034422 *
## Fojobother -0.334262 0.253920 -1.316 0.188879
## Fojobservices -0.467604 0.261346 -1.789 0.074426 .
## Fojobteacher -0.262930 0.321338 -0.818 0.413767
## razonhome -0.043273 0.137834 -0.314 0.753745
## razonother -0.154842 0.203153 -0.762 0.446445
## razonreputation 0.051814 0.143518 0.361 0.718291
## guardianmother 0.029724 0.135858 0.219 0.826942
## guardianother 1.562533 0.234625 6.660 1.03e-10 ***
## traveltime -0.163037 0.083783 -1.946 0.052444 .
## studytime 0.110087 0.071382 1.542 0.123900
## fallas 0.081421 0.082623 0.985 0.325070
## escuela.1MS NA NA NA NA
## famsupyes -0.168014 0.118252 -1.421 0.156240
## pagadoyes 0.042063 0.118899 0.354 0.723720
## actividadesyes -0.089624 0.110438 -0.812 0.417596
## guarderiayes 0.060646 0.135943 0.446 0.655786
## higheryes -0.958510 0.263573 -3.637 0.000317 ***
## Internetyes -0.270080 0.153613 -1.758 0.079571 .
## romanticoyes 0.215522 0.115775 1.862 0.063484 .
## familia.1 NA NA NA NA
## freetime -0.103046 0.058834 -1.751 0.080722 .
## salir 0.139042 0.055412 2.509 0.012541 *
## Dalc 0.067237 0.081928 0.821 0.412373
## Walc 0.043105 0.061623 0.699 0.484695
## salud -0.038495 0.039927 -0.964 0.335636
## ausencia 0.022729 0.007097 3.203 0.001483 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.023 on 358 degrees of freedom
## Multiple R-squared: 0.416, Adjusted R-squared: 0.3572
## F-statistic: 7.082 on 36 and 358 DF, p-value: < 2.2e-16
2. Pruebas de significancia global e individual
3. Depuración del modelo
step(mod1,data=datos)
## Start: AIC=53.15
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu +
## Federal + Mjob + Fojob + razon + guardian + traveltime +
## studytime + fallas + escuela.1 + famsup + pagado + actividades +
## guarderia + higher + Internet + romantico + familia.1 + freetime +
## salir + Dalc + Walc + salud + ausencia
##
##
## Step: AIC=53.15
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu +
## Federal + Mjob + Fojob + razon + guardian + traveltime +
## studytime + fallas + escuela.1 + famsup + pagado + actividades +
## guarderia + higher + Internet + romantico + freetime + salir +
## Dalc + Walc + salud + ausencia
##
##
## Step: AIC=53.15
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu +
## Federal + Mjob + Fojob + razon + guardian + traveltime +
## studytime + fallas + famsup + pagado + actividades + guarderia +
## higher + Internet + romantico + freetime + salir + Dalc +
## Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - Mjob 4 1.596 376.29 46.828
## - razon 3 1.124 375.81 48.332
## - sexo 1 0.008 374.70 51.157
## - pagado 1 0.131 374.82 51.287
## - guarderia 1 0.208 374.90 51.368
## - Fojob 4 6.138 380.83 51.568
## - Federal 1 0.458 375.15 51.632
## - Walc 1 0.512 375.20 51.688
## - Medu 1 0.680 375.37 51.865
## - actividades 1 0.689 375.38 51.875
## - Dalc 1 0.705 375.39 51.891
## - Direccion 1 0.939 375.63 52.137
## - salud 1 0.973 375.66 52.173
## - fallas 1 1.016 375.71 52.219
## - Pstatus 1 1.709 376.40 52.946
## <none> 374.69 53.149
## - famsup 1 2.113 376.80 53.370
## - studytime 1 2.489 377.18 53.764
## - freetime 1 3.211 377.90 54.519
## - Internet 1 3.235 377.92 54.545
## - romantico 1 3.627 378.32 54.954
## - traveltime 1 3.963 378.65 55.305
## - familia 1 4.764 379.45 56.140
## - salir 1 6.590 381.28 58.035
## - ausencia 1 10.736 385.43 62.308
## - higher 1 13.841 388.53 65.477
## - guardian 2 55.582 430.27 103.785
## - escuela 1 57.786 432.48 107.803
##
## Step: AIC=46.83
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu +
## Federal + Fojob + razon + guardian + traveltime + studytime +
## fallas + famsup + pagado + actividades + guarderia + higher +
## Internet + romantico + freetime + salir + Dalc + Walc + salud +
## ausencia
##
## Df Sum of Sq RSS AIC
## - razon 3 1.170 377.46 42.054
## - Fojob 4 5.678 381.96 44.744
## - sexo 1 0.000 376.29 44.829
## - Medu 1 0.121 376.41 44.956
## - pagado 1 0.257 376.54 45.098
## - guarderia 1 0.281 376.57 45.123
## - actividades 1 0.531 376.82 45.386
## - Dalc 1 0.556 376.84 45.411
## - Federal 1 0.613 376.90 45.471
## - Walc 1 0.679 376.97 45.541
## - salud 1 0.774 377.06 45.640
## - Direccion 1 0.883 377.17 45.754
## - fallas 1 1.094 377.38 45.975
## - Pstatus 1 1.886 378.17 46.803
## <none> 376.29 46.828
## - famsup 1 2.015 378.30 46.937
## - studytime 1 2.325 378.61 47.261
## - Internet 1 2.849 379.14 47.808
## - freetime 1 2.871 379.16 47.830
## - romantico 1 3.104 379.39 48.074
## - traveltime 1 4.010 380.30 49.015
## - familia 1 4.554 380.84 49.580
## - salir 1 6.119 382.40 51.200
## - ausencia 1 10.449 386.73 55.647
## - higher 1 13.853 390.14 59.109
## - guardian 2 57.004 433.29 98.546
## - escuela 1 58.490 434.78 101.898
##
## Step: AIC=42.05
## age ~ escuela + sexo + Direccion + familia + Pstatus + Medu +
## Federal + Fojob + guardian + traveltime + studytime + fallas +
## famsup + pagado + actividades + guarderia + higher + Internet +
## romantico + freetime + salir + Dalc + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - sexo 1 0.000 377.46 40.054
## - Fojob 4 5.790 383.25 40.068
## - Medu 1 0.114 377.57 40.173
## - pagado 1 0.156 377.61 40.218
## - guarderia 1 0.275 377.73 40.342
## - Dalc 1 0.388 377.84 40.460
## - actividades 1 0.496 377.95 40.573
## - Federal 1 0.545 378.00 40.624
## - Walc 1 0.701 378.16 40.787
## - salud 1 0.885 378.34 40.979
## - Direccion 1 1.070 378.53 41.172
## - fallas 1 1.175 378.63 41.282
## - famsup 1 1.817 379.27 41.951
## - Pstatus 1 1.851 379.31 41.987
## <none> 377.46 42.054
## - Internet 1 2.789 380.25 42.963
## - studytime 1 2.790 380.25 42.963
## - freetime 1 2.825 380.28 42.999
## - romantico 1 2.848 380.30 43.024
## - traveltime 1 3.777 381.23 43.987
## - familia 1 4.511 381.97 44.747
## - salir 1 6.314 383.77 46.607
## - ausencia 1 10.660 388.12 51.055
## - higher 1 13.538 390.99 53.973
## - guardian 2 57.187 434.64 93.778
## - escuela 1 57.516 434.97 96.076
##
## Step: AIC=40.05
## age ~ escuela + Direccion + familia + Pstatus + Medu + Federal +
## Fojob + guardian + traveltime + studytime + fallas + famsup +
## pagado + actividades + guarderia + higher + Internet + romantico +
## freetime + salir + Dalc + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - Fojob 4 5.790 383.25 38.068
## - Medu 1 0.114 377.57 38.174
## - pagado 1 0.156 377.61 38.218
## - guarderia 1 0.277 377.73 38.344
## - Dalc 1 0.395 377.85 38.468
## - actividades 1 0.501 377.96 38.578
## - Federal 1 0.547 378.00 38.626
## - Walc 1 0.716 378.17 38.803
## - salud 1 0.891 378.35 38.986
## - Direccion 1 1.072 378.53 39.175
## - fallas 1 1.175 378.63 39.282
## - famsup 1 1.846 379.30 39.982
## - Pstatus 1 1.852 379.31 39.987
## <none> 377.46 40.054
## - Internet 1 2.803 380.26 40.976
## - romantico 1 2.871 380.33 41.047
## - freetime 1 2.878 380.33 41.055
## - studytime 1 2.911 380.37 41.089
## - traveltime 1 3.777 381.23 41.987
## - familia 1 4.532 381.99 42.768
## - salir 1 6.366 383.82 44.661
## - ausencia 1 10.807 388.26 49.204
## - higher 1 13.775 391.23 52.213
## - guardian 2 57.195 434.65 91.785
## - escuela 1 57.628 435.08 94.178
##
## Step: AIC=38.07
## age ~ escuela + Direccion + familia + Pstatus + Medu + Federal +
## guardian + traveltime + studytime + fallas + famsup + pagado +
## actividades + guarderia + higher + Internet + romantico +
## freetime + salir + Dalc + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - pagado 1 0.062 383.31 36.132
## - Medu 1 0.145 383.39 36.217
## - guarderia 1 0.400 383.65 36.479
## - Walc 1 0.409 383.66 36.489
## - Dalc 1 0.460 383.71 36.542
## - actividades 1 0.615 383.86 36.701
## - Federal 1 0.803 384.05 36.895
## - fallas 1 0.923 384.17 37.018
## - salud 1 1.078 384.32 37.177
## - Direccion 1 1.310 384.56 37.416
## - Pstatus 1 1.671 384.92 37.787
## - famsup 1 1.751 385.00 37.868
## <none> 383.25 38.068
## - freetime 1 2.058 385.30 38.184
## - studytime 1 2.301 385.55 38.432
## - Internet 1 2.698 385.94 38.839
## - romantico 1 3.236 386.48 39.389
## - familia 1 3.833 387.08 39.998
## - traveltime 1 3.884 387.13 40.051
## - salir 1 6.522 389.77 42.733
## - ausencia 1 10.439 393.68 46.683
## - higher 1 13.405 396.65 49.648
## - guardian 2 57.823 441.07 89.575
## - escuela 1 59.786 443.03 93.329
##
## Step: AIC=36.13
## age ~ escuela + Direccion + familia + Pstatus + Medu + Federal +
## guardian + traveltime + studytime + fallas + famsup + actividades +
## guarderia + higher + Internet + romantico + freetime + salir +
## Dalc + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - Medu 1 0.134 383.44 34.269
## - guarderia 1 0.433 383.74 34.577
## - Walc 1 0.457 383.76 34.602
## - Dalc 1 0.475 383.78 34.621
## - actividades 1 0.629 383.94 34.780
## - Federal 1 0.833 384.14 34.989
## - fallas 1 0.877 384.19 35.035
## - salud 1 1.117 384.43 35.282
## - Direccion 1 1.295 384.60 35.464
## - famsup 1 1.704 385.01 35.884
## - Pstatus 1 1.721 385.03 35.902
## <none> 383.31 36.132
## - freetime 1 2.125 385.43 36.315
## - studytime 1 2.401 385.71 36.599
## - Internet 1 2.642 385.95 36.845
## - romantico 1 3.244 386.55 37.461
## - familia 1 3.868 387.18 38.098
## - traveltime 1 3.951 387.26 38.182
## - salir 1 6.487 389.80 40.761
## - ausencia 1 10.399 393.71 44.705
## - higher 1 13.373 396.68 47.678
## - guardian 2 58.265 441.57 88.026
## - escuela 1 60.352 443.66 91.888
##
## Step: AIC=34.27
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian +
## traveltime + studytime + fallas + famsup + actividades +
## guarderia + higher + Internet + romantico + freetime + salir +
## Dalc + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - guarderia 1 0.397 383.84 32.678
## - Dalc 1 0.435 383.88 32.717
## - Walc 1 0.496 383.94 32.780
## - actividades 1 0.656 384.10 32.944
## - fallas 1 0.917 384.36 33.212
## - salud 1 1.083 384.52 33.383
## - Direccion 1 1.368 384.81 33.676
## - famsup 1 1.769 385.21 34.088
## - Pstatus 1 1.797 385.24 34.116
## - Federal 1 1.851 385.29 34.172
## <none> 383.44 34.269
## - freetime 1 2.191 385.63 34.520
## - studytime 1 2.347 385.79 34.680
## - Internet 1 2.807 386.25 35.151
## - romantico 1 3.214 386.66 35.566
## - familia 1 3.892 387.33 36.259
## - traveltime 1 3.910 387.35 36.277
## - salir 1 6.443 389.88 38.851
## - ausencia 1 10.270 393.71 42.710
## - higher 1 13.530 396.97 45.967
## - guardian 2 58.907 442.35 86.719
## - escuela 1 60.531 443.97 90.166
##
## Step: AIC=32.68
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian +
## traveltime + studytime + fallas + famsup + actividades +
## higher + Internet + romantico + freetime + salir + Dalc +
## Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - Dalc 1 0.424 384.26 31.113
## - Walc 1 0.440 384.28 31.130
## - actividades 1 0.688 384.53 31.385
## - fallas 1 0.925 384.76 31.629
## - salud 1 1.102 384.94 31.810
## - Direccion 1 1.305 385.14 32.019
## - Federal 1 1.661 385.50 32.383
## - Pstatus 1 1.689 385.53 32.412
## - famsup 1 1.753 385.59 32.478
## <none> 383.84 32.678
## - freetime 1 2.154 385.99 32.888
## - studytime 1 2.491 386.33 33.233
## - Internet 1 2.889 386.73 33.640
## - romantico 1 3.311 387.15 34.070
## - traveltime 1 3.807 387.64 34.576
## - familia 1 3.874 387.71 34.644
## - salir 1 6.545 390.38 37.357
## - ausencia 1 10.456 394.29 41.293
## - higher 1 13.460 397.30 44.292
## - guardian 2 58.999 442.84 85.155
## - escuela 1 60.197 444.04 88.222
##
## Step: AIC=31.11
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian +
## traveltime + studytime + fallas + famsup + actividades +
## higher + Internet + romantico + freetime + salir + Walc +
## salud + ausencia
##
## Df Sum of Sq RSS AIC
## - actividades 1 0.753 385.02 29.887
## - fallas 1 0.960 385.22 30.099
## - salud 1 1.072 385.33 30.214
## - Direccion 1 1.339 385.60 30.487
## - Walc 1 1.606 385.87 30.761
## - Pstatus 1 1.612 385.87 30.767
## - Federal 1 1.617 385.88 30.772
## - famsup 1 1.706 385.97 30.864
## - freetime 1 1.914 386.18 31.076
## <none> 384.26 31.113
## - studytime 1 2.465 386.73 31.639
## - Internet 1 2.779 387.04 31.960
## - romantico 1 3.321 387.58 32.512
## - traveltime 1 3.688 387.95 32.887
## - familia 1 3.812 388.07 33.012
## - salir 1 6.435 390.70 35.673
## - ausencia 1 10.594 394.86 39.856
## - higher 1 13.392 397.65 42.645
## - guardian 2 59.665 443.93 84.126
## - escuela 1 61.211 445.47 87.499
##
## Step: AIC=29.89
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian +
## traveltime + studytime + fallas + famsup + higher + Internet +
## romantico + freetime + salir + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - fallas 1 0.979 385.99 28.891
## - salud 1 1.103 386.12 29.017
## - Direccion 1 1.170 386.19 29.085
## - Pstatus 1 1.399 386.41 29.320
## - famsup 1 1.552 386.57 29.476
## - Walc 1 1.722 386.74 29.649
## - Federal 1 1.887 386.90 29.818
## <none> 385.02 29.887
## - freetime 1 2.198 387.21 30.136
## - studytime 1 2.290 387.31 30.229
## - Internet 1 2.845 387.86 30.795
## - romantico 1 3.205 388.22 31.161
## - familia 1 3.806 388.82 31.772
## - traveltime 1 3.810 388.83 31.776
## - salir 1 6.276 391.29 34.273
## - ausencia 1 10.586 395.60 38.601
## - higher 1 13.985 399.00 41.981
## - guardian 2 60.020 445.03 83.110
## - escuela 1 64.397 449.41 88.977
##
## Step: AIC=28.89
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian +
## traveltime + studytime + famsup + higher + Internet + romantico +
## freetime + salir + Walc + salud + ausencia
##
## Df Sum of Sq RSS AIC
## - salud 1 0.967 386.96 27.878
## - Pstatus 1 1.348 387.34 28.268
## - Direccion 1 1.360 387.35 28.279
## - famsup 1 1.489 387.48 28.411
## - Walc 1 1.805 387.80 28.734
## - studytime 1 1.928 387.92 28.859
## <none> 385.99 28.891
## - freetime 1 2.180 388.17 29.115
## - Federal 1 2.628 388.62 29.570
## - Internet 1 2.879 388.87 29.825
## - romantico 1 3.384 389.38 30.338
## - familia 1 3.589 389.58 30.547
## - traveltime 1 3.896 389.89 30.858
## - salir 1 6.968 392.96 33.958
## - ausencia 1 10.520 396.51 37.512
## - higher 1 16.820 402.81 43.738
## - escuela 1 64.201 450.20 87.665
## - guardian 2 70.791 456.79 91.405
##
## Step: AIC=27.88
## age ~ escuela + Direccion + familia + Pstatus + Federal + guardian +
## traveltime + studytime + famsup + higher + Internet + romantico +
## freetime + salir + Walc + ausencia
##
## Df Sum of Sq RSS AIC
## - Direccion 1 1.285 388.25 27.188
## - Pstatus 1 1.308 388.27 27.212
## - Walc 1 1.553 388.51 27.460
## - famsup 1 1.600 388.56 27.508
## <none> 386.96 27.878
## - studytime 1 2.093 389.05 28.009
## - freetime 1 2.367 389.33 28.288
## - Internet 1 2.599 389.56 28.523
## - Federal 1 2.658 389.62 28.583
## - romantico 1 3.169 390.13 29.100
## - familia 1 3.228 390.19 29.160
## - traveltime 1 3.841 390.80 29.780
## - salir 1 7.352 394.31 33.313
## - ausencia 1 10.737 397.70 36.689
## - higher 1 16.849 403.81 42.713
## - escuela 1 65.546 452.51 87.688
## - guardian 2 71.784 458.75 91.096
##
## Step: AIC=27.19
## age ~ escuela + familia + Pstatus + Federal + guardian + traveltime +
## studytime + famsup + higher + Internet + romantico + freetime +
## salir + Walc + ausencia
##
## Df Sum of Sq RSS AIC
## - Pstatus 1 1.459 389.71 26.670
## - famsup 1 1.538 389.78 26.750
## - Walc 1 1.934 390.18 27.151
## <none> 388.25 27.188
## - freetime 1 2.350 390.60 27.572
## - studytime 1 2.517 390.76 27.741
## - Federal 1 2.564 390.81 27.789
## - traveltime 1 2.946 391.19 28.174
## - romantico 1 3.094 391.34 28.324
## - familia 1 3.352 391.60 28.584
## - Internet 1 3.423 391.67 28.656
## - salir 1 6.724 394.97 31.970
## - ausencia 1 11.361 399.61 36.581
## - higher 1 17.125 405.37 42.238
## - guardian 2 70.853 459.10 89.401
## - escuela 1 73.222 461.47 93.434
##
## Step: AIC=26.67
## age ~ escuela + familia + Federal + guardian + traveltime + studytime +
## famsup + higher + Internet + romantico + freetime + salir +
## Walc + ausencia
##
## Df Sum of Sq RSS AIC
## - famsup 1 1.422 391.13 26.109
## <none> 389.71 26.670
## - Walc 1 1.987 391.69 26.679
## - freetime 1 2.273 391.98 26.967
## - studytime 1 2.610 392.32 27.307
## - traveltime 1 2.922 392.63 27.621
## - romantico 1 2.978 392.68 27.677
## - Federal 1 3.001 392.71 27.700
## - Internet 1 3.053 392.76 27.753
## - familia 1 3.442 393.15 28.143
## - salir 1 6.721 396.43 31.424
## - ausencia 1 10.577 400.28 35.248
## - higher 1 17.548 407.25 42.068
## - guardian 2 70.053 459.76 87.968
## - escuela 1 74.285 463.99 93.587
##
## Step: AIC=26.11
## age ~ escuela + familia + Federal + guardian + traveltime + studytime +
## higher + Internet + romantico + freetime + salir + Walc +
## ausencia
##
## Df Sum of Sq RSS AIC
## <none> 391.13 26.109
## - Walc 1 2.187 393.31 26.311
## - studytime 1 2.198 393.33 26.322
## - freetime 1 2.480 393.61 26.606
## - romantico 1 2.971 394.10 27.097
## - Internet 1 3.335 394.46 27.462
## - traveltime 1 3.339 394.47 27.466
## - familia 1 3.677 394.80 27.805
## - Federal 1 3.871 395.00 27.999
## - salir 1 6.772 397.90 30.889
## - ausencia 1 10.440 401.57 34.514
## - higher 1 18.113 409.24 41.991
## - guardian 2 69.652 460.78 86.844
## - escuela 1 79.221 470.35 96.962
##
## Call:
## lm(formula = age ~ escuela + familia + Federal + guardian + traveltime +
## studytime + higher + Internet + romantico + freetime + salir +
## Walc + ausencia, data = Maths)
##
## Coefficients:
## (Intercept) escuelaMS familia Federal guardianmother
## 16.84529 1.46838 0.11099 -0.09544 0.07162
## guardianother traveltime studytime higheryes Internetyes
## 1.64279 -0.13959 0.09508 -1.01941 -0.25481
## romanticoyes freetime salir Walc ausencia
## 0.19048 -0.08545 0.13620 0.06794 0.02146
mod2=lm(age~escuela+familia+Federal+guardian+traveltime+studytime+higher+Internet+romantico+freetime+salir+Walc+ausencia)
summary(mod2)
##
## Call:
## lm(formula = age ~ escuela + familia + Federal + guardian + traveltime +
## studytime + higher + Internet + romantico + freetime + salir +
## Walc + ausencia)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.0433 -0.7490 -0.0454 0.6272 3.7101
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.845285 0.453190 37.171 < 2e-16 ***
## escuelaMS 1.468383 0.167374 8.773 < 2e-16 ***
## familia 0.110995 0.058725 1.890 0.05951 .
## Federal -0.095444 0.049216 -1.939 0.05321 .
## guardianmother 0.071621 0.125808 0.569 0.56950
## guardianother 1.642791 0.217392 7.557 3.12e-13 ***
## traveltime -0.139587 0.077504 -1.801 0.07249 .
## studytime 0.095083 0.065074 1.461 0.14480
## higheryes -1.019412 0.243006 -4.195 3.40e-05 ***
## Internetyes -0.254807 0.141562 -1.800 0.07266 .
## romanticoyes 0.190482 0.112123 1.699 0.09016 .
## freetime -0.085445 0.055042 -1.552 0.12141
## salir 0.136199 0.053098 2.565 0.01070 *
## Walc 0.067944 0.046615 1.458 0.14579
## ausencia 0.021463 0.006739 3.185 0.00157 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.015 on 380 degrees of freedom
## Multiple R-squared: 0.3903, Adjusted R-squared: 0.3679
## F-statistic: 17.38 on 14 and 380 DF, p-value: < 2.2e-16
El nuevo modelo 2 es el resultado de la depuracion del modelo global el cual explica el 39% segun R-squared: 0.3903 y tiene encuenta que en promedio la edad de 16 años los alumnos empiezan a consumir alcohol y a desminuir su salud y inasistencia y el tiepo que le invierten a sus estudios.
4. Interpretar el coeficiente de determinación
coef(mod2)
## (Intercept) escuelaMS familia Federal guardianmother
## 16.84528539 1.46838286 0.11099497 -0.09544435 0.07162095
## guardianother traveltime studytime higheryes Internetyes
## 1.64279128 -0.13958723 0.09508330 -1.01941212 -0.25480730
## romanticoyes freetime salir Walc ausencia
## 0.19048178 -0.08544507 0.13619861 0.06794446 0.02146292
Se registra los coeficiente de determinacion a las variables del modelo dos ya que es el modelo depurado.hay que tener en cuenta que las variables escuelaMS, guardianother, higheryes deberan ser ajustadas debido a que se acercan a 1.