#Cargando librerias
library(alr4)
data(oldfaith)
head(oldfaith,3)
  Duration Interval
1      216       79
2      108       54
3      200       74
#help(oldfaith)
dim(oldfaith)
[1] 270   2

1 Regresion lineal simple

1.1 Diagrama de dispersion

plot(Duration ~ Interval, data = oldfaith)

1.2 Coeficientes de correlacion

cor(oldfaith$Interval, oldfaith$Duration, method = "pearson")
[1] 0.8960697
cor(oldfaith$Interval, oldfaith$Duration, method = "spearman")
[1] 0.7750216

1.3 Modelo ml stats (todos los datos)

oldfaith.m1 <- lm(Duration ~ Interval, data = oldfaith)
summary(oldfaith.m1)

Call:
lm(formula = Duration ~ Interval, data = oldfaith)

Residuals:
    Min      1Q  Median      3Q     Max 
-98.310 -22.086   1.861  20.725  71.910 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -112.9431     9.9428  -11.36   <2e-16 ***
Interval       4.5399     0.1374   33.05   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 30.42 on 268 degrees of freedom
Multiple R-squared:  0.8029,    Adjusted R-squared:  0.8022 
F-statistic:  1092 on 1 and 268 DF,  p-value: < 2.2e-16

1.4 Grafica del modelo sobre los datos

plot(Duration ~ Interval, data = oldfaith)
abline(oldfaith.m1, col ='red')

Interpretacion

Para no indicar causa efecto podemos interpretar el coeficiente de regresion como: Los incrementos en un minuto de la variable interval estan realacionado con un incremento de 4.5399 segundos en la variable duracion.

1.5 Valores estimados y residuales

#Estimados
fitted.m1 <- fitted(oldfaith.m1)
head(fitted.m1)
       1        2        3        4        5        6 
245.7094 132.2118 223.0099 168.5310 272.9488 136.7517 
#Residuales
residuales.m1 <- residuals(oldfaith.m1)
head(residuales.m1)
         1          2          3          4          5          6 
-29.709399 -24.211773 -23.009873 -31.531013  -0.948829  36.248322 

1.6 Intervalos de confianza para los coeficientes de regresion

confint(oldfaith.m1, level = 0.92)
                    4 %       96 %
(Intercept) -130.416157 -95.470043
Interval       4.298474   4.781337

1.7 Analisis de varianza (ANOVA)

como concepto general el modelo mas pequeño siempre es mejor

Hipotesis:

  • Ho Mo (modelo nulo) es mejor que nuestro modelo propuesto
  • H1 M1 (modelo propuesto) es mejor que nuestro modelo Mo Si p-value es < 0.05 se rechaza la hipotesis nula
anova(oldfaith.m1) 
Analysis of Variance Table

Response: Duration
           Df  Sum Sq Mean Sq F value    Pr(>F)    
Interval    1 1010295 1010295    1092 < 2.2e-16 ***
Residuals 268  247948     925                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

1.8 R cuadrado R^2 - coeficiente de determinación

summary(oldfaith.m1)$r.square
[1] 0.8029409
cor(oldfaith$Duration, oldfaith$Interval, method = "pearson")^2
[1] 0.8029409

Intrepretacion:

  • Aproximandamente el 80.29 de la variabilidad total observada en Y (Duration) es explicada por la varible predictora X (Interval)

1.9 Prediccion para un valor especifico de x

# el calor para Duration (Y) cuando Interval (X) =95
predict(oldfaith.m1, data.frame(Interval = 95))
       1 
318.3479 

1.10 Intevalo de confianza: Es para el valor promedio de Y

  • Cuando se menciona la palabra promedio se trata de un intervalo de confianza
# para un X = 95
predict(oldfaith.m1, data.frame(Interval = 95), level = 0.98, interval = 'confidence')
       fit      lwr      upr
1 318.3479 309.5284 327.1673

1.11 Intevalo de prediccion: Es directamente para un valor puntual de Y

# para un X = 95
predict(oldfaith.m1, data.frame(Interval = 95), level = 0.98, interval = 'prediction')
       fit     lwr      upr
1 318.3479 246.618 390.0778

1.12 Supuestos del modelo de regresion (analisis de residuales)

#analisis de residuales
par(mfrow = c(2, 2))
plot(oldfaith.m1)

Comentarios

  1. Residual vs Fitted (valores estimados:
  • Sirve para evaluar el supuesto de linealidad. Si no logro encontra algun patron a partir de este grafico se puede concluir que se cumple con el criterio de linealidad del modelo
  • Podemos observar en este grafico de correlacion que no un patron o tendencia identificable, de modo que podemos corroborar el supuesto delinealidad
  1. Normal Q-Q (normalidad):
  • Sirve para evaluar el supuesto de normalidad de los residuos
  • se observa una buena aproximación a la normalidad, podemos indicar que los residuos tienen una distribucion normal. No obstante, para ser mas rigurosos podemos recurrir a pruebas de normalidad, como la prueba Kolmogorov-Smirnov
  1. Scale - Location (homocedasticidad):
  • Sirve para evaluar el supuesto varianza constante.Si no logro encontra algun patron a partir de este grafico se puede concluir que se cumple con el criterio de homocedasticidad o varianza constante

-El grafico nos permite observar una apariencia de un mayor grosor de la nube de puntos en una dirección, lo cual no permite aceptar el supuesto de varianza constante de los residuos

  1. Residual vs Leverage (datos alejados):
  • Sirve para evaluar posibles observaciones influyentes -Se observalores valores influyentes: 7749, 6948
LS0tDQp0aXRsZTogIlJlc3VtZW4gZGUgcmVncmVzacOzbiBhcGxpY2FkYSIgIA0KZGF0ZTogIjIwMjMtMDUtMTAiDQphdXRob3I6ICJWaWN0b3IgQWxmcmVkbyBEaWF6IE9saXZvIg0Kb3V0cHV0Og0KICBodG1sX2RvY3VtZW50Og0KICAgIHRvYzogeWVzDQogICAgdG9jX2Zsb2F0Og0KICAgICAgY29sbGFwc2VkOiBubw0KICAgICAgc21vb3RoX3Njcm9sbDogbm8NCiAgICBudW1iZXJfc2VjdGlvbnM6IHllcw0KICAgIGFuY2hvcl9zZWN0aW9uczogeWVzDQogICAgY29kZV9mb2xkaW5nOiBoaWRlDQogICAgY29kZV9kb3dubG9hZDogeWVzDQogICAgdGhlbWU6IGpvdXJuYWwNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRSwgY29tbWVudCA9Jyd9DQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUsIG1lc3NhZ2UgPSBGQUxTRSwgY29tbWVudCA9ICcnKQ0Ka25pdHI6Om9wdHNfY2h1bmskc2V0KCkNCmBgYA0KDQpgYGB7cn0NCiNDYXJnYW5kbyBsaWJyZXJpYXMNCmxpYnJhcnkoYWxyNCkNCmRhdGEob2xkZmFpdGgpDQpoZWFkKG9sZGZhaXRoLDMpDQojaGVscChvbGRmYWl0aCkNCmRpbShvbGRmYWl0aCkNCmBgYA0KDQoNCiMgKipSZWdyZXNpb24gbGluZWFsIHNpbXBsZSoqDQoNCg0KIyMgRGlhZ3JhbWEgZGUgZGlzcGVyc2lvbg0KYGBge3J9DQpwbG90KER1cmF0aW9uIH4gSW50ZXJ2YWwsIGRhdGEgPSBvbGRmYWl0aCkNCmBgYA0KDQojIyBDb2VmaWNpZW50ZXMgZGUgY29ycmVsYWNpb24NCg0KYGBge3J9DQpjb3Iob2xkZmFpdGgkSW50ZXJ2YWwsIG9sZGZhaXRoJER1cmF0aW9uLCBtZXRob2QgPSAicGVhcnNvbiIpDQpjb3Iob2xkZmFpdGgkSW50ZXJ2YWwsIG9sZGZhaXRoJER1cmF0aW9uLCBtZXRob2QgPSAic3BlYXJtYW4iKQ0KYGBgDQoNCiMjIE1vZGVsbyBtbCBzdGF0cyAodG9kb3MgbG9zIGRhdG9zKQ0KDQpgYGB7cn0NCm9sZGZhaXRoLm0xIDwtIGxtKER1cmF0aW9uIH4gSW50ZXJ2YWwsIGRhdGEgPSBvbGRmYWl0aCkNCnN1bW1hcnkob2xkZmFpdGgubTEpDQpgYGANCg0KIyMgR3JhZmljYSBkZWwgbW9kZWxvIHNvYnJlIGxvcyBkYXRvcw0KDQpgYGB7cn0NCnBsb3QoRHVyYXRpb24gfiBJbnRlcnZhbCwgZGF0YSA9IG9sZGZhaXRoKQ0KYWJsaW5lKG9sZGZhaXRoLm0xLCBjb2wgPSdyZWQnKQ0KYGBgDQoNCg0KDQoqKkludGVycHJldGFjaW9uKioNCg0KUGFyYSBubyBpbmRpY2FyICoqY2F1c2EgZWZlY3RvKiogcG9kZW1vcyBpbnRlcnByZXRhciBlbCBjb2VmaWNpZW50ZSBkZSByZWdyZXNpb24gY29tbzogTG9zIGluY3JlbWVudG9zIGVuIHVuIG1pbnV0byBkZSBsYSB2YXJpYWJsZSBpbnRlcnZhbCBlc3RhbiByZWFsYWNpb25hZG8gY29uIHVuIGluY3JlbWVudG8gZGUgNC41Mzk5IHNlZ3VuZG9zIGVuIGxhIHZhcmlhYmxlIGR1cmFjaW9uLg0KDQoNCiMjIFZhbG9yZXMgZXN0aW1hZG9zIHkgcmVzaWR1YWxlcw0KDQpgYGB7cn0NCiNFc3RpbWFkb3MNCmZpdHRlZC5tMSA8LSBmaXR0ZWQob2xkZmFpdGgubTEpDQpoZWFkKGZpdHRlZC5tMSkNCg0KI1Jlc2lkdWFsZXMNCnJlc2lkdWFsZXMubTEgPC0gcmVzaWR1YWxzKG9sZGZhaXRoLm0xKQ0KaGVhZChyZXNpZHVhbGVzLm0xKQ0KYGBgDQoNCiMjIEludGVydmFsb3MgZGUgY29uZmlhbnphIHBhcmEgbG9zIGNvZWZpY2llbnRlcyBkZSByZWdyZXNpb24NCg0KYGBge3J9DQpjb25maW50KG9sZGZhaXRoLm0xLCBsZXZlbCA9IDAuOTIpDQpgYGANCg0KIyMgQW5hbGlzaXMgZGUgdmFyaWFuemEgKEFOT1ZBKSANCmNvbW8gY29uY2VwdG8gZ2VuZXJhbCBlbCBtb2RlbG8gbWFzIHBlcXVlw7FvIHNpZW1wcmUgZXMgbWVqb3INCg0KSGlwb3Rlc2lzOg0KDQotIEhvIE1vIChtb2RlbG8gbnVsbykgZXMgbWVqb3IgcXVlIG51ZXN0cm8gbW9kZWxvIHByb3B1ZXN0bw0KLSBIMSBNMSAobW9kZWxvIHByb3B1ZXN0bykgZXMgbWVqb3IgcXVlIG51ZXN0cm8gbW9kZWxvIE1vDQoqKlNpIHAtdmFsdWUgZXMgPCAwLjA1IHNlIHJlY2hhemEgbGEgaGlwb3Rlc2lzIG51bGEqKg0KDQpgYGB7cn0NCmFub3ZhKG9sZGZhaXRoLm0xKSANCmBgYA0KDQoNCiMjIFIgY3VhZHJhZG8gUl4yIC0gY29lZmljaWVudGUgZGUgZGV0ZXJtaW5hY2nDs24gDQoNCmBgYHtyfQ0Kc3VtbWFyeShvbGRmYWl0aC5tMSkkci5zcXVhcmUNCmNvcihvbGRmYWl0aCREdXJhdGlvbiwgb2xkZmFpdGgkSW50ZXJ2YWwsIG1ldGhvZCA9ICJwZWFyc29uIileMg0KYGBgDQoNCioqSW50cmVwcmV0YWNpb246KioNCg0KLSBBcHJveGltYW5kYW1lbnRlIGVsICoqODAuMjkqKiBkZSBsYSB2YXJpYWJpbGlkYWQgdG90YWwgb2JzZXJ2YWRhIGVuIFkgKER1cmF0aW9uKSBlcyBleHBsaWNhZGEgcG9yIGxhIHZhcmlibGUgcHJlZGljdG9yYSBYIChJbnRlcnZhbCkNCg0KDQojIyBQcmVkaWNjaW9uIHBhcmEgdW4gdmFsb3IgZXNwZWNpZmljbyBkZSB4DQoNCmBgYHtyfQ0KIyBlbCBjYWxvciBwYXJhIER1cmF0aW9uIChZKSBjdWFuZG8gSW50ZXJ2YWwgKFgpID05NQ0KcHJlZGljdChvbGRmYWl0aC5tMSwgZGF0YS5mcmFtZShJbnRlcnZhbCA9IDk1KSkNCmBgYA0KDQoNCg0KDQojIyBJbnRldmFsbyBkZSBjb25maWFuemE6IEVzIHBhcmEgZWwgIHZhbG9yICoqcHJvbWVkaW8qKiBkZSBZIA0KLSBDdWFuZG8gc2UgbWVuY2lvbmEgbGEgcGFsYWJyYSAqKnByb21lZGlvKiogc2UgdHJhdGEgZGUgdW4gaW50ZXJ2YWxvIGRlIGNvbmZpYW56YQ0KDQpgYGB7cn0NCiMgcGFyYSB1biBYID0gOTUNCnByZWRpY3Qob2xkZmFpdGgubTEsIGRhdGEuZnJhbWUoSW50ZXJ2YWwgPSA5NSksIGxldmVsID0gMC45OCwgaW50ZXJ2YWwgPSAnY29uZmlkZW5jZScpDQpgYGANCg0KDQoNCiMjIEludGV2YWxvIGRlIHByZWRpY2Npb246IEVzIGRpcmVjdGFtZW50ZSBwYXJhIHVuIHZhbG9yIHB1bnR1YWwgZGUgWQ0KDQpgYGB7cn0NCiMgcGFyYSB1biBYID0gOTUNCnByZWRpY3Qob2xkZmFpdGgubTEsIGRhdGEuZnJhbWUoSW50ZXJ2YWwgPSA5NSksIGxldmVsID0gMC45OCwgaW50ZXJ2YWwgPSAncHJlZGljdGlvbicpDQpgYGANCg0KDQojIyBTdXB1ZXN0b3MgZGVsIG1vZGVsbyBkZSByZWdyZXNpb24gKGFuYWxpc2lzIGRlIHJlc2lkdWFsZXMpICAjDQoNCg0KYGBge3J9DQojYW5hbGlzaXMgZGUgcmVzaWR1YWxlcw0KcGFyKG1mcm93ID0gYygyLCAyKSkNCnBsb3Qob2xkZmFpdGgubTEpDQpgYGANCioqQ29tZW50YXJpb3MqKg0KDQoxKSBSZXNpZHVhbCB2cyBGaXR0ZWQgKHZhbG9yZXMgZXN0aW1hZG9zOg0KDQotIFNpcnZlIHBhcmEgZXZhbHVhciBlbCBzdXB1ZXN0byBkZSBsaW5lYWxpZGFkLiBTaSBubyBsb2dybyBlbmNvbnRyYSBhbGd1biBwYXRyb24gYSBwYXJ0aXIgZGUgZXN0ZSBncmFmaWNvIHNlIHB1ZWRlIGNvbmNsdWlyIHF1ZSBzZSBjdW1wbGUgY29uIGVsIGNyaXRlcmlvIGRlIGxpbmVhbGlkYWQgZGVsIG1vZGVsbw0KLSBQb2RlbW9zIG9ic2VydmFyIGVuIGVzdGUgZ3JhZmljbyBkZSBjb3JyZWxhY2lvbiBxdWUgKipubyoqIHVuIHBhdHJvbiBvIHRlbmRlbmNpYSBpZGVudGlmaWNhYmxlLCBkZSBtb2RvIHF1ZSAgcG9kZW1vcyBjb3Jyb2JvcmFyIGVsIHN1cHVlc3RvIGRlbGluZWFsaWRhZA0KDQoyKSBOb3JtYWwgUS1RIChub3JtYWxpZGFkKToNCg0KLSBTaXJ2ZSBwYXJhIGV2YWx1YXIgZWwgc3VwdWVzdG8gZGUgbm9ybWFsaWRhZCBkZSBsb3MgcmVzaWR1b3MNCi0gc2Ugb2JzZXJ2YSB1bmEgYnVlbmEgYXByb3hpbWFjacOzbiBhIGxhIG5vcm1hbGlkYWQsIHBvZGVtb3MgaW5kaWNhciBxdWUgbG9zIHJlc2lkdW9zIHRpZW5lbiB1bmEgZGlzdHJpYnVjaW9uIG5vcm1hbC4gTm8gb2JzdGFudGUsIHBhcmEgc2VyIG1hcyByaWd1cm9zb3MgcG9kZW1vcyByZWN1cnJpciBhIHBydWViYXMgZGUgbm9ybWFsaWRhZCwgY29tbyBsYSBwcnVlYmEgS29sbW9nb3Jvdi1TbWlybm92DQoNCg0KMykgU2NhbGUgLSBMb2NhdGlvbiAoaG9tb2NlZGFzdGljaWRhZCk6DQoNCi0gU2lydmUgcGFyYSBldmFsdWFyIGVsIHN1cHVlc3RvIHZhcmlhbnphIGNvbnN0YW50ZS5TaSBubyBsb2dybyBlbmNvbnRyYSBhbGd1biBwYXRyb24gYSBwYXJ0aXIgZGUgZXN0ZSBncmFmaWNvIHNlIHB1ZWRlIGNvbmNsdWlyIHF1ZSBzZSBjdW1wbGUgY29uIGVsIGNyaXRlcmlvIGRlIGhvbW9jZWRhc3RpY2lkYWQgbyB2YXJpYW56YSBjb25zdGFudGUNCg0KLUVsIGdyYWZpY28gbm9zIHBlcm1pdGUgb2JzZXJ2YXIgdW5hIGFwYXJpZW5jaWEgZGUgdW4gbWF5b3IgZ3Jvc29yIGRlIGxhIG51YmUgZGUgcHVudG9zIGVuIHVuYSBkaXJlY2Npw7NuLCBsbyBjdWFsIG5vIHBlcm1pdGUgYWNlcHRhciBlbCBzdXB1ZXN0byBkZSB2YXJpYW56YSBjb25zdGFudGUgZGUgbG9zIHJlc2lkdW9zDQoNCjQpIFJlc2lkdWFsIHZzIExldmVyYWdlIChkYXRvcyBhbGVqYWRvcyk6DQoNCi0gU2lydmUgcGFyYSBldmFsdWFyIHBvc2libGVzIG9ic2VydmFjaW9uZXMgaW5mbHV5ZW50ZXMNCi1TZSBvYnNlcnZhbG9yZXMgdmFsb3JlcyBpbmZsdXllbnRlczogNzc0OSwgNjk0OA0KDQoNCg0KDQo=