Regresión lineal simple

Importar

Datos

grasas = read.table("http://verso.mat.uam.es/~joser.berrendero/datos/EdadPesoGrasas.txt",header = TRUE)
names(grasas)
## [1] "peso"   "edad"   "grasas"

###Visualisar

head(grasas)
##   peso edad grasas
## 1   84   46    354
## 2   73   20    190
## 3   65   52    405
## 4   70   30    263
## 5   76   57    451
## 6   69   25    302

Análisis de correlación

*Matriz de diagramas de dispersión

pairs(grasas)

A continuación se hará una cuantificación del grado de relacion lineal por medio de la matriz de coheficientes de correlacion

cor(grasas)
##             peso      edad    grasas
## peso   1.0000000 0.2400133 0.2652935
## edad   0.2400133 1.0000000 0.8373534
## grasas 0.2652935 0.8373534 1.0000000

Con esto observamos que a medida que aumenta la edad de una persona, aumenta el contenido de grasas en su cuerpo con un indice de relación de 83% Esto explicado con un coheficiente de correlación de: 0.8373534

Recta de mínimos cuadrados

regresion = lm(grasas ~ edad, data=grasas)
summary(grasas)
##       peso            edad           grasas     
##  Min.   :27.00   Min.   :20.00   Min.   :181.0  
##  1st Qu.:63.00   1st Qu.:30.00   1st Qu.:254.0  
##  Median :69.00   Median :37.00   Median :303.0  
##  Mean   :68.68   Mean   :39.12   Mean   :310.7  
##  3rd Qu.:76.00   3rd Qu.:50.00   3rd Qu.:374.0  
##  Max.   :89.00   Max.   :60.00   Max.   :451.0
summary(regresion)
## 
## Call:
## lm(formula = grasas ~ edad, data = grasas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -63.478 -26.816  -3.854  28.315  90.881 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 102.5751    29.6376   3.461  0.00212 ** 
## edad          5.3207     0.7243   7.346 1.79e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 43.46 on 23 degrees of freedom
## Multiple R-squared:  0.7012, Adjusted R-squared:  0.6882 
## F-statistic: 53.96 on 1 and 23 DF,  p-value: 1.794e-07

Con base a lo estimado en el analisis de regresion lineal, obtenemos la ecuación de la recta de mínimos cuadrados \[y= 102.5751 + 5.3207x \] ### Gráfica de la recta de mínimos cuadrados

plot(grasas$edad, grasas$grasas, xlab="Edad", ylab="Grasas")
abline(regresion)

Modelacion (calculo) de predicciones)

nuevas.edades = data.frame(edad=seq(30,50))
predict(regresion,nuevas.edades)
##        1        2        3        4        5        6        7        8 
## 262.1954 267.5161 272.8368 278.1575 283.4781 288.7988 294.1195 299.4402 
##        9       10       11       12       13       14       15       16 
## 304.7608 310.0815 315.4022 320.7229 326.0435 331.3642 336.6849 342.0056 
##       17       18       19       20       21 
## 347.3263 352.6469 357.9676 363.2883 368.6090

Intervalo de confianza

confint(regresion)
##                 2.5 %     97.5 %
## (Intercept) 41.265155 163.885130
## edad         3.822367   6.818986