Regresión lineal simple

Importar

Datos

grasas <- read.table("http://verso.mat.uam.es/~joser.berrendero/datos/EdadPesoGrasas.txt", header= TRUE)
names(grasas)
## [1] "peso"   "edad"   "grasas"
  • Gráfico de correlación, gráfico de pares
head(grasas)
##   peso edad grasas
## 1   84   46    354
## 2   73   20    190
## 3   65   52    405
## 4   70   30    263
## 5   76   57    451
## 6   69   25    302
pairs(grasas)

Modelar

Grado de correlación lineal

  • Matriz de coeficientes de correlación:
cor(grasas)
##             peso      edad    grasas
## peso   1.0000000 0.2400133 0.2652935
## edad   0.2400133 1.0000000 0.8373534
## grasas 0.2652935 0.8373534 1.0000000

Cálculo y representación de la recta de mínimos cuadrados

regresion <- lm(grasas ~ edad, data=grasas)
summary (regresion)
## 
## Call:
## lm(formula = grasas ~ edad, data = grasas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -63.478 -26.816  -3.854  28.315  90.881 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 102.5751    29.6376   3.461  0.00212 ** 
## edad          5.3207     0.7243   7.346 1.79e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 43.46 on 23 degrees of freedom
## Multiple R-squared:  0.7012, Adjusted R-squared:  0.6882 
## F-statistic: 53.96 on 1 and 23 DF,  p-value: 1.794e-07
  • Entonces, la recta de mínimos cuadrados, sería la siguiente:

\[ y = 102.5751 + 5.3207 x \] ### Representación gráfica de la recta

plot(grasas$edad, grasas$grasas,xlab = "Edad", ylab = "Grasas")
abline(regresion)

### Modelación de valores

nuevas.edades <- data.frame(edad = seq (30, 50))
predict(regresion, nuevas.edades)
##        1        2        3        4        5        6        7        8 
## 262.1954 267.5161 272.8368 278.1575 283.4781 288.7988 294.1195 299.4402 
##        9       10       11       12       13       14       15       16 
## 304.7608 310.0815 315.4022 320.7229 326.0435 331.3642 336.6849 342.0056 
##       17       18       19       20       21 
## 347.3263 352.6469 357.9676 363.2883 368.6090

Redacción personal

En esta actividad se puede notar que a diferencia de lo que sucede en la práctica anterior y de lo que uno pudiera esperar, existe una relación directa entre las grasas que poseen ciertos individuos con la edad que tienen, siendo directamente proporcional la relación. Esto significa que mientras más grande sea la edad, mayores serán las cantidades de grasas.

Sin embargo, el que se relacionen ambas variables no implica que una causa a otra, o que sea el único factor determinante. Esta relación puede deberse a situaciones comunes de la tercera edad, como el sedentarismo o la falta de actividades físicas. De igual forma, no porque exista esa tendencia, significa que necesariamente a mayor edad se tengan mayores cantidades de grasa, ya que como en todos los ámbitos, existen excepciones.