U1A7

Miguel Sanez

21/9/2020

Regresión lineal simple

Importar

Datos

grasas <-read.table("http://verso.mat.uam.es/~joser.berrendero/datos/EdadPesoGrasas.txt",header = TRUE)
names(grasas)
## [1] "peso"   "edad"   "grasas"

Visualizar

head(grasas)
##   peso edad grasas
## 1   84   46    354
## 2   73   20    190
## 3   65   52    405
## 4   70   30    263
## 5   76   57    451
## 6   69   25    302

Análisis de correlación

*Matriz de diagramas de dipersión

pairs(grasas)

A continuación se hará una cuantificación del grao de relación lineal, por medio de la matriz de coeficientes de correlación.

cor(grasas)
##             peso      edad    grasas
## peso   1.0000000 0.2400133 0.2652935
## edad   0.2400133 1.0000000 0.8373534
## grasas 0.2652935 0.8373534 1.0000000

Con esto observamos que medida que aumenta la edad de una persona, aumenta el contenido de grasas en su cuerpo con un índice de relación de 83% Esto explicado con un coeficiente de correlación de: 0.8373534

Recta de mínimos cuadrados

regresion <- lm(grasas ~ edad, data= grasas)
summary(regresion)
## 
## Call:
## lm(formula = grasas ~ edad, data = grasas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -63.478 -26.816  -3.854  28.315  90.881 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 102.5751    29.6376   3.461  0.00212 ** 
## edad          5.3207     0.7243   7.346 1.79e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 43.46 on 23 degrees of freedom
## Multiple R-squared:  0.7012, Adjusted R-squared:  0.6882 
## F-statistic: 53.96 on 1 and 23 DF,  p-value: 1.794e-07

Con base a lo estimado en el análisis de regresión lineal, obtenemos la ecuación de la recta de mínimos cuadrados

\[y = 102.5751 + 5.3207x \]

Gráfica de la recta de mínimos cuadrados

plot(grasas$edad, grasas$grasas, xlab="Edad", ylab="Grasas")
abline(regresion)

Modelación (cálculo) de predicciones

nuevas.edades <- data.frame(edad=seq(30,50))
predict(regresion,nuevas.edades)
##        1        2        3        4        5        6        7        8 
## 262.1954 267.5161 272.8368 278.1575 283.4781 288.7988 294.1195 299.4402 
##        9       10       11       12       13       14       15       16 
## 304.7608 310.0815 315.4022 320.7229 326.0435 331.3642 336.6849 342.0056 
##       17       18       19       20       21 
## 347.3263 352.6469 357.9676 363.2883 368.6090

Intervalo de confianza

confint(regresion)
##                 2.5 %     97.5 %
## (Intercept) 41.265155 163.885130
## edad         3.822367   6.818986

Conclusión

Gracias a las fórmulas utilizadas, se puede observar cómo la dependencia de las variables de peso y edad influye en la obtención de las grasas, así mismo, se puede ver que estas variables nos indican que si las grasas con altas puede ser que esté con alguna enfermadad. Estos métodos nos ayudan a evaluar todos los datos para sacar una conclusión y así ver su dependencia.