U1A9

Marijose González del Real

22/Sep/2020

Análisis acerca de la altura en cm y la edad

Regresión lineal simple

Altura y Edad ## Importar

Importar paquetes

library(pacman)
p_load("readr")

Importar datos

Datos obtenidos de https://datahub.io/JohnSnowLabs/national-health-and-nutrition-examination-survey

datos <- read.csv("altura.csv")

Transformar

edad <- as.numeric(datos$Age)
altura <- as.numeric(datos$H)
ah <- data.frame(edad, altura)

Visualizar

  • Gráfico de correlación, gráfico de pares
names(ah)
## [1] "edad"   "altura"
pairs(ah)

Modelar

Grado de correlación lineal

  • Matriz de coeficientes de correlación:
cor(ah)
##              edad     altura
## edad   1.00000000 0.08616651
## altura 0.08616651 1.00000000

Cálculo y representación de la recta de mínimos cuadrados

regresion <- lm(altura ~ edad, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = altura ~ edad, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -27.5920  -7.6019  -0.5987   7.8579  22.6112 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 165.82173    2.15359  76.998   <2e-16 ***
## edad          0.07668    0.06626   1.157    0.249    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.08 on 179 degrees of freedom
## Multiple R-squared:  0.007425,   Adjusted R-squared:  0.00188 
## F-statistic: 1.339 on 1 and 179 DF,  p-value: 0.2488
  • Entonces, la recta de mínimos cuadrados, sería la siguiente:

\[ y = 165.82173 + 0.07668 x\]

Representación gráfica de la recta

plot(ah$edad, ah$altura, xlab = "Edad en años", ylab = "Altura en cm")
abline(regresion)

Conclusiones

En este caso se tendría la hipótesis de que entre más vieja es una persona, mayor será su altura. Sin embargo, es muy poca la correlación en este caso aunque sea positiva, ya que pueden influir muchos factores, como la genética. También se sabe que cuando se llega a la vejéz, se tiende a disminuir la altura.