###Regresion Lineal Simple

Objetivo

Regresión lineal simple con los datos de la bd “woman”

Descripción

Realizar predicciones elementales dado el la altura de una mujer como variable independiente y el peso como variable dependiente.

Cargar librerias

datos <- women

Librerias

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(lubridate)
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(knitr)
library(ggplot2)

Explorar datos

str(datos)
## 'data.frame':    15 obs. of  2 variables:
##  $ height: num  58 59 60 61 62 63 64 65 66 67 ...
##  $ weight: num  115 117 120 123 126 129 132 135 139 142 ...
summary(datos)
##      height         weight     
##  Min.   :58.0   Min.   :115.0  
##  1st Qu.:61.5   1st Qu.:124.5  
##  Median :65.0   Median :135.0  
##  Mean   :65.0   Mean   :136.7  
##  3rd Qu.:68.5   3rd Qu.:148.0  
##  Max.   :72.0   Max.   :164.0

Grafica de dispersion

ggplot(datos, aes(x = height, y = weight)) +
    geom_point()

#Correlacion de Pearson

-0.90 = Correlación negativa muy fuerte. −0.75 = Correlación negativa considerable. −0.50 = Correlación negativa media. −0.25 = Correlación negativa débil. −0.10 = Correlación negativa muy débil. 0.00 = No existe correlación alguna entre las variables. +0.10 = Correlación positiva muy débil. +0.25 = Correlación positiva débil. +0.50 = Correlación positiva media. +0.75 = Correlación positiva considerable. +0.90 = Correlación positiva muy fuerte. +1.00 = Correlación positiva perfecta (“A mayor X, mayor Y” o “a menor X, menor Y”, de manera proporcional. Cada vez que X aumenta, Y aumenta siempre una cantidad constante).

Determinar coeficiente de correlacion

CR <- cor(datos$height, datos$weight)
CR
## [1] 0.9954948

##Modelo de regresion lineal simple

y = a + b(x)

modelo <- lm(data = datos, formula = weight ~ height)

summary(modelo)
## 
## Call:
## lm(formula = weight ~ height, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7333 -1.1333 -0.3833  0.7417  3.1167 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -87.51667    5.93694  -14.74 1.71e-09 ***
## height        3.45000    0.09114   37.85 1.09e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.525 on 13 degrees of freedom
## Multiple R-squared:  0.991,  Adjusted R-squared:  0.9903 
## F-statistic:  1433 on 1 and 13 DF,  p-value: 1.091e-14
a = modelo$coefficients[1]
b = modelo$coefficients[2]
a
## (Intercept) 
##   -87.51667
b
## height 
##   3.45

##Graficando linea de tendencia

ggplot(data = datos, mapping = aes(x = height, y = weight)) +
  geom_point(color = "firebrick", size = 2) +
  labs(title  =  'weight ~ height', x  =  'Altura') +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))
## `geom_smooth()` using formula 'y ~ x'

##Peso de una persona en funcion a la altura

x = c(64,70,76,66)

y = a + b *x
y
## [1] 133.2833 153.9833 174.6833 140.1833
prediccion <- predict(modelo, newdata = data.frame(height = x))
prediccion
##        1        2        3        4 
## 133.2833 153.9833 174.6833 140.1833

###Interpretacion

Basandonos en la formula de regresion lineal se puede observar lo siguiente:

Principalmente tenemos una muestra de 15 mujeres en donde incluye su peso y su estatura.

Primero se comienza haciendo la correlacion entre el peso y la edad, que da como resultado +0.99 que segun Pearson es una correlacion positiva muy buena para continuar con nuestro analisis.

Se aplica la formula de regresion lineal con la funcion del modelo.

En donde a se asigna como weight y b se asigna como height.

A continuacion se saca la tendencia de el peso sobre la altura.

Se genera la variable y como resultado del modelo lineal.

Nos da como resultado que: Si una persona pesa 64 debera medir aprox 133. Si el peso es 70 debe medir 153. Si el peso es 76 debe medir 174. Si el peso es 66 debe medir 140.

Son las aproximaciones por medio del modelo de regresion lineal simple segun la formula y segun los valores.