U1A3

Angélica Payán Serna

08/02/2021


Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación.

Importar

setwd("~/Estadistica")
library(prettydoc)
library(readr)
library(DT)
datos <- read_csv("datos.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   ejercicio = col_double(),
##   cuarentena = col_double()
## )

Visualizar datos

Tabla

datatable(datos)

Gráfica

Matriz de diagramas de dispersión

pairs(datos)

Inferencias

Cálculo y representación de la recta de mínimos cuadrados

regresion <- lm (cuarentena ~ ejercicio, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = cuarentena ~ ejercicio, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -26.519 -15.066  -4.294   4.821  75.659 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -38.1075    15.4182  -2.472 0.016900 *  
## ejercicio     1.6362     0.4083   4.007 0.000204 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21.94 on 50 degrees of freedom
## Multiple R-squared:  0.2431, Adjusted R-squared:  0.2279 
## F-statistic: 16.06 on 1 and 50 DF,  p-value: 0.0002044
  • Ecuación de la recta de mínimos cuadrados

\[ y = -38.1075 + 1.6362x \] Este cálculo nos demuestra que la intersección en Y es en -38.1075 y la pendiente es de 1.6362

  • Graficación de la recta
plot(datos$ejercicio, datos$cuarentena, xlab = "Ejercicio" , ylab = "Cuarentena")
abline(regresion)

Esta gráfica nos muestra la regresión lineal, y también podemos observar que los datos estan muy dispersos

Modelación

modelar (predecir) datos usando la recta de mínimos cuadrados

nuevos.ejercicio <- data.frame(ejercicio=seq(0,20))
predict(regresion,nuevos.ejercicio)
##          1          2          3          4          5          6          7 
## -38.107538 -36.471387 -34.835235 -33.199083 -31.562932 -29.926780 -28.290628 
##          8          9         10         11         12         13         14 
## -26.654477 -25.018325 -23.382173 -21.746022 -20.109870 -18.473718 -16.837567 
##         15         16         17         18         19         20         21 
## -15.201415 -13.565263 -11.929111 -10.292960  -8.656808  -7.020656  -5.384505

Este es el ajuste de la recta de mínimos cuadrados, el cual nos muestra 20 datos nuevos con la función de predecir el nuevo modelo

cor(datos)
##            ejercicio cuarentena
## ejercicio  1.0000000  0.4930379
## cuarentena 0.4930379  1.0000000

En base al diagrama de dispersión podemos deducir que el ejercicio y la cuarentena no tienen mucha correlación (0.49), solamente en algunas partes que probablemente fue al inicio de la cuarentena, que fue cuando las personas querían mantenerse o empezar una vida activa haciendo ejercicio en casa.