setwd("~/Estadistica")
library(prettydoc)
library(readr)
library(DT)
datos <- read_csv("datos.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## ejercicio = col_double(),
## cuarentena = col_double()
## )
datatable(datos)Matriz de diagramas de dispersión
pairs(datos)regresion <- lm (cuarentena ~ ejercicio, data=datos)
summary(regresion)##
## Call:
## lm(formula = cuarentena ~ ejercicio, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -26.519 -15.066 -4.294 4.821 75.659
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -38.1075 15.4182 -2.472 0.016900 *
## ejercicio 1.6362 0.4083 4.007 0.000204 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21.94 on 50 degrees of freedom
## Multiple R-squared: 0.2431, Adjusted R-squared: 0.2279
## F-statistic: 16.06 on 1 and 50 DF, p-value: 0.0002044
\[ y = -38.1075 + 1.6362x \] Este cálculo nos demuestra que la intersección en Y es en -38.1075 y la pendiente es de 1.6362
plot(datos$ejercicio, datos$cuarentena, xlab = "Ejercicio" , ylab = "Cuarentena")
abline(regresion) Esta gráfica nos muestra la regresión lineal, y también podemos observar que los datos estan muy dispersos
modelar (predecir) datos usando la recta de mínimos cuadrados
nuevos.ejercicio <- data.frame(ejercicio=seq(0,20))
predict(regresion,nuevos.ejercicio)## 1 2 3 4 5 6 7
## -38.107538 -36.471387 -34.835235 -33.199083 -31.562932 -29.926780 -28.290628
## 8 9 10 11 12 13 14
## -26.654477 -25.018325 -23.382173 -21.746022 -20.109870 -18.473718 -16.837567
## 15 16 17 18 19 20 21
## -15.201415 -13.565263 -11.929111 -10.292960 -8.656808 -7.020656 -5.384505
Este es el ajuste de la recta de mínimos cuadrados, el cual nos muestra 20 datos nuevos con la función de predecir el nuevo modelo
cor(datos)## ejercicio cuarentena
## ejercicio 1.0000000 0.4930379
## cuarentena 0.4930379 1.0000000
En base al diagrama de dispersión podemos deducir que el ejercicio y la cuarentena no tienen mucha correlación (0.49), solamente en algunas partes que probablemente fue al inicio de la cuarentena, que fue cuando las personas querían mantenerse o empezar una vida activa haciendo ejercicio en casa.