Regresion Lineal simple, recta de mínimos cuadrados, ajuste y modelación
Análisis de la regresion lineal en la correlacion mostrada entre dos eventos
Importar
setwd("~/Reynaldo Rstudio")
library(prettydoc)
library(readr)
library(DT)
datos <- read.csv("Correlacion.csv")Visualizar datos
Gráfico de tendencia
Tabla
datatable(datos)Gráfica
pairs(datos)Matriz de diagramas de dispersion.
Inferencia
Cálculo y representación de la recta de mínimos cuadrados
regresion <- lm(tamales ~ X2.de.febrero, data = datos)
summary(regresion)##
## Call:
## lm(formula = tamales ~ X2.de.febrero, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -17.966 -3.212 -1.212 1.788 26.788
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.46239 0.36902 22.93 <2e-16 ***
## X2.de.febrero 1.75014 0.07859 22.27 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.512 on 259 degrees of freedom
## Multiple R-squared: 0.6569, Adjusted R-squared: 0.6556
## F-statistic: 496 on 1 and 259 DF, p-value: < 2.2e-16
Ecuación de la recta de mínimos cuadrados \[ y = +8.46239 + 1.75014x \] Con esta ecuación encontramos a la intersección en Y con valor de 8.4623 y pendiente de 1.7501 para la correlación en este ejercicio.
Graficación de la recta
plot(datos$tamales, datos$X2.de.febrero, xlab = "Tamales" , ylab = "2 de Febrero")
abline(regresion)En esta grafica podemos identificar la regresion lineal presente en los datos, los cuales se encuentran muy alejados a esta misma.
cor(datos)## tamales X2.de.febrero
## tamales 1.0000000 0.8105164
## X2.de.febrero 0.8105164 1.0000000
Matriz de coeficientes de correlacion
Ahora con una gráfica y matriz de coeficiente de correlación encontramos que existen coincidencias de alrededor de 81% permitiendonos decir que existe una correlación entre ambos eventos.
Modelación
Modelar (Predecir) datos usando la recta de minimos cuadrados.
nuevo.2febrero <- data.frame(X2.de.febrero=seq(0, 20))
predict(regresion,nuevo.2febrero)## 1 2 3 4 5 6 7 8
## 8.462391 10.212532 11.962673 13.712815 15.462956 17.213098 18.963239 20.713380
## 9 10 11 12 13 14 15 16
## 22.463522 24.213663 25.963804 27.713946 29.464087 31.214228 32.964370 34.714511
## 17 18 19 20 21
## 36.464652 38.214794 39.964935 41.715077 43.465218
Con este ajuste de la recta de mínimos cuadrados, se muestran 20 datos nuevos con la función de predecir un nuevo modelo.