Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación.
Se presenta la hipotesis de que si la busqueda de “calaveritas” y “dia de muertos” pueden tender a tener indices de busquedas parecidos ya que las 2 son cosas de interes en una misma temporada del año.
Importar
setwd("~/R Scripts")
library(prettydoc)
library(readr)
library(DT)
datos <- read_csv("datos2.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## dia_de_muertos = col_double(),
## calaveritas = col_double()
## )
Visualizar datos
Tabla
datatable(datos)Gráfica
Matriz de diagramas de dispersión
pairs(datos)Inferencias
regresion <- lm (dia_de_muertos ~ calaveritas, data=datos)
summary(regresion)##
## Call:
## lm(formula = dia_de_muertos ~ calaveritas, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.4749 -2.2332 -1.7332 -0.2098 21.3685
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.20976 0.79872 1.515 0.136
## calaveritas 2.02343 0.09837 20.569 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.471 on 50 degrees of freedom
## (2 observations deleted due to missingness)
## Multiple R-squared: 0.8943, Adjusted R-squared: 0.8922
## F-statistic: 423.1 on 1 and 50 DF, p-value: < 2.2e-16
- Ecuación de la recta de mínimos cuadrados
\[ y = 0.263802 + 0.184868x \]
- Graficación de la recta, Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):
plot (datos$dia_de_muertos, datos$calaveritas, xlab = "dia de muertos", ylab = "calaveritas")
abline(regresion)cor(datos)## dia_de_muertos calaveritas
## dia_de_muertos 1 NA
## calaveritas NA 1
Matriz de coeficientes de correlación
Modelación
modelar (predecir) datos usando la recta de mínimos cuadrados
nuevos.calaveritas <- data.frame(calaveritas=seq(0,52))
predict(regresion,nuevos.calaveritas)## 1 2 3 4 5 6 7
## 1.209759 3.233187 5.256616 7.280044 9.303472 11.326900 13.350328
## 8 9 10 11 12 13 14
## 15.373756 17.397185 19.420613 21.444041 23.467469 25.490897 27.514326
## 15 16 17 18 19 20 21
## 29.537754 31.561182 33.584610 35.608038 37.631466 39.654895 41.678323
## 22 23 24 25 26 27 28
## 43.701751 45.725179 47.748607 49.772035 51.795464 53.818892 55.842320
## 29 30 31 32 33 34 35
## 57.865748 59.889176 61.912604 63.936033 65.959461 67.982889 70.006317
## 36 37 38 39 40 41 42
## 72.029745 74.053173 76.076602 78.100030 80.123458 82.146886 84.170314
## 43 44 45 46 47 48 49
## 86.193743 88.217171 90.240599 92.264027 94.287455 96.310883 98.334312
## 50 51 52 53
## 100.357740 102.381168 104.404596 106.428024
Conclusión
Por el comportamiento en la gráficas se puede notar que los tienden a tener un índice de buquedas que se comporta de manera parecida sin embargo el interes es menor en la busqueda de “calaveritas” con respecto a “dia de muertos”.