Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación.

Se presenta la hipotesis de que si la busqueda de “calaveritas” y “dia de muertos” pueden tender a tener indices de busquedas parecidos ya que las 2 son cosas de interes en una misma temporada del año.

Importar

setwd("~/R Scripts")
library(prettydoc) 
library(readr) 
library(DT)
datos <- read_csv("datos2.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   dia_de_muertos = col_double(),
##   calaveritas = col_double()
## )

Visualizar datos

Tabla

datatable(datos)

Gráfica

Matriz de diagramas de dispersión

pairs(datos)

Inferencias

regresion <- lm (dia_de_muertos ~ calaveritas, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = dia_de_muertos ~ calaveritas, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -10.4749  -2.2332  -1.7332  -0.2098  21.3685 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.20976    0.79872   1.515    0.136    
## calaveritas  2.02343    0.09837  20.569   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.471 on 50 degrees of freedom
##   (2 observations deleted due to missingness)
## Multiple R-squared:  0.8943, Adjusted R-squared:  0.8922 
## F-statistic: 423.1 on 1 and 50 DF,  p-value: < 2.2e-16
  • Ecuación de la recta de mínimos cuadrados

\[ y = 0.263802 + 0.184868x \]

  • Graficación de la recta, Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):
plot (datos$dia_de_muertos, datos$calaveritas, xlab = "dia de muertos", ylab = "calaveritas")
abline(regresion)

cor(datos)
##                dia_de_muertos calaveritas
## dia_de_muertos              1          NA
## calaveritas                NA           1

Matriz de coeficientes de correlación

Modelación

modelar (predecir) datos usando la recta de mínimos cuadrados

nuevos.calaveritas <- data.frame(calaveritas=seq(0,52))
predict(regresion,nuevos.calaveritas)
##          1          2          3          4          5          6          7 
##   1.209759   3.233187   5.256616   7.280044   9.303472  11.326900  13.350328 
##          8          9         10         11         12         13         14 
##  15.373756  17.397185  19.420613  21.444041  23.467469  25.490897  27.514326 
##         15         16         17         18         19         20         21 
##  29.537754  31.561182  33.584610  35.608038  37.631466  39.654895  41.678323 
##         22         23         24         25         26         27         28 
##  43.701751  45.725179  47.748607  49.772035  51.795464  53.818892  55.842320 
##         29         30         31         32         33         34         35 
##  57.865748  59.889176  61.912604  63.936033  65.959461  67.982889  70.006317 
##         36         37         38         39         40         41         42 
##  72.029745  74.053173  76.076602  78.100030  80.123458  82.146886  84.170314 
##         43         44         45         46         47         48         49 
##  86.193743  88.217171  90.240599  92.264027  94.287455  96.310883  98.334312 
##         50         51         52         53 
## 100.357740 102.381168 104.404596 106.428024

Conclusión

Por el comportamiento en la gráficas se puede notar que los tienden a tener un índice de buquedas que se comporta de manera parecida sin embargo el interes es menor en la busqueda de “calaveritas” con respecto a “dia de muertos”.