Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación
Bibliotecas y datos
setwd("~/Stat206145") #Folder de trabajo
library(prettydoc) #Formato de documentos
library(readr)
library(DT)
datos <- read_csv("datosSF.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## valentin = col_double(),
## flores = col_double()
## )
Hipótesis
¿Existirá una relación temporal entre la bisqueda en México de las flores y el dia de San Valentín?
Visualización de datos
Tabla
datatable(datos)Diagrama de dispersión
pairs(datos)Inferencias
Cálculo y representación de la recta de mínimos cuadrados
Análisis de correlación
regresion <- lm (valentin ~ flores, data=datos)
summary(regresion)##
## Call:
## lm(formula = valentin ~ flores, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.081 -3.642 -1.858 0.482 86.440
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -19.5662 10.7534 -1.820 0.0748 .
## flores 0.6134 0.2568 2.388 0.0207 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 13.06 on 50 degrees of freedom
## Multiple R-squared: 0.1024, Adjusted R-squared: 0.08445
## F-statistic: 5.704 on 1 and 50 DF, p-value: 0.02074
- Ecuación de la recta de mínimos cuadrados
\[ y = -19.5662 + 0.6134x \]
- Graficación de la recta
plot (datos$valentin, datos$flores, xlab = "Valentin", ylab = "flores")
abline(regresion)cor(datos)## valentin flores
## valentin 1.0000000 0.3200066
## flores 0.3200066 1.0000000
Matríz de coeficientes de correlación
Modelación
Modelar (predecir) datos usando la recta de mínimos cuadrados, después estaremos modelando un nuevo ajuste con 50 nuevos datos como se muestra.
nuevos.flores <- data.frame(flores=seq(0,50))
predict(regresion,nuevos.flores)## 1 2 3 4 5 6
## -19.56623836 -18.95279736 -18.33935635 -17.72591535 -17.11247435 -16.49903334
## 7 8 9 10 11 12
## -15.88559234 -15.27215133 -14.65871033 -14.04526933 -13.43182832 -12.81838732
## 13 14 15 16 17 18
## -12.20494631 -11.59150531 -10.97806431 -10.36462330 -9.75118230 -9.13774129
## 19 20 21 22 23 24
## -8.52430029 -7.91085928 -7.29741828 -6.68397728 -6.07053627 -5.45709527
## 25 26 27 28 29 30
## -4.84365426 -4.23021326 -3.61677226 -3.00333125 -2.38989025 -1.77644924
## 31 32 33 34 35 36
## -1.16300824 -0.54956723 0.06387377 0.67731477 1.29075578 1.90419678
## 37 38 39 40 41 42
## 2.51763779 3.13107879 3.74451979 4.35796080 4.97140180 5.58484281
## 43 44 45 46 47 48
## 6.19828381 6.81172481 7.42516582 8.03860682 8.65204783 9.26548883
## 49 50 51
## 9.87892984 10.49237084 11.10581184
Conclusión
Después de hacer los distintos análisis podemos notar que existe una mínima relación entre ambas búsquedas, por lo que podemos deducir que no hay mucha relación entre ambas.