U1A3

Daniela Zazueta

08/02/2021

Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación

Bibliotecas y datos

setwd("~/Stat206145") #Folder de trabajo
library(prettydoc) #Formato de documentos
library(readr)
library(DT)
datos <- read_csv("datosSF.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   valentin = col_double(),
##   flores = col_double()
## )

Hipótesis

¿Existirá una relación temporal entre la bisqueda en México de las flores y el dia de San Valentín?

Visualización de datos

Tabla

datatable(datos)

Diagrama de dispersión

pairs(datos)

Inferencias

Cálculo y representación de la recta de mínimos cuadrados

Análisis de correlación

regresion <- lm (valentin ~ flores, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = valentin ~ flores, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -15.081  -3.642  -1.858   0.482  86.440 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept) -19.5662    10.7534  -1.820   0.0748 .
## flores        0.6134     0.2568   2.388   0.0207 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 13.06 on 50 degrees of freedom
## Multiple R-squared:  0.1024, Adjusted R-squared:  0.08445 
## F-statistic: 5.704 on 1 and 50 DF,  p-value: 0.02074
  • Ecuación de la recta de mínimos cuadrados

\[ y = -19.5662 + 0.6134x \]

  • Graficación de la recta
plot (datos$valentin, datos$flores, xlab = "Valentin", ylab = "flores")
abline(regresion)

cor(datos)
##           valentin    flores
## valentin 1.0000000 0.3200066
## flores   0.3200066 1.0000000

Matríz de coeficientes de correlación

Modelación

Modelar (predecir) datos usando la recta de mínimos cuadrados, después estaremos modelando un nuevo ajuste con 50 nuevos datos como se muestra.

nuevos.flores <- data.frame(flores=seq(0,50))
predict(regresion,nuevos.flores)
##            1            2            3            4            5            6 
## -19.56623836 -18.95279736 -18.33935635 -17.72591535 -17.11247435 -16.49903334 
##            7            8            9           10           11           12 
## -15.88559234 -15.27215133 -14.65871033 -14.04526933 -13.43182832 -12.81838732 
##           13           14           15           16           17           18 
## -12.20494631 -11.59150531 -10.97806431 -10.36462330  -9.75118230  -9.13774129 
##           19           20           21           22           23           24 
##  -8.52430029  -7.91085928  -7.29741828  -6.68397728  -6.07053627  -5.45709527 
##           25           26           27           28           29           30 
##  -4.84365426  -4.23021326  -3.61677226  -3.00333125  -2.38989025  -1.77644924 
##           31           32           33           34           35           36 
##  -1.16300824  -0.54956723   0.06387377   0.67731477   1.29075578   1.90419678 
##           37           38           39           40           41           42 
##   2.51763779   3.13107879   3.74451979   4.35796080   4.97140180   5.58484281 
##           43           44           45           46           47           48 
##   6.19828381   6.81172481   7.42516582   8.03860682   8.65204783   9.26548883 
##           49           50           51 
##   9.87892984  10.49237084  11.10581184

Conclusión

Después de hacer los distintos análisis podemos notar que existe una mínima relación entre ambas búsquedas, por lo que podemos deducir que no hay mucha relación entre ambas.