U1A3

Mariana Pompa Rivera

08/02/2021

Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación

Importar

setwd("~/EALMV9") #folder de trabajo
library(prettydoc) #para formato de documentos
library(readr) #para leer datos
library(DT)
datos <- read_csv("datos.csv") #importar datos
## 
## -- Column specification --------------------------------------------------------
## cols(
##   DiaMuertos = col_double(),
##   Flores = col_double()
## )

Visualizar datos

Tabla

datatable(datos)

Gráfica

Matriz de diagramas de dispersión

pairs(datos)

Inferencias

Calculo y representación de la recta de mínimos cuadrados

regresion <- lm (DiaMuertos ~ Flores, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = DiaMuertos ~ Flores, data = datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -5.911 -5.867 -5.859 -4.609 93.138 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)
## (Intercept)  6.799595  16.654788   0.408    0.685
## Flores       0.002483   0.619992   0.004    0.997
## 
## Residual standard error: 19.67 on 50 degrees of freedom
## Multiple R-squared:  3.207e-07,  Adjusted R-squared:  -0.02 
## F-statistic: 1.603e-05 on 1 and 50 DF,  p-value: 0.9968
  • Ecuacion de la recta de mínimos cuadrados

\[ y = 6.799595 + 0.002483x \]

Los siguientes comandos representan la nube de puntos y añaden la representación gráfica de la recta de mínimos cuadrados

Se demuestra que la intersección en Y es en 6.799595 y la pendiente es de 0.002483, por lo que la pendiente al ser tan pequeña, no se logra ver en el grafico

plot (datos$DiaMuertos, datos$Flores, xlab = "DiaMuertos", ylab = "Flores")
abline(regresion)

cor(datos)
##              DiaMuertos       Flores
## DiaMuertos 1.0000000000 0.0005662905
## Flores     0.0005662905 1.0000000000

Matriz de coeficientes de correlación

Modelación

modelar (predecir) datos usando la recta de mínimos cuadrados

Se predicen (modelan) 20 datos en el que se representan los datos de la recta de mínimos cuadrados

nuevos.Flores <- data.frame(Flores=seq(0,20))
predict(regresion,nuevos.Flores)
##        1        2        3        4        5        6        7        8 
## 6.799595 6.802078 6.804560 6.807043 6.809526 6.812008 6.814491 6.816973 
##        9       10       11       12       13       14       15       16 
## 6.819456 6.821939 6.824421 6.826904 6.829387 6.831869 6.834352 6.836834 
##       17       18       19       20       21 
## 6.839317 6.841800 6.844282 6.846765 6.849248

Deacuerdo con los datos y graficos de dispersión se deduce que el Dia de Muertos y las flores tienen una correlación muy minima de 0.00056, y eso es que en Mexico se compran un cierto tipo de flores para esta fecha