U1A3

Cielo Higuera Gutiérrez

08/02/2021

Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación

setwd("~/6to semestre/Estadistica aplicada/Estadistica R/Primer parcial/U1A2")
library(prettydoc) 
library(readr)
library(DT)
datos <- read_csv("datos.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   Primavera = col_double(),
##   Flores = col_double()
## )

Visualizar datos

Tablas

datatable(datos)

Gráfica

Matriz de diagramas de dispersión

pairs(datos)

Inferencias

Cálculo y representación de la recta de minimos cuadrados

regresion <- lm (Primavera ~ Flores, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = Primavera ~ Flores, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -18.510  -4.758  -3.289  -0.921  91.258 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  -1.1039     4.5534  -0.242    0.809  
## Flores        0.2735     0.1081   2.529    0.012 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 12.51 on 259 degrees of freedom
## Multiple R-squared:  0.0241, Adjusted R-squared:  0.02034 
## F-statistic: 6.397 on 1 and 259 DF,  p-value: 0.01202
  • Ecuacion de la recta de mínimos cuadrados

\[ y=-1.1039 + 0.2735x \]

  • Graficacion de la recta
plot (datos$Primavera, datos$Flores, xlab = "Primavera", ylab = "Flores")
abline(regresion)

Esta gráfica nos indica la regresión lineal, donde se puede observar los datos muy agrupados al inicio y la linea se ve afectada hasta lo último

cor(datos)
##           Primavera    Flores
## Primavera 1.0000000 0.1552577
## Flores    0.1552577 1.0000000

Matriz de coeficientes de correlación

En base al diagrama de dispersión podemos deducir que la primavera y las flores no tiene mucha correlación (0.15). Lo cual se puede deducir que en todas las estaciones se buscan flores y no solamente primavera.

Modelacion

Modelar (predecir) datos usando la recta de mínimos cuadrados

nuevos.Flores <- data.frame(Flores=seq(0,50))
predict(regresion,nuevos.Flores)
##            1            2            3            4            5            6 
## -1.103907555 -0.830422201 -0.556936847 -0.283451493 -0.009966138  0.263519216 
##            7            8            9           10           11           12 
##  0.537004570  0.810489925  1.083975279  1.357460633  1.630945987  1.904431342 
##           13           14           15           16           17           18 
##  2.177916696  2.451402050  2.724887404  2.998372759  3.271858113  3.545343467 
##           19           20           21           22           23           24 
##  3.818828821  4.092314176  4.365799530  4.639284884  4.912770238  5.186255593 
##           25           26           27           28           29           30 
##  5.459740947  5.733226301  6.006711655  6.280197010  6.553682364  6.827167718 
##           31           32           33           34           35           36 
##  7.100653072  7.374138427  7.647623781  7.921109135  8.194594489  8.468079844 
##           37           38           39           40           41           42 
##  8.741565198  9.015050552  9.288535906  9.562021261  9.835506615 10.108991969 
##           43           44           45           46           47           48 
## 10.382477323 10.655962678 10.929448032 11.202933386 11.476418740 11.749904095 
##           49           50           51 
## 12.023389449 12.296874803 12.570360157

Este es el ajuste de la recta de mínimo cuadrados, la cual se ajusta 50 datos nuevos para predecir el nuevo modelo.