Regresión lineal simple, recta de mínimos cuadrados, ajuste y modelación
setwd("~/6to semestre/Estadistica aplicada/Estadistica R/Primer parcial/U1A2")
library(prettydoc)
library(readr)
library(DT)
datos <- read_csv("datos.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## Primavera = col_double(),
## Flores = col_double()
## )
Visualizar datos
Tablas
datatable(datos)Gráfica
Matriz de diagramas de dispersión
pairs(datos)Inferencias
Cálculo y representación de la recta de minimos cuadrados
regresion <- lm (Primavera ~ Flores, data=datos)
summary(regresion)##
## Call:
## lm(formula = Primavera ~ Flores, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.510 -4.758 -3.289 -0.921 91.258
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.1039 4.5534 -0.242 0.809
## Flores 0.2735 0.1081 2.529 0.012 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 12.51 on 259 degrees of freedom
## Multiple R-squared: 0.0241, Adjusted R-squared: 0.02034
## F-statistic: 6.397 on 1 and 259 DF, p-value: 0.01202
- Ecuacion de la recta de mínimos cuadrados
\[ y=-1.1039 + 0.2735x \]
- Graficacion de la recta
plot (datos$Primavera, datos$Flores, xlab = "Primavera", ylab = "Flores")
abline(regresion)Esta gráfica nos indica la regresión lineal, donde se puede observar los datos muy agrupados al inicio y la linea se ve afectada hasta lo último
cor(datos)## Primavera Flores
## Primavera 1.0000000 0.1552577
## Flores 0.1552577 1.0000000
Matriz de coeficientes de correlación
En base al diagrama de dispersión podemos deducir que la primavera y las flores no tiene mucha correlación (0.15). Lo cual se puede deducir que en todas las estaciones se buscan flores y no solamente primavera.
Modelacion
Modelar (predecir) datos usando la recta de mínimos cuadrados
nuevos.Flores <- data.frame(Flores=seq(0,50))
predict(regresion,nuevos.Flores)## 1 2 3 4 5 6
## -1.103907555 -0.830422201 -0.556936847 -0.283451493 -0.009966138 0.263519216
## 7 8 9 10 11 12
## 0.537004570 0.810489925 1.083975279 1.357460633 1.630945987 1.904431342
## 13 14 15 16 17 18
## 2.177916696 2.451402050 2.724887404 2.998372759 3.271858113 3.545343467
## 19 20 21 22 23 24
## 3.818828821 4.092314176 4.365799530 4.639284884 4.912770238 5.186255593
## 25 26 27 28 29 30
## 5.459740947 5.733226301 6.006711655 6.280197010 6.553682364 6.827167718
## 31 32 33 34 35 36
## 7.100653072 7.374138427 7.647623781 7.921109135 8.194594489 8.468079844
## 37 38 39 40 41 42
## 8.741565198 9.015050552 9.288535906 9.562021261 9.835506615 10.108991969
## 43 44 45 46 47 48
## 10.382477323 10.655962678 10.929448032 11.202933386 11.476418740 11.749904095
## 49 50 51
## 12.023389449 12.296874803 12.570360157
Este es el ajuste de la recta de mínimo cuadrados, la cual se ajusta 50 datos nuevos para predecir el nuevo modelo.