U1A9

felipe escarrega valdez

22/9/2020

Regreción lineal simple

setwd("~/PYE1112ITSON")
library(pacman)
p_load( "tidyverse")

gasolina.jpg

Importar datos

Los datos proporcionados en este ejericio vienen de la libreria tidyverse (mpg)

datos <- mpg
cilindros <- as.numeric(datos$displ)
millas <- as.numeric(datos$hwy)
cilmi <- data.frame(cilindros,millas)
names(cilmi)
## [1] "cilindros" "millas"

Visualizar

  • grafico de correlación, grafíco de pares
head(cilmi)
##   cilindros millas
## 1       1.8     29
## 2       1.8     29
## 3       2.0     31
## 4       2.0     30
## 5       2.8     26
## 6       2.8     26
pairs(cilmi)

Modelar

Grado de correlación lineal

  • Matriz de coeficientes de correlacón
cor(cilmi)
##           cilindros   millas
## cilindros   1.00000 -0.76602
## millas     -0.76602  1.00000

Cálculo y representacion de la recta de minimos y cuadrados

regresion <- lm(millas ~ cilindros, data = cilmi)
summary(regresion)
## 
## Call:
## lm(formula = millas ~ cilindros, data = cilmi)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.1039 -2.1646 -0.2242  2.0589 15.0105 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  35.6977     0.7204   49.55   <2e-16 ***
## cilindros    -3.5306     0.1945  -18.15   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.836 on 232 degrees of freedom
## Multiple R-squared:  0.5868, Adjusted R-squared:  0.585 
## F-statistic: 329.5 on 1 and 232 DF,  p-value: < 2.2e-16
  • Entonces la recta de mínimos cuadrados, sería la siguiente:

\[ Y = 35.6977 - 3.5306 x\]

Rerecentación grafíca de la recta

plot(cilmi$cilindros, cilmi$millas, xlab = "cilindros", ylab = "millas")
abline(regresion)

Modelación de valores

nuevo.cilindraje <- data.frame(cilindros=seq(1,6))
predict(regresion, nuevo.cilindraje)
##        1        2        3        4        5        6 
## 32.16706 28.63647 25.10588 21.57530 18.04471 14.51412

Descripción

Para este ejericio se elaboró un gráfico de pares, y una recta de mínimos cuadrados. Se realizo un nálisis cuantitativo para calcular el nivel de inferencia del modelo de regresion lineal simple,con intervalos de confianza.entre mas cerca esten los puntos de la linea mas confiable es, al parecer el modelo reallizado es confiable como lo podemos ver, se realizo a detalle un análisis dde la correlación de las variables, cilindraje de un auto y las millas que rinde la gasolina por galon. Como lo podemos observar al aumentar el cilindraje dara pocas millas por galon, se podria decir que es bastante obio que entre mas grande sea el motor el combustible rendira menos.