cuantos mas cilindros tiene un carro, este tendera a tener mas millas por galon
con la base de datos tendremos que depurar los datos que querremos analizar
mtcars %>%
select(mpg, cyl) %>%
summary()
## mpg cyl
## Min. :10.40 Min. :4.000
## 1st Qu.:15.43 1st Qu.:4.000
## Median :19.20 Median :6.000
## Mean :20.09 Mean :6.188
## 3rd Qu.:22.80 3rd Qu.:8.000
## Max. :33.90 Max. :8.000
con los datos optenidos podemos tener graficas pra tener un estimado de los resultados
plot(mtcars$cyl, mtcars$mpg)
##Modelo de regresion lineal
Primero veremos si hay un correlacion entre las variables del numero de cilindros con respecto a las millas por galon
#Llamamos a las variables
x <- mtcars$mpg
y <- mtcars$cyl
#correlacion
cor(x, y)
## [1] -0.852162
##Ajuste del modelo
#Ajuste del modelo
modelo <- lm(formula= mpg ~ cyl, data = mtcars )
summary(modelo)
##
## Call:
## lm(formula = mpg ~ cyl, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.9814 -2.1185 0.2217 1.0717 7.5186
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.8846 2.0738 18.27 < 2e-16 ***
## cyl -2.8758 0.3224 -8.92 6.11e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.206 on 30 degrees of freedom
## Multiple R-squared: 0.7262, Adjusted R-squared: 0.7171
## F-statistic: 79.56 on 1 and 30 DF, p-value: 6.113e-10
El modelo de correlacion lineal nos muestra que hay un coeficiente de correlacion de -2.8758, lo que nos dice que es in versamente proporcinal es decir, entre mas cilindros tenga el carro, mas millas por galon sera
car::scatterplot(data = mtcars,
mpg ~ cyl,
smooth = FALSE)