Hipotesis

cuantos mas cilindros tiene un carro, este tendera a tener mas millas por galon

Datos

con la base de datos tendremos que depurar los datos que querremos analizar

mtcars %>%
   select(mpg, cyl) %>%
   summary()
##       mpg             cyl       
##  Min.   :10.40   Min.   :4.000  
##  1st Qu.:15.43   1st Qu.:4.000  
##  Median :19.20   Median :6.000  
##  Mean   :20.09   Mean   :6.188  
##  3rd Qu.:22.80   3rd Qu.:8.000  
##  Max.   :33.90   Max.   :8.000

Graficas

con los datos optenidos podemos tener graficas pra tener un estimado de los resultados

 plot(mtcars$cyl, mtcars$mpg)

##Modelo de regresion lineal

Correlacion

Primero veremos si hay un correlacion entre las variables del numero de cilindros con respecto a las millas por galon

#Llamamos a las variables 
x <- mtcars$mpg
y <- mtcars$cyl

#correlacion
cor(x, y)
## [1] -0.852162

##Ajuste del modelo

#Ajuste del modelo 
modelo <- lm(formula= mpg ~ cyl, data = mtcars )
summary(modelo)
## 
## Call:
## lm(formula = mpg ~ cyl, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.9814 -2.1185  0.2217  1.0717  7.5186 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.8846     2.0738   18.27  < 2e-16 ***
## cyl          -2.8758     0.3224   -8.92 6.11e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.206 on 30 degrees of freedom
## Multiple R-squared:  0.7262, Adjusted R-squared:  0.7171 
## F-statistic: 79.56 on 1 and 30 DF,  p-value: 6.113e-10

El modelo de correlacion lineal nos muestra que hay un coeficiente de correlacion de -2.8758, lo que nos dice que es in versamente proporcinal es decir, entre mas cilindros tenga el carro, mas millas por galon sera

Grafica del modelo de regresion lineal

car::scatterplot(data = mtcars,
                 mpg ~ cyl,
                 smooth = FALSE)