Cargemos librerias y mtcars.

Vamos a analizar nuestros autos.

En este documento vamos a analizar el caso de los autos. Yo tengo la hipótesis que a mayor peso y cilindrada, mayor consumo de gasolina.

R Markdown

Este es un documento de R Markdown. Markdown es una sintaxis de formato simple para crear documentos HTML, PDF y MS Word. Para obtener más detalles sobre el uso de R Markdown, consulte http://rmarkdown.rstudio.com.

Al hacer clic en el botón Knit, se generará un documento que incluye tanto el contenido como la salida de cualquier fragmento de código R incrustado en el documento. Puedes incrustar un fragmento de código R como este:

Elegimos los datos que nos interesan

Sabemos de manera intuitiva que a mayor peso, un vehículo consume más gasolina.

## Puedo hacer tablas y que se vean de forma gráfica
mtcars %>% 
  select(wt, mpg)
##                        wt  mpg
## Mazda RX4           2.620 21.0
## Mazda RX4 Wag       2.875 21.0
## Datsun 710          2.320 22.8
## Hornet 4 Drive      3.215 21.4
## Hornet Sportabout   3.440 18.7
## Valiant             3.460 18.1
## Duster 360          3.570 14.3
## Merc 240D           3.190 24.4
## Merc 230            3.150 22.8
## Merc 280            3.440 19.2
## Merc 280C           3.440 17.8
## Merc 450SE          4.070 16.4
## Merc 450SL          3.730 17.3
## Merc 450SLC         3.780 15.2
## Cadillac Fleetwood  5.250 10.4
## Lincoln Continental 5.424 10.4
## Chrysler Imperial   5.345 14.7
## Fiat 128            2.200 32.4
## Honda Civic         1.615 30.4
## Toyota Corolla      1.835 33.9
## Toyota Corona       2.465 21.5
## Dodge Challenger    3.520 15.5
## AMC Javelin         3.435 15.2
## Camaro Z28          3.840 13.3
## Pontiac Firebird    3.845 19.2
## Fiat X1-9           1.935 27.3
## Porsche 914-2       2.140 26.0
## Lotus Europa        1.513 30.4
## Ford Pantera L      3.170 15.8
## Ferrari Dino        2.770 19.7
## Maserati Bora       3.570 15.0
## Volvo 142E          2.780 21.4
mtcars %>% 
  select(wt, mpg) %>% 
  summary()
##        wt             mpg       
##  Min.   :1.513   Min.   :10.40  
##  1st Qu.:2.581   1st Qu.:15.43  
##  Median :3.325   Median :19.20  
##  Mean   :3.217   Mean   :20.09  
##  3rd Qu.:3.610   3rd Qu.:22.80  
##  Max.   :5.424   Max.   :33.90

Se puede graficar

Markdown permite escribir tanto tablas, como gráficas como texto. Todo lo que vemos en la consola de R está en markdown.

plot(mtcars$wt, mtcars$mpg)

Tenga en cuenta que el parámetro echo = FALSE se agregó al fragmento de código para evitar la impresión del código R que generó el gráfico.

Haciendo un modelo de regresión lineal

Primero revisamos si hay correlación simple.

La siguiente función nos explica la correlación entre la variable y (mpg) y x (wt). Estoy tratando de demostrar que existe correlación entre el peso del vehículo y su consumo de combustible.

## declarando mis variables
x <- mtcars$mpg
y <- mtcars$wt

# Correlación simple entre x y
cor(x, y)
## [1] -0.8676594

Ajustando el modelo de regresión

## Ajuste de modelo
modelo <- lm(mpg ~ wt, data=mtcars)
summary(modelo)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

El modelo concluye que existe una correlación negativa entre el peso (wt) y el consumo de combustible (mpg) de -5.3445 mpg por cada 1000 libras adicionales de peso.

La hipótesis es correcta, el modelo indica que si incrementa el peso incrementa el consumo de combustible.

Graficando el modelo de regresión lineal

# library(car) ## Aun no vemos esta libreria
car::scatterplot(data = mtcars,
            mpg ~ wt,
            smooth = FALSE)

## Graficamos en 3d

Tenemos la hipótesis de que hay otras causas de que se consuma más combustible. Graficamos el tamño del motor, consumo y peso.

# library(scatterplot3d)

x <- mtcars$wt
y <- mtcars$mpg
z <- mtcars$disp
grps <- as.factor(mtcars$cyl)

colors <- c("#999999", "#E69F00", "#56B4E9")
scatterplot3d::scatterplot3d(x,y,z, pch = 16, color = colors[grps])