En este documento vamos a analizar el caso de los autos. Yo tengo la hipótesis que a mayor peso y cilindrada, mayor consumo de gasolina.
Este es un documento de R Markdown. Markdown es una sintaxis de formato simple para crear documentos HTML, PDF y MS Word. Para obtener más detalles sobre el uso de R Markdown, consulte http://rmarkdown.rstudio.com.
Al hacer clic en el botón Knit, se generará un documento que incluye tanto el contenido como la salida de cualquier fragmento de código R incrustado en el documento. Puedes incrustar un fragmento de código R como este:
Sabemos de manera intuitiva que a mayor peso, un vehículo consume más gasolina.
## Puedo hacer tablas y que se vean de forma gráfica
mtcars %>%
select(wt, mpg)
## wt mpg
## Mazda RX4 2.620 21.0
## Mazda RX4 Wag 2.875 21.0
## Datsun 710 2.320 22.8
## Hornet 4 Drive 3.215 21.4
## Hornet Sportabout 3.440 18.7
## Valiant 3.460 18.1
## Duster 360 3.570 14.3
## Merc 240D 3.190 24.4
## Merc 230 3.150 22.8
## Merc 280 3.440 19.2
## Merc 280C 3.440 17.8
## Merc 450SE 4.070 16.4
## Merc 450SL 3.730 17.3
## Merc 450SLC 3.780 15.2
## Cadillac Fleetwood 5.250 10.4
## Lincoln Continental 5.424 10.4
## Chrysler Imperial 5.345 14.7
## Fiat 128 2.200 32.4
## Honda Civic 1.615 30.4
## Toyota Corolla 1.835 33.9
## Toyota Corona 2.465 21.5
## Dodge Challenger 3.520 15.5
## AMC Javelin 3.435 15.2
## Camaro Z28 3.840 13.3
## Pontiac Firebird 3.845 19.2
## Fiat X1-9 1.935 27.3
## Porsche 914-2 2.140 26.0
## Lotus Europa 1.513 30.4
## Ford Pantera L 3.170 15.8
## Ferrari Dino 2.770 19.7
## Maserati Bora 3.570 15.0
## Volvo 142E 2.780 21.4
mtcars %>%
select(wt, mpg) %>%
summary()
## wt mpg
## Min. :1.513 Min. :10.40
## 1st Qu.:2.581 1st Qu.:15.43
## Median :3.325 Median :19.20
## Mean :3.217 Mean :20.09
## 3rd Qu.:3.610 3rd Qu.:22.80
## Max. :5.424 Max. :33.90
Markdown permite escribir tanto tablas, como gráficas como texto. Todo lo que vemos en la consola de R está en markdown.
plot(mtcars$wt, mtcars$mpg)
Tenga en cuenta que el parámetro echo = FALSE se agregó
al fragmento de código para evitar la impresión del código R que generó
el gráfico.
La siguiente función nos explica la correlación entre la variable y (mpg) y x (wt). Estoy tratando de demostrar que existe correlación entre el peso del vehículo y su consumo de combustible.
## declarando mis variables
x <- mtcars$mpg
y <- mtcars$wt
# Correlación simple entre x y
cor(x, y)
## [1] -0.8676594
## Ajuste de modelo
modelo <- lm(mpg ~ wt, data=mtcars)
summary(modelo)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
El modelo concluye que existe una correlación negativa entre el peso (wt) y el consumo de combustible (mpg) de -5.3445 mpg por cada 1000 libras adicionales de peso.
La hipótesis es correcta, el modelo indica que si incrementa el peso incrementa el consumo de combustible.
# library(car) ## Aun no vemos esta libreria
car::scatterplot(data = mtcars,
mpg ~ wt,
smooth = FALSE)
## Graficamos en 3d
Tenemos la hipótesis de que hay otras causas de que se consuma más combustible. Graficamos el tamño del motor, consumo y peso.
# library(scatterplot3d)
x <- mtcars$wt
y <- mtcars$mpg
z <- mtcars$disp
grps <- as.factor(mtcars$cyl)
colors <- c("#999999", "#E69F00", "#56B4E9")
scatterplot3d::scatterplot3d(x,y,z, pch = 16, color = colors[grps])