##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
El presente proyecto tiene como objetivo explorar y analizar el
conjunto de datos mpg proveniente del paquete
ggplot2 en R. Este conjunto de datos recopila información
sobre el rendimiento de combustible de distintos modelos de automóviles,
considerando variables como el fabricante, modelo, año de fabricación,
tipo de transmisión, tipo de tracción y consumo de combustible tanto en
ciudad como en carretera. A través de una inspección preliminar y la
creación de diversas visualizaciones de datos, se pretende comprender
mejor las relaciones entre las variables y extraer conclusiones
relevantes sobre patrones de eficiencia y características de los
vehículos registrados.
Objetivo General:
- Analizar el conjunto de
datos mpg para identificar patrones en el rendimiento de
combustible y características de los modelos de vehículos.
Objetivos Específicos:
- Inspeccionar la
estructura, tipo de variables y calidad de los datos disponibles en
mpg.
- Crear al menos diez visualizaciones que
permitan observar la distribución y relaciones entre variables
importantes.
- Interpretar los resultados de las gráficas para
comprender tendencias en el rendimiento de combustible.
- Presentar
un resumen claro del análisis realizado y extraer conclusiones
relevantes.
El conjunto de datos mpg del paquete
ggplot2 contiene información sobre el rendimiento de
combustible de distintos modelos de automóviles. Cada fila representa un
modelo de auto específico y las columnas describen características como
el fabricante, modelo, año de fabricación, tipo de transmisión, tipo de
tracción, consumo en ciudad y carretera, entre otros.
Este conjunto de datos proviene del paquete ggplot2
desarrollado por Hadley Wickham. Los datos están basados en información
de pruebas de eficiencia de combustible proporcionada por la EPA
(Agencia de Protección Ambiental de EE.UU.). Se trata de datos
procesados para su uso educativo y de análisis exploratorio.
| Variable | Descripción |
|---|---|
| manufacturer | Fabricante del vehículo |
| model | Modelo del vehículo |
| displ | Cilindrada del motor en litros |
| year | Año de fabricación |
| cyl | Número de cilindros |
| trans | Tipo de transmisión (manual o automática) |
| drv | Tipo de tracción (delantera, trasera o 4x4) |
| cty | Millas por galón en ciudad |
| hwy | Millas por galón en carretera |
| fl | Tipo de combustible |
| class | Clase del vehículo (compacto, SUV, pickup, etc.) |
# Cargar el dataset
mpg
## # A tibble: 234 × 11
## manufacturer model displ year cyl trans drv cty hwy fl class
## <chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
## 1 audi a4 1.8 1999 4 auto… f 18 29 p comp…
## 2 audi a4 1.8 1999 4 manu… f 21 29 p comp…
## 3 audi a4 2 2008 4 manu… f 20 31 p comp…
## 4 audi a4 2 2008 4 auto… f 21 30 p comp…
## 5 audi a4 2.8 1999 6 auto… f 16 26 p comp…
## 6 audi a4 2.8 1999 6 manu… f 18 26 p comp…
## 7 audi a4 3.1 2008 6 auto… f 18 27 p comp…
## 8 audi a4 quattro 1.8 1999 4 manu… 4 18 26 p comp…
## 9 audi a4 quattro 1.8 1999 4 auto… 4 16 25 p comp…
## 10 audi a4 quattro 2 2008 4 manu… 4 20 28 p comp…
## # ℹ 224 more rows
ggplot(mpg, aes(x = cty)) +
geom_histogram(binwidth = 1, fill = "skyblue", color = "black") +
labs(title = "Distribución del consumo en ciudad", x = "Millas por galón (ciudad)", y = "Número de vehículos")
Descripción e interpretación del Gráfico 1: La mayoría de los vehículos tienen un rendimiento en ciudad entre 14 y 20 millas por galón.
ggplot(mpg, aes(x = displ, y = hwy)) +
geom_point(color = "darkgreen") +
labs(title = "Cilindrada vs Consumo en carretera", x = "Cilindrada (litros)", y = "Millas por galón (carretera)")
Descripción e interpretación del Gráfico 2: Vehículos con mayor cilindrada tienden a tener menor eficiencia en carretera.
ggplot(mpg, aes(x = class)) +
geom_bar(fill = "coral", color = "black") +
labs(title = "Tipos de vehículos", x = "Clase", y = "Cantidad")
Descripción e interpretación del Gráfico 3: Los SUV y compactos son los más frecuentes en el conjunto.
ggplot(mpg, aes(x = hwy)) +
geom_histogram(binwidth = 1, fill = "orchid", color = "black") +
labs(title = "Distribución del consumo en carretera", x = "Millas por galón (carretera)", y = "Cantidad de vehículos")
Descripción e interpretación del Gráfico 4: La mayoría de los autos logran entre 18 y 28 millas por galón en carretera.
ggplot(mpg, aes(x = cyl, y = cty)) +
geom_jitter(color = "orange", width = 0.3) +
labs(title = "Número de cilindros vs Consumo en ciudad", x = "Cilindros", y = "Millas por galón (ciudad)")
Descripción e interpretación del Gráfico 5: Menos cilindros suelen asociarse a mejor consumo en ciudad.
ggplot(mpg, aes(x = trans)) +
geom_bar(fill = "lightgreen", color = "black") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
labs(title = "Tipos de transmisión", x = "Transmisión", y = "Cantidad de vehículos")
Descripción e interpretación del Gráfico 6: Predominan las transmisiones automáticas.
mpg %>% count(year) %>%
ggplot(aes(x = year, y = n)) +
geom_line(color = "blue") +
geom_point(color = "red") +
labs(title = "Cantidad de vehículos por año", x = "Año", y = "Cantidad")
Descripción e interpretación del Gráfico 7: Se registran principalmente vehículos de los años 1999 y 2008.
ggplot(mpg, aes(x = manufacturer)) +
geom_bar(fill = "lightcoral", color = "black") +
coord_flip() +
labs(title = "Cantidad de vehículos por fabricante", x = "Fabricante", y = "Cantidad")
Descripción e interpretación del Gráfico 8: Dodge y Toyota destacan por su número de modelos.
mpg %>% count(fl) %>%
ggplot(aes(x = "", y = n, fill = fl)) +
geom_col(width = 1) +
coord_polar(theta = "y") +
theme_void() +
labs(title = "Distribución de tipos de combustible")
Descripción e interpretación del Gráfico 9:
Predomina el uso de gasolina regular (p).
ggplot(mpg, aes(x = class, fill = drv)) +
geom_bar(position = "dodge", color = "black") +
labs(title = "Tipo de tracción por clase", x = "Clase de vehículo", y = "Cantidad") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Descripción e interpretación del Gráfico 10: La tracción delantera predomina en los vehículos compactos.
A partir del análisis realizado, se concluye que existen patrones claros entre las características técnicas de los vehículos y su eficiencia en el consumo de combustible. Se observó que los vehículos con menor cilindrada y menor número de cilindros tienden a tener mejor rendimiento tanto en ciudad como en carretera. También se identificó que la mayoría de los vehículos pertenecen a las categorías de SUV y compactos, y que predomina el uso de gasolina regular como tipo de combustible. Gracias a las visualizaciones generadas, fue posible interpretar de manera sencilla cómo influyen variables como la transmisión, el tipo de tracción y el año de fabricación en el rendimiento de los automóviles. En general, el análisis cumplió con los objetivos planteados, permitiendo una exploración significativa de los datos y proporcionando una base sólida para futuras investigaciones más profundas sobre el rendimiento vehicular.