## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Introducción

El presente proyecto tiene como objetivo explorar y analizar el conjunto de datos mpg proveniente del paquete ggplot2 en R. Este conjunto de datos recopila información sobre el rendimiento de combustible de distintos modelos de automóviles, considerando variables como el fabricante, modelo, año de fabricación, tipo de transmisión, tipo de tracción y consumo de combustible tanto en ciudad como en carretera. A través de una inspección preliminar y la creación de diversas visualizaciones de datos, se pretende comprender mejor las relaciones entre las variables y extraer conclusiones relevantes sobre patrones de eficiencia y características de los vehículos registrados.

Objetivos

Objetivo General:
- Analizar el conjunto de datos mpg para identificar patrones en el rendimiento de combustible y características de los modelos de vehículos.

Objetivos Específicos:
- Inspeccionar la estructura, tipo de variables y calidad de los datos disponibles en mpg.
- Crear al menos diez visualizaciones que permitan observar la distribución y relaciones entre variables importantes.
- Interpretar los resultados de las gráficas para comprender tendencias en el rendimiento de combustible.
- Presentar un resumen claro del análisis realizado y extraer conclusiones relevantes.

Descripción de los datos

El conjunto de datos mpg del paquete ggplot2 contiene información sobre el rendimiento de combustible de distintos modelos de automóviles. Cada fila representa un modelo de auto específico y las columnas describen características como el fabricante, modelo, año de fabricación, tipo de transmisión, tipo de tracción, consumo en ciudad y carretera, entre otros.

Este conjunto de datos proviene del paquete ggplot2 desarrollado por Hadley Wickham. Los datos están basados en información de pruebas de eficiencia de combustible proporcionada por la EPA (Agencia de Protección Ambiental de EE.UU.). Se trata de datos procesados para su uso educativo y de análisis exploratorio.

Tabla resumen de variables

Variable Descripción
manufacturer Fabricante del vehículo
model Modelo del vehículo
displ Cilindrada del motor en litros
year Año de fabricación
cyl Número de cilindros
trans Tipo de transmisión (manual o automática)
drv Tipo de tracción (delantera, trasera o 4x4)
cty Millas por galón en ciudad
hwy Millas por galón en carretera
fl Tipo de combustible
class Clase del vehículo (compacto, SUV, pickup, etc.)

Visualizaciones de datos

# Cargar el dataset
mpg
## # A tibble: 234 × 11
##    manufacturer model      displ  year   cyl trans drv     cty   hwy fl    class
##    <chr>        <chr>      <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
##  1 audi         a4           1.8  1999     4 auto… f        18    29 p     comp…
##  2 audi         a4           1.8  1999     4 manu… f        21    29 p     comp…
##  3 audi         a4           2    2008     4 manu… f        20    31 p     comp…
##  4 audi         a4           2    2008     4 auto… f        21    30 p     comp…
##  5 audi         a4           2.8  1999     6 auto… f        16    26 p     comp…
##  6 audi         a4           2.8  1999     6 manu… f        18    26 p     comp…
##  7 audi         a4           3.1  2008     6 auto… f        18    27 p     comp…
##  8 audi         a4 quattro   1.8  1999     4 manu… 4        18    26 p     comp…
##  9 audi         a4 quattro   1.8  1999     4 auto… 4        16    25 p     comp…
## 10 audi         a4 quattro   2    2008     4 manu… 4        20    28 p     comp…
## # ℹ 224 more rows

Gráfico 1: Histograma de consumo en ciudad

ggplot(mpg, aes(x = cty)) +
  geom_histogram(binwidth = 1, fill = "skyblue", color = "black") +
  labs(title = "Distribución del consumo en ciudad", x = "Millas por galón (ciudad)", y = "Número de vehículos")

Descripción e interpretación del Gráfico 1: La mayoría de los vehículos tienen un rendimiento en ciudad entre 14 y 20 millas por galón.

Gráfico 2: Dispersión entre cilindrada y consumo en carretera

ggplot(mpg, aes(x = displ, y = hwy)) +
  geom_point(color = "darkgreen") +
  labs(title = "Cilindrada vs Consumo en carretera", x = "Cilindrada (litros)", y = "Millas por galón (carretera)")

Descripción e interpretación del Gráfico 2: Vehículos con mayor cilindrada tienden a tener menor eficiencia en carretera.

Gráfico 3: Barras de tipos de vehículos

ggplot(mpg, aes(x = class)) +
  geom_bar(fill = "coral", color = "black") +
  labs(title = "Tipos de vehículos", x = "Clase", y = "Cantidad")

Descripción e interpretación del Gráfico 3: Los SUV y compactos son los más frecuentes en el conjunto.

Gráfico 4: Histograma de consumo en carretera

ggplot(mpg, aes(x = hwy)) +
  geom_histogram(binwidth = 1, fill = "orchid", color = "black") +
  labs(title = "Distribución del consumo en carretera", x = "Millas por galón (carretera)", y = "Cantidad de vehículos")

Descripción e interpretación del Gráfico 4: La mayoría de los autos logran entre 18 y 28 millas por galón en carretera.

Gráfico 5: Dispersión de cilindros vs consumo en ciudad

ggplot(mpg, aes(x = cyl, y = cty)) +
  geom_jitter(color = "orange", width = 0.3) +
  labs(title = "Número de cilindros vs Consumo en ciudad", x = "Cilindros", y = "Millas por galón (ciudad)")

Descripción e interpretación del Gráfico 5: Menos cilindros suelen asociarse a mejor consumo en ciudad.

Gráfico 6: Barras del tipo de transmisión

ggplot(mpg, aes(x = trans)) +
  geom_bar(fill = "lightgreen", color = "black") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  labs(title = "Tipos de transmisión", x = "Transmisión", y = "Cantidad de vehículos")

Descripción e interpretación del Gráfico 6: Predominan las transmisiones automáticas.

Gráfico 7: Línea de vehículos por año

mpg %>% count(year) %>%
  ggplot(aes(x = year, y = n)) +
  geom_line(color = "blue") +
  geom_point(color = "red") +
  labs(title = "Cantidad de vehículos por año", x = "Año", y = "Cantidad")

Descripción e interpretación del Gráfico 7: Se registran principalmente vehículos de los años 1999 y 2008.

Gráfico 8: Barras horizontales por fabricante

ggplot(mpg, aes(x = manufacturer)) +
  geom_bar(fill = "lightcoral", color = "black") +
  coord_flip() +
  labs(title = "Cantidad de vehículos por fabricante", x = "Fabricante", y = "Cantidad")

Descripción e interpretación del Gráfico 8: Dodge y Toyota destacan por su número de modelos.

Gráfico 9: Pastel de tipos de combustible

mpg %>% count(fl) %>%
  ggplot(aes(x = "", y = n, fill = fl)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
  theme_void() +
  labs(title = "Distribución de tipos de combustible")

Descripción e interpretación del Gráfico 9: Predomina el uso de gasolina regular (p).

Gráfico 10: Barras agrupadas de tracción por clase

ggplot(mpg, aes(x = class, fill = drv)) +
  geom_bar(position = "dodge", color = "black") +
  labs(title = "Tipo de tracción por clase", x = "Clase de vehículo", y = "Cantidad") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Descripción e interpretación del Gráfico 10: La tracción delantera predomina en los vehículos compactos.

Conclusión

A partir del análisis realizado, se concluye que existen patrones claros entre las características técnicas de los vehículos y su eficiencia en el consumo de combustible. Se observó que los vehículos con menor cilindrada y menor número de cilindros tienden a tener mejor rendimiento tanto en ciudad como en carretera. También se identificó que la mayoría de los vehículos pertenecen a las categorías de SUV y compactos, y que predomina el uso de gasolina regular como tipo de combustible. Gracias a las visualizaciones generadas, fue posible interpretar de manera sencilla cómo influyen variables como la transmisión, el tipo de tracción y el año de fabricación en el rendimiento de los automóviles. En general, el análisis cumplió con los objetivos planteados, permitiendo una exploración significativa de los datos y proporcionando una base sólida para futuras investigaciones más profundas sobre el rendimiento vehicular.