El objetivo de este análisis estadístico en R-Studio es comprender en profundidad la estructura y contenido de una base de datos relacionada con carros. Esto involucra una revisión detallada de las variables en términos de su naturaleza, ya sean numéricas o de tipo caracter, la observación de estadísticas descriptivas básicas, la identificación de valores atípicos o datos faltantes, y finalmente, obtener una visión general de la información contenida en la base de datos a través de la representación gráfica de aspectos clave, como precios máximos, unidades vendidas, marcas más y menos populares, así como detalles específicos de los carros. Este análisis permitirá obtener información valiosa para la toma de decisiones y la comprensión más profunda de la base de datos sobre carros.
The objective of this statistical analysis in R-Studio is to gain a deep understanding of the structure and content of a database related to cars. This involves a detailed review of the variables in terms of their nature, whether they are numeric or character type, the observation of basic descriptive statistics, the identification of outliers or missing data, and finally, obtaining an overview of the information contained in the database through graphical representation of key aspects, such as maximum prices, units sold, more and less popular brands, as well as specific details of the cars. This analysis will provide valuable information for decision-making and a deeper understanding of the car database.
En la industria automotriz actual, el análisis de datos desempeña un
papel crucial en la comprensión de las tendencias del mercado, las
preferencias de los consumidores y el rendimiento de varios modelos de
automóviles. Al examinar este conjunto de datos de manera estadística en
R-Studio, el objetivo es adentrarnos en las complejidades del mercado
automotriz. Este análisis proporcionará información sobre las
características que influyen en las elecciones de los consumidores, como
el impacto de los precios, la popularidad de marcas específicas y las
características únicas de diferentes modelos de automóviles. Además,
exploraremos posibles valores atípicos o datos faltantes que puedan
afectar la calidad de nuestro análisis. A través de este proceso,
podremos descubrir información valiosa que será beneficiosa para tomar
decisiones informadas en el sector automotriz y mejorar nuestra
comprensión general del conjunto de datos de automóviles.
Para obtener buenos resultados, se realizaron diversos análisis y códigos:
## [1] "/Users/dangyiseo/Downloads"
dim(df)
## [1] 164 20
Podemos observar que esta base de datos cuenta con 164 filas, las cuales contienen información sobre 20 variables que componen a las columnas, así es como podemos señalar la cantidad de datos con los que se trabajará. Esta base de datos tiene unas dimensiones bastante aceptables para trabajar tranquilamente.
colnames(df)
## [1] "Car.Make" "Car.Model"
## [3] "Year" "Body.Type"
## [5] "Color.Options" "Fuel.Type"
## [7] "Engine.Size..L." "Horsepower"
## [9] "Torque..Nm." "Transmission.Type"
## [11] "Acceleration..0.60.mph." "Top.Speed..mph."
## [13] "Mileage..MPG." "Safety.Features"
## [15] "Entertainment.Features" "Interior.Features"
## [17] "Exterior.Features" "Price...."
## [19] "Customer.Ratings" "Sales.Figures..Units.Sold."
## [1] "Marca" "Modelo"
## [3] "Año" "Forma"
## [5] "Colores Disponibles" "Tipo de Combustible"
## [7] "Tamaño del Motor" "Caballos de Fuerza"
## [9] "Torque" "Tipo de Transmisión"
## [11] "Aceleración" "Velocidad Máxima"
## [13] "Kilometraje" "Seguridad"
## [15] "Entretenimiento" "Interior"
## [17] "Exterior" "Precio"
## [19] "Calificación del cliente" "Unidades Vendidas"
Para comprender las siguientes tablas: En Chevrolet el número 24 significa la cantidad de diferentes modelos de autos (NO de autos en total) que la marca vendió registrados en esta base de datos.
| Marca | Ventas |
|---|---|
| Chevrolet | 24 |
| Ford | 22 |
| Toyota | 19 |
| Honda | 11 |
| Kia | 11 |
| Hyundai | 10 |
| Subaru | 9 |
| GMC | 8 |
| Nissan | 7 |
| Genesis | 6 |
| Marca | Ventas |
|---|---|
| Infiniti | 1 |
| Acura | 2 |
| Tesla | 2 |
| Mercedes | 3 |
| Volkswagen | 3 |
| Volvo | 3 |
| Jeep | 4 |
| BMW | 4 |
| Mazda | 5 |
| Lexus | 5 |
| Audi | 5 |
Luego, se obtuvieron promedios, sumas de un total de datos, valores máximos y mínimos.
Además, se realizaron diferentes visualizaciones de datos con barplot y pie de las marcas de autos más y menos comprados, los años de los autos, forma y el tipo de combustible. Estas gráficas se muestran en la sección de RESULTADOS Y DISCUSIÓN.
También se calcularon tamaños máximos y se obtuvieron a los carros con un mayor tamaño de motor (L).
Se sustituyeron los NA por 0 para un correcto análisis de los datos,apoyando en el trabajo de calcular promedios y máximos.
Se reemplazaron datos de caracteres a números (as.numeric) por errores en la base de datos original.
Se calcularon porcentajes de manera manual.
En esta sección se explicaran e interpretaran las gráficas obtenidas del análisis de la base de datos.
##
## Acura Audi BMW Chevrolet Ford Genesis
## 2 5 4 24 22 6
## GMC Honda Hyundai Infiniti Jeep Kia
## 8 11 10 1 4 11
## Lexus Mazda Mercedes Nissan Subaru Tesla
## 5 5 3 7 9 2
## Toyota Volkswagen Volkswagen Volvo
## 19 1 2 3
## marcas_autos_top10
## 6 7 8 9 10 11 19 22 24
## 1 1 1 1 1 2 1 1 1
La marca de autos que más (+) vende sus diferentes modelos al
público general es Chevrolet.
## marcas_autos_top11r
## 1 2 3 4 5
## 1 2 3 2 3
La marca de autos que menos (-) vende sus diferentes modelos al público general es Infiniti.
Casi el total de todos los autos de esta base de datos son un modelo del año 2023, con un 98.78% y por otro lado, la minoría son de un modelo del año 2022 con el 1.22% restante.
## Warning: package 'ggplot2' was built under R version 4.3.1
##
## 2022 2023
## 2 162
También se realizó una gráfica para ver qué forma de autos prefiere el público general sin tomar en cuenta la marca o alguna otra característica.
##
## Convertible Coupe Hatchback Minivan Sedan
## 7 11 18 3 27
## SUV SUV SUV Truck Wagon
## 1 1 82 12 2
| Forma | Cantidad |
|---|---|
| Convertible | 7 |
| Coupe | 11 |
| Hatchback | 18 |
| Minivan | 3 |
| Sedan | 27 |
| SUV | 84 |
| Truck | 12 |
| Wagon | 2 |
Con lo que se obtuvo que poco más de la mitad de los autos
vendidos son de forma SUV, con un 51.22% del total.
##
## Electric Gasoline Hybrid
## 9 149 6
Y por último, se obtuvo una gráfica para conocer la proporción de los autos vendidos que utilizan gasolina, los que son eléctricos y los que son híbridos (los dos anteriores).
Como se mencionó en MÉTODOS, también se analizaron diversas cuestiones como el tamaño del motor (L), los caballos de fuerza, los precios y el total de unidades vendidas, obteniendo el tamaño promedio y máximo de cada una de las variables anteriores, pero estas características específicas se retoman en el apartado de CONCLUSIONES, así como el auto más vendido y el menos vendido entre todos.
Las conclusiones de este análisis fueron las siguientes:
El promedio entre los precios de todos los autos es de $603,814.592 MXN.
No se analizaron los autos más baratos ya que son varios modelos de diferentes marcas, por lo que la variabilidad es bastante.
Los autos más vendidos por modelo: Tesla Modelo 3 (4500 unidades). Aún cuando la marca no es la más vendida, la venta de este modelo es todo un éxito.
Los autos del año 2023 fueron los más vendidos, en comparación con los del año 2022.
La forma SUV de autos es la que más se adquiere.
En conclusión, la industria automotriz es un motor vital en la economía global y un componente fundamental de la vida moderna. A lo largo de las décadas, ha evolucionado significativamente, desde la creación de los primeros vehículos motorizados hasta la actualidad, donde los automóviles son más seguros, eficientes y avanzados tecnológicamente que nunca.
Los automóviles no solo han transformado la forma en que nos desplazamos, sino que también han tenido un impacto profundo en la cultura, la sociedad y el medio ambiente. Han brindado libertad de movimiento, han creado empleos y han impulsado la innovación en la industria. Sin embargo, también han contribuido a problemas como la congestión del tráfico, la contaminación del aire y la dependencia de los combustibles fósiles.
En un mundo en constante cambio, la industria automotriz se enfrenta a desafíos significativos, como la transición hacia vehículos eléctricos y la búsqueda de soluciones sostenibles. La demanda de tecnología de vehículos autónomos y la necesidad de reducir las emisiones de carbono están dando forma al futuro de los automóviles. A medida que la industria se adapta a estos desafíos, es fundamental equilibrar la innovación con la responsabilidad ambiental y la seguridad del consumidor.
En conclusión, los automóviles son mucho más que máquinas que nos llevan de un lugar a otro; son un símbolo de progreso, comodidad y poder. La industria automotriz ha recorrido un largo camino y, a medida que avanzamos hacia un futuro de movilidad más sostenible, la innovación y la colaboración serán clave. La interacción entre la industria, los gobiernos y la sociedad será fundamental para abordar los desafíos y oportunidades que se avecinan en el mundo de los automóviles.
Gracias a mi perro Rocko Almada por siempre acompañarme al realizar tarea, y a mi profesor por compartir sus conocimientos sobre el tema.
Base de datos anónima sobre autos extraída de Internet de la página Kaggle.