UNIVERSIDAD DE SONORA


Proyecto de Bioinformática


Licenciatura en Ciencias Genómicas


Danna Leticia Almada Bojórquez


Mtro. Jesús Arturo Vázquez Espinoza


RESUMEN

El objetivo de este análisis estadístico en R-Studio es comprender en profundidad la estructura y contenido de una base de datos relacionada con carros. Esto involucra una revisión detallada de las variables en términos de su naturaleza, ya sean numéricas o de tipo caracter, la observación de estadísticas descriptivas básicas, la identificación de valores atípicos o datos faltantes, y finalmente, obtener una visión general de la información contenida en la base de datos a través de la representación gráfica de aspectos clave, como precios máximos, unidades vendidas, marcas más y menos populares, así como detalles específicos de los carros. Este análisis permitirá obtener información valiosa para la toma de decisiones y la comprensión más profunda de la base de datos sobre carros.

ABSTRACT

The objective of this statistical analysis in R-Studio is to gain a deep understanding of the structure and content of a database related to cars. This involves a detailed review of the variables in terms of their nature, whether they are numeric or character type, the observation of basic descriptive statistics, the identification of outliers or missing data, and finally, obtaining an overview of the information contained in the database through graphical representation of key aspects, such as maximum prices, units sold, more and less popular brands, as well as specific details of the cars. This analysis will provide valuable information for decision-making and a deeper understanding of the car database.

INTRODUCCIÓN

En la industria automotriz actual, el análisis de datos desempeña un papel crucial en la comprensión de las tendencias del mercado, las preferencias de los consumidores y el rendimiento de varios modelos de automóviles. Al examinar este conjunto de datos de manera estadística en R-Studio, el objetivo es adentrarnos en las complejidades del mercado automotriz. Este análisis proporcionará información sobre las características que influyen en las elecciones de los consumidores, como el impacto de los precios, la popularidad de marcas específicas y las características únicas de diferentes modelos de automóviles. Además, exploraremos posibles valores atípicos o datos faltantes que puedan afectar la calidad de nuestro análisis. A través de este proceso, podremos descubrir información valiosa que será beneficiosa para tomar decisiones informadas en el sector automotriz y mejorar nuestra comprensión general del conjunto de datos de automóviles.



MÉTODOS

Para obtener buenos resultados, se realizaron diversos análisis y códigos:

  • Primero se cambió el directorio del archivo al deseado con la función setwd().
## [1] "/Users/dangyiseo/Downloads"
  • Se calcularon las filas (164) y columnas (20) que conforman a la base de datos.
dim(df)
## [1] 164  20

Podemos observar que esta base de datos cuenta con 164 filas, las cuales contienen información sobre 20 variables que componen a las columnas, así es como podemos señalar la cantidad de datos con los que se trabajará. Esta base de datos tiene unas dimensiones bastante aceptables para trabajar tranquilamente.

  • Después, se obtuvieron los nombres de las columnas para conocer las distintas variables con las que se trabajará.
colnames(df)
##  [1] "Car.Make"                   "Car.Model"                 
##  [3] "Year"                       "Body.Type"                 
##  [5] "Color.Options"              "Fuel.Type"                 
##  [7] "Engine.Size..L."            "Horsepower"                
##  [9] "Torque..Nm."                "Transmission.Type"         
## [11] "Acceleration..0.60.mph."    "Top.Speed..mph."           
## [13] "Mileage..MPG."              "Safety.Features"           
## [15] "Entertainment.Features"     "Interior.Features"         
## [17] "Exterior.Features"          "Price...."                 
## [19] "Customer.Ratings"           "Sales.Figures..Units.Sold."
  • Asimismo, se cambiaron los nombres de las variables de inglés a español para una mejor comprensión.
##  [1] "Marca"                    "Modelo"                  
##  [3] "Año"                      "Forma"                   
##  [5] "Colores Disponibles"      "Tipo de Combustible"     
##  [7] "Tamaño del Motor"         "Caballos de Fuerza"      
##  [9] "Torque"                   "Tipo de Transmisión"     
## [11] "Aceleración"              "Velocidad Máxima"        
## [13] "Kilometraje"              "Seguridad"               
## [15] "Entretenimiento"          "Interior"                
## [17] "Exterior"                 "Precio"                  
## [19] "Calificación del cliente" "Unidades Vendidas"
  • Por otra parte, se crearon sub-tablas para un análisis más eficaz de los datos.

Para comprender las siguientes tablas: En Chevrolet el número 24 significa la cantidad de diferentes modelos de autos (NO de autos en total) que la marca vendió registrados en esta base de datos.

NÚMERO DE MODELOS MÁS (+) VENDIDOS POR MARCA:

Marca Ventas
Chevrolet 24
Ford 22
Toyota 19
Honda 11
Kia 11
Hyundai 10
Subaru 9
GMC 8
Nissan 7
Genesis 6

NÚMERO DE MODELOS MENOS (-) VENDIDOS POR MARCA:

Marca Ventas
Infiniti 1
Acura 2
Tesla 2
Mercedes 3
Volkswagen 3
Volvo 3
Jeep 4
BMW 4
Mazda 5
Lexus 5
Audi 5


  • Luego, se obtuvieron promedios, sumas de un total de datos, valores máximos y mínimos.

  • Además, se realizaron diferentes visualizaciones de datos con barplot y pie de las marcas de autos más y menos comprados, los años de los autos, forma y el tipo de combustible. Estas gráficas se muestran en la sección de RESULTADOS Y DISCUSIÓN.

  • También se calcularon tamaños máximos y se obtuvieron a los carros con un mayor tamaño de motor (L).

  • Se sustituyeron los NA por 0 para un correcto análisis de los datos,apoyando en el trabajo de calcular promedios y máximos.

  • Se reemplazaron datos de caracteres a números (as.numeric) por errores en la base de datos original.

  • Se calcularon porcentajes de manera manual.

RESULTADOS Y DISCUSIÓN

En esta sección se explicaran e interpretaran las gráficas obtenidas del análisis de la base de datos.

## 
##    Acura        Audi         BMW          Chevrolet    Ford         Genesis   
##            2            5            4           24           22            6 
##    GMC          Honda        Hyundai      Infiniti     Jeep         Kia       
##            8           11           10            1            4           11 
##    Lexus        Mazda        Mercedes     Nissan       Subaru       Tesla     
##            5            5            3            7            9            2 
##    Toyota      Volkswagen  Volkswagen     Volvo     
##           19            1            2            3
## marcas_autos_top10
##  6  7  8  9 10 11 19 22 24 
##  1  1  1  1  1  2  1  1  1


La marca de autos que más (+) vende sus diferentes modelos al público general es Chevrolet.



## marcas_autos_top11r
## 1 2 3 4 5 
## 1 2 3 2 3

La marca de autos que menos (-) vende sus diferentes modelos al público general es Infiniti.


Casi el total de todos los autos de esta base de datos son un modelo del año 2023, con un 98.78% y por otro lado, la minoría son de un modelo del año 2022 con el 1.22% restante.

## Warning: package 'ggplot2' was built under R version 4.3.1
## 
## 2022 2023 
##    2  162

También se realizó una gráfica para ver qué forma de autos prefiere el público general sin tomar en cuenta la marca o alguna otra característica.

## 
##  Convertible     Coupe         Hatchback     Minivan       Sedan      
##             7            11            18             3            27 
##       SUV         SUV          SUV           Truck         Wagon      
##             1             1            82            12             2

Forma Cantidad
Convertible 7
Coupe 11
Hatchback 18
Minivan 3
Sedan 27
SUV 84
Truck 12
Wagon 2


Con lo que se obtuvo que poco más de la mitad de los autos vendidos son de forma SUV, con un 51.22% del total.

## 
##  Electric    Gasoline    Hybrid     
##           9         149           6

Y por último, se obtuvo una gráfica para conocer la proporción de los autos vendidos que utilizan gasolina, los que son eléctricos y los que son híbridos (los dos anteriores).

Como se mencionó en MÉTODOS, también se analizaron diversas cuestiones como el tamaño del motor (L), los caballos de fuerza, los precios y el total de unidades vendidas, obteniendo el tamaño promedio y máximo de cada una de las variables anteriores, pero estas características específicas se retoman en el apartado de CONCLUSIONES, así como el auto más vendido y el menos vendido entre todos.

CONCLUSIONES

Las conclusiones de este análisis fueron las siguientes:

  • Se vendieron un total de 272,840 unidades de autos.


  • El auto más caro tiene un precio de $1,742,128.5 MXN, el cual también es el menos vendido, por lo que se infiere que esto se debe al precio tan alto por el que se vende.


  • El promedio entre los precios de todos los autos es de $603,814.592 MXN.

  • No se analizaron los autos más baratos ya que son varios modelos de diferentes marcas, por lo que la variabilidad es bastante.

  • Los autos más vendidos por modelo: Tesla Modelo 3 (4500 unidades). Aún cuando la marca no es la más vendida, la venta de este modelo es todo un éxito.


  • Como ya se mencionó, los autos más vendidos por marca: Chevrolet. Muchísimos modelos diferentes de esta marca son vendidos, pero aún así no fueron los más vendidos según un modelo en específico, solo como marca en general.


  • Los autos menos vendidos por modelo: Mercedes Clase-S (400 unidades). Lo que coincide con ser el auto más caro, brindándole un respaldo al ser el menos vendido ya que es el menos accesible en precio.


  • Los autos menos vendidos por marca: Infiniti. Este auto no es muy vendido tampoco en diversos modelos, por lo que es el que tiene más desventajas en ventas.


  • El Corvette es el auto con mayor aceleración (0-60 MPH) con 3.1 segundos, seguido del Camaro con 3.5 segundos.


  • Los autos con la velocidad máxima más alta son los Corvette y Camaro de Chevrolet, con un máximo de 190 MPH.


  • El Camaro es el auto con mayores caballos de fuerza (medida de potencia) con un máximo de 650. El promedio de caballos de fuerza es de 226.4695.


  • El tamaño promedio de motor (L) es de 2.47 y el tamaño máximo es de 6.2, donde destacan los autos de Chevrolet (Corvette y Camaro) y de GMC (Sierra).


  • Los autos del año 2023 fueron los más vendidos, en comparación con los del año 2022.

  • La forma SUV de autos es la que más se adquiere.


  • La forma Wagon es la que menos se vende.


  • Solo un poco porcentaje de autos son eléctricos (5.49%) y menos son híbridos (3.66%). El 90.85% utilizan gasolina.

En conclusión, la industria automotriz es un motor vital en la economía global y un componente fundamental de la vida moderna. A lo largo de las décadas, ha evolucionado significativamente, desde la creación de los primeros vehículos motorizados hasta la actualidad, donde los automóviles son más seguros, eficientes y avanzados tecnológicamente que nunca.

Los automóviles no solo han transformado la forma en que nos desplazamos, sino que también han tenido un impacto profundo en la cultura, la sociedad y el medio ambiente. Han brindado libertad de movimiento, han creado empleos y han impulsado la innovación en la industria. Sin embargo, también han contribuido a problemas como la congestión del tráfico, la contaminación del aire y la dependencia de los combustibles fósiles.

En un mundo en constante cambio, la industria automotriz se enfrenta a desafíos significativos, como la transición hacia vehículos eléctricos y la búsqueda de soluciones sostenibles. La demanda de tecnología de vehículos autónomos y la necesidad de reducir las emisiones de carbono están dando forma al futuro de los automóviles. A medida que la industria se adapta a estos desafíos, es fundamental equilibrar la innovación con la responsabilidad ambiental y la seguridad del consumidor.

En conclusión, los automóviles son mucho más que máquinas que nos llevan de un lugar a otro; son un símbolo de progreso, comodidad y poder. La industria automotriz ha recorrido un largo camino y, a medida que avanzamos hacia un futuro de movilidad más sostenible, la innovación y la colaboración serán clave. La interacción entre la industria, los gobiernos y la sociedad será fundamental para abordar los desafíos y oportunidades que se avecinan en el mundo de los automóviles.

AGRADECIMIENTOS

Gracias a mi perro Rocko Almada por siempre acompañarme al realizar tarea, y a mi profesor por compartir sus conocimientos sobre el tema.

REFERENCIAS

Base de datos anónima sobre autos extraída de Internet de la página Kaggle.