Logo de la Institución

Indice

I. Aspectos generales

1.1 Nombre de la organización y/o empresa (real o propuesta)

1.2 Misión y visión

1.3 Descripción del servicio/productos que se va a analizar

1.4 Problemática de estudio

II. Fundamentos básicos de la Estadística

2.1 Objetivo de estudio

2.2 Población de estudio

2.3 Muestra

2.4 Unidad de análisis

2.5 Tipo de muestreo a utilizar

III. Variables y tipo de variables

3.1 Importación al entorno de trabajo

3.2 Variables y descripción de cada variable

IV. Tablas estadísticas y gráficos adecuados (Considerar todos los estudiados)

4.1 Datos Simulados de Modelos y Precios

4.2 Gráfico de Barras: Distribución de Precios por Modelo de Carro

4.3 Histograma: Precios de Modelos de Carros

4.4Gráfico de Cajas: Distribución de Precios por Modelo de Carro

4.5 Gráfico de Densidad: Distribución de Precios por Modelo de Carro

4.6 Diagrama Circular: Distribución de Precios por Modelo

V. Medidas estadísticas (Considerar todas las medidas estudiadas)

5.1 Promedio del Precio

5.2 Promedio del Precio por Modelo

5.3 Media del Precio por Modelo

5.4 Mediana del Precio por Modelo

5.5 Tabla de Frecuencias del Precio por Modelo

5.6 Moda, Mediana y Media del Precio por Modelo

5.7 Rango del Precio

5.8 Varianza del Precio

5.9 Desviación Estándar del Precio

5.10 Coeficiente de Variación del Precio

5.11 Resumen Estadístico del Conjunto de Datos de Autos

5.12 Cuartiles de los Precios de los Carros

5.13 Cuartiles del Tiempo de Permanencia en el Sitio Web

5.14 Deciles de los Precios de los Carros

5.15 Percentiles de los Precios de los Carros

I. Aspectos generales

1.1 Nombre de la organización y/o empresa (real o propuesta)

Toyota_cars

1.2 Misión y visión

La misión de nuestro conjunto de datos es servir como un recurso integral y preciso para los datos relacionados con los modelos de vehículos de Toyota. Nos comprometemos a recopilar y mantener información detallada sobre precios, dimensiones, especificaciones técnicas y características clave de cada vehículo Toyota. Nuestra misión es facilitar decisiones informadas para los consumidores, proporcionando datos fiables y relevantes, y respaldar la toma de decisiones estratégicas en la gestión interna de la empresa.

La visión es posicionar nuestro conjunto de datos como la fuente líder en la industria automotriz, destacando por su exhaustividad y calidad. Aspiramos a ser reconocidos como el estándar de referencia para la información detallada sobre vehículos Toyota, contribuyendo a la satisfacción del cliente y alimentando la innovación en la industria. Buscamos continuamente expandir y mejorar nuestro conjunto de datos, anticipando las necesidades cambiantes del mercado y siendo una herramienta esencial para profesionales y entusiastas del automóvil.

1.3 Descripción del servicio/productos que se va a analizar

Este conjunto de datos abarca una extensa variedad de modelos de vehículos fabricados por Toyota, ofreciendo información detallada sobre precios, dimensiones, características técnicas y especificaciones clave. Desde automóviles convencionales hasta SUVs y vehículos comerciales, esta compilación exhaustiva permite a consumidores y profesionales de la industria automotriz analizar y comparar opciones de manera informada. Con detalles precisos sobre precios, dimensiones físicas, características técnicas y especificaciones clave, el conjunto de datos es esencial para compradores en busca de información detallada y para la toma de decisiones estratégicas dentro de la empresa, desde la planificación de inventario hasta estrategias de marketing.

1.4 Problemática de estudio

La problemática de estudio se centra en la optimización de estrategias de marketing y la satisfacción del cliente en la industria automotriz, específicamente en el contexto de la diversidad de modelos de vehículos de Toyota. Ante la amplia variedad de opciones, se plantea la necesidad de personalizar estrategias de marketing para segmentos específicos, considerando cómo las características técnicas influyen en las decisiones de compra. Además, se busca mejorar la satisfacción del cliente a lo largo del ciclo de vida del vehículo, desde la compra hasta el servicio postventa, aprovechando el análisis de competencia y la identificación de tendencias del mercado. Abordar esta problemática no solo fortalecerá la posición de Toyota en el mercado, sino que también contribuirá a la mejora continua de la experiencia del cliente en la industria automotriz.

II. Fundamentos básicos de la Estadística

2.1 Objetivo de estudio

Es analizar y aprovechar el conjunto de datos de modelos de vehículos de Toyota para mejorar estrategias de marketing y la satisfacción del cliente en la industria automotriz. Específicamente, se busca personalizar estrategias de marketing, comprender la influencia de las características técnicas en las decisiones de compra, optimizar la satisfacción del cliente a lo largo del ciclo de vida del vehículo, realizar análisis comparativos con la competencia, y detectar tendencias del mercado. Al alcanzar estos objetivos, se pretende ofrecer a Toyota herramientas informadas para la toma de decisiones estratégicas, fortaleciendo su posición en el mercado y elevando la experiencia global del cliente.

2.2 Población de estudio

Comprende la totalidad de los modelos de vehículos fabricados por Toyota, abarcando todas las categorías, desde automóviles convencionales hasta SUVs y vehículos comerciales. Esta amplia gama representa la oferta completa de la empresa en el mercado automotriz. La población incluirá todos los modelos disponibles en el conjunto de datos, considerando variables como precios, dimensiones, características técnicas y especificaciones clave. Al abordar la diversidad de la población, se busca obtener insights significativos que puedan ser aplicados de manera efectiva en estrategias de marketing y mejoras en la satisfacción del cliente.

2.3 Muestra

Se elegirán modelos de diversas categorías, representando tanto automóviles convencionales como SUVs y vehículos comerciales. La selección de la muestra se basará en criterios estratégicos, incluyendo la popularidad de los modelos, la variabilidad en precios, y la presencia de características técnicas distintivas. Se procurará que la muestra sea lo suficientemente diversa para abordar la problemática de estudio de manera integral. Analizar esta muestra proporcionará información específica y aplicable, permitiendo realizar inferencias significativas sobre el comportamiento general de la población de modelos de vehículos de Toyota.

2.4 Unidad de análisis

Cada modelo constituirá una entidad única y distintiva para el análisis, permitiendo examinar detalladamente sus precios, dimensiones, características técnicas y especificaciones clave. Al desglosar la población en unidades específicas, se facilitará una evaluación exhaustiva de cada modelo, identificando patrones y tendencias que contribuirán a la formulación de estrategias de marketing personalizadas y mejoras en la satisfacción del cliente. Esta enfoque permitirá una comprensión profunda de las características distintivas de cada modelo, así como la identificación de oportunidades para la optimización de prácticas comerciales y estrategias de ventas.

2.5 Tipo de muestreo a utilizar

Muestreo estratificado para garantizar una representación adecuada de la diversidad de modelos de vehículos de Toyota. La estratificación se llevará a cabo considerando las distintas categorías de vehículos, como automóviles convencionales, SUVs y vehículos comerciales, como estratos. Dentro de cada estrato, se seleccionarán modelos de manera aleatoria o mediante un método sistemático, considerando factores clave como la popularidad y la disponibilidad de datos detallados. Este enfoque permitirá capturar la variabilidad completa de la población, asegurando que la muestra refleje de manera precisa la diversidad de modelos presentes en el conjunto de datos.

III. Variables y tipo de variables

3.1 Importación al entorno de trabajo

# Instalar y cargar los paquetes necesarios
if (!require(ggplot2)) {
  install.packages("ggplot2")
  library(ggplot2)
}
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.2

3.2 Variables y descripción de cada variable

Model: El modelo del vehículo. Price: El precio del vehículo. Dimensions: Las dimensiones del vehículo, que incluyen longitud, ancho y altura. Wheelbase: La distancia entre ejes del vehículo. Seats: El número de asientos en el vehículo. Engine_Type: El tipo de motor del vehículo. Engine_Displacement: La cilindrada del motor del vehículo. Max_Output: La potencia máxima del motor. Max_Torque: El par máximo del motor. Fuel: El tipo de combustible que utiliza el vehículo. Power_Transmission: El tipo de transmisión del vehículo. Brake: El sistema de frenos del vehículo. Tires: Tipo de neumáticos del vehículo. Wheels_Size: Tamaño de las ruedas del vehículo.

IV. Tablas estadísticas y gráficos adecuados (Considerar todos los estudiados)

# Cargar los datos simulados de modelos y precios de carros de Toyota Cars
datos_carros <- data.frame(
  Modelo = c("Camry", "Corolla", "GR Yaris", "Prius", "Vios", "Wigo"),
  Precio = c(2355000, 1302000, 2740000, 2436000, 985000, 705000)
)
 
# Visualizar las primeras filas de los datos simulados de modelos y precios de Toyota Cars
head(datos_carros)
# Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Crear gráfico de barras para modelo y precio con colores
grafico_barras_modelo_precio <- ggplot(datos_carros, aes(x = Modelo, y = Precio, fill = Modelo)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Distribución de Precios por Modelo de Carro",
       x = "Modelo",
       y = "Precio",
       fill = "Modelo") +
  scale_fill_manual(values = c(
    "Camry" = "blue", 
    "Corolla" = "pink", 
    "GR Yaris" = "green",
    "Prius" = "purple",
    "Vios" = "orange",
    "Wigo" = "yellow"
  )) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
 
# Visualizar gráfico de barras
print(grafico_barras_modelo_precio)

# Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Crear histograma para los precios de los modelos de carros
histograma_precio <- ggplot(datos_carros, aes(x = Precio, fill = Modelo)) +
  geom_histogram(binwidth = 50000, position = "identity", alpha = 0.7) +
  labs(title = "Histograma de Precios de Modelos de Carros",
       x = "Precio",
       y = "Frecuencia",
       fill = "Modelo") +
  theme_minimal()
 
# Visualizar el histograma
print(histograma_precio)

# Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Crear gráfico de cajas para los precios de los modelos de carros
boxplot_precio <- ggplot(datos_carros, aes(x = Modelo, y = Precio)) +
  geom_boxplot() +
  labs(title = "Distribución de Precios por Modelo de Carro",
       x = "Modelo",
       y = "Precio") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
 
# Visualizar el gráfico de cajas
print(boxplot_precio)

# Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Crear gráfico de densidad para los precios de los modelos de carros
density_plot <- ggplot(datos_carros, aes(x = Precio, fill = Modelo)) +
  geom_density(alpha = 0.5) +
  labs(title = "Distribución de Densidad de Precios por Modelo de Carro",
       x = "Precio",
       y = "Densidad") +
  theme_minimal()
 
# Visualizar el gráfico de densidad
print(density_plot)
## Warning: Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

# Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Crear diagrama circular para modelo y precio
pie_chart_modelo_precio <- ggplot(datos_carros, aes(x = "", y = Precio, fill = Modelo)) +
  geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar("y") +
  labs(title = "Distribución de Precios por Modelo",
       fill = "Modelo") +
  theme_minimal() +
  theme(legend.position = "bottom")
 
# Visualizar diagrama circular
print(pie_chart_modelo_precio)

V. Medidas estadísticas (Considerar todas las medidas estudiadas)

# Calcular el promedio del precio
promedio_precio <- mean(datos_carros$Precio)
 
# Imprimir el resultado
print(promedio_precio)
## [1] 1753833
# Calcular el promedio del precio por modelo
promedio_precio_modelo <- aggregate(Precio ~ Modelo, data = datos_carros, mean)
 
# Imprimir el resultado
print(promedio_precio_modelo)
##     Modelo  Precio
## 1    Camry 2355000
## 2  Corolla 1302000
## 3 GR Yaris 2740000
## 4    Prius 2436000
## 5     Vios  985000
## 6     Wigo  705000
# Calcular la media del precio por modelo
media_precio_modelo <- tapply(datos_carros$Precio, datos_carros$Modelo, mean)
 
# Imprimir el resultado
print(media_precio_modelo)
##    Camry  Corolla GR Yaris    Prius     Vios     Wigo 
##  2355000  1302000  2740000  2436000   985000   705000
# Calcular la mediana del precio por modelo
mediana_precio_modelo <- tapply(datos_carros$Precio, datos_carros$Modelo, median)
 
# Imprimir el resultado
print(mediana_precio_modelo)
##    Camry  Corolla GR Yaris    Prius     Vios     Wigo 
##  2355000  1302000  2740000  2436000   985000   705000
# Tabla de frecuencias del precio por modelo
tabla_frecuencias_precio_modelo <- table(datos_carros$Modelo, datos_carros$Precio)
 
# Imprimir el resultado
print(tabla_frecuencias_precio_modelo)
##           
##            705000 985000 1302000 2355000 2436000 2740000
##   Camry         0      0       0       1       0       0
##   Corolla       0      0       1       0       0       0
##   GR Yaris      0      0       0       0       0       1
##   Prius         0      0       0       0       1       0
##   Vios          0      1       0       0       0       0
##   Wigo          1      0       0       0       0       0
calculate_mode_df <- function(data) {
  modes <- function(x) {
    uniqx <- unique(x)
    uniqx[which.max(tabulate(match(x, uniqx)))]
  }
 
  lapply(data, function(col) {
    if (is.numeric(col)) {
      list(mean = mean(col), median = median(col), mode = modes(col))
    } else {
      list(mode = modes(col))
    }
  })
}
 
# Aplicar la función a los datos de modelos y precios
resultados_moda <- calculate_mode_df(datos_carros[c("Modelo", "Precio")])
resultados_moda
## $Modelo
## $Modelo$mode
## [1] "Camry"
## 
## 
## $Precio
## $Precio$mean
## [1] 1753833
## 
## $Precio$median
## [1] 1828500
## 
## $Precio$mode
## [1] 2355000
# Opción 1
calculate_range <- function(data) {
  result <- lapply(data, function(col) {
    if (is.numeric(col)) {
      list(rango = max(col) - min(col))
    }
  })
  result
}
 
# Aplicar la función al precio de los autos
resultado_rango <- calculate_range(datos_carros$Precio)
resultado_rango
## [[1]]
## [[1]]$rango
## [1] 0
## 
## 
## [[2]]
## [[2]]$rango
## [1] 0
## 
## 
## [[3]]
## [[3]]$rango
## [1] 0
## 
## 
## [[4]]
## [[4]]$rango
## [1] 0
## 
## 
## [[5]]
## [[5]]$rango
## [1] 0
## 
## 
## [[6]]
## [[6]]$rango
## [1] 0
# Calcular la varianza del precio de los autos
varianza_precio <- var(datos_carros$Precio)
varianza_precio
## [1] 738917366667
# Calcular la desviación estándar del precio de los autos
desviacion_estandar_precio <- sd(datos_carros$Precio)
desviacion_estandar_precio
## [1] 859603
# Calcular el coeficiente de variación del precio de los autos
coeficiente_variacion <- sd(datos_carros$Precio) / mean(datos_carros$Precio)
coeficiente_variacion
## [1] 0.4901281
# Resumen estadístico para el conjunto de datos de autos
summary(datos_carros)
##     Modelo              Precio       
##  Length:6           Min.   : 705000  
##  Class :character   1st Qu.:1064250  
##  Mode  :character   Median :1828500  
##                     Mean   :1753833  
##                     3rd Qu.:2415750  
##                     Max.   :2740000
# Limpiar el espacio de trabajo
rm(list = ls())


# Cargar los datos
datos_carros <- read.csv("toyota_cars.csv", sep=",")

# Visualizar las primeras filas del conjunto de datos
head(datos_carros)
# Categorizar en 4 grupos los precios de los carros (cuartiles - 4 grupos)
quantile_precios <- quantile(datos_carros$Precio)
 
# Resultados
print(quantile_precios)
##   0%  25%  50%  75% 100% 
##   NA   NA   NA   NA   NA
# Interpretación
cat("Interpretación:\n")
## Interpretación:
cat("Cuartil 1 (Q1): $", quantile_precios[2], "\n")
## Cuartil 1 (Q1): $ NA
cat("Cuartil 2 (Q2): $", quantile_precios[3], "\n")
## Cuartil 2 (Q2): $ NA
cat("Cuartil 3 (Q3): $", quantile_precios[4], "\n")
## Cuartil 3 (Q3): $ NA
# Calcular cuartiles del tiempo de permanencia en el sitio web
quantile_tiempos <- quantile(datos_carros$Tiempo)
 
# Resultados
print(quantile_tiempos)
##   0%  25%  50%  75% 100% 
##   NA   NA   NA   NA   NA
# Interpretación
cat("Interpretación:\n")
## Interpretación:
cat("Cuartil 1 (Q1):", quantile_tiempos[2], "segundos\n")
## Cuartil 1 (Q1): NA segundos
cat("Cuartil 2 (Q2):", quantile_tiempos[3], "segundos\n")
## Cuartil 2 (Q2): NA segundos
cat("Cuartil 3 (Q3):", quantile_tiempos[4], "segundos\n")
## Cuartil 3 (Q3): NA segundos
# Dividir en 10 grupos (deciles) los precios de los carros
deciles_precios <- quantile(datos_carros$Precio, probs = seq(0, 1, 0.1))
 
# Resultados
print(deciles_precios)
##   0%  10%  20%  30%  40%  50%  60%  70%  80%  90% 100% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
# Dividir en 100 grupos (percentiles) los precios de los carros
percentiles_precios <- quantile(datos_carros$Precio, probs = seq(0, 1, 0.01))
 
# Resultados
print(percentiles_precios)
##   0%   1%   2%   3%   4%   5%   6%   7%   8%   9%  10%  11%  12%  13%  14%  15% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  16%  17%  18%  19%  20%  21%  22%  23%  24%  25%  26%  27%  28%  29%  30%  31% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  32%  33%  34%  35%  36%  37%  38%  39%  40%  41%  42%  43%  44%  45%  46%  47% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  48%  49%  50%  51%  52%  53%  54%  55%  56%  57%  58%  59%  60%  61%  62%  63% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  64%  65%  66%  67%  68%  69%  70%  71%  72%  73%  74%  75%  76%  77%  78%  79% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  80%  81%  82%  83%  84%  85%  86%  87%  88%  89%  90%  91%  92%  93%  94%  95% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  96%  97%  98%  99% 100% 
##   NA   NA   NA   NA   NA