Logo de la Institución Zegel
Logo de la Institución Zegel

Indice

I. Aspectos generales

1.1 Nombre de la organización y/o empresa (real o propuesta)

1.2 Misión y visión

1.3 Descripción del servicio/productos que se va a analizar

1.4 Problemática de estudio

II. Fundamentos básicos de la Estadística

2.1 Objetivo de estudio

2.2 Población de estudio

2.3 Muestra

2.4 Unidad de análisis

2.5 Tipo de muestreo a utilizar

III. Variables y tipo de variables

3.1 Importación al entorno de trabajo

3.2 Variables y descripción de cada variable

IV. Tablas estadísticas y gráficos adecuados (Considerar todos los estudiados)

4.1 Datos Simulados de Modelos y Precios

4.2 Gráfico de Barras: Distribución de Precios por Modelo de Carro

4.3 Histograma: Precios de Modelos de Carros

4.4Gráfico de Cajas: Distribución de Precios por Modelo de Carro

4.5 Gráfico de Densidad: Distribución de Precios por Modelo de Carro

4.6 Diagrama Circular: Distribución de Precios por Modelo

V. Medidas estadísticas (Considerar todas las medidas estudiadas)

5.1 Promedio del Precio

5.2 Promedio del Precio por Modelo

5.3 Media del Precio por Modelo

5.4 Mediana del Precio por Modelo

5.5 Tabla de Frecuencias del Precio por Modelo

5.6 Moda, Mediana y Media del Precio por Modelo

5.7 Rango del Precio

5.8 Varianza del Precio

5.9 Desviación Estándar del Precio

5.10 Coeficiente de Variación del Precio

5.11 Resumen Estadístico del Conjunto de Datos de Autos

5.12 Cuartiles de los Precios de los Carros

5.13 Cuartiles del Tiempo de Permanencia en el Sitio Web

5.14 Deciles de los Precios de los Carros

5.15 Percentiles de los Precios de los Carros

I. Aspectos generales

1.1 Nombre de la organización y/o empresa (real o propuesta)

        *Toyota_cars*

1.2 Misión y visión

La misión La misión de nuestro conjunto de datos es servir como un recurso integral y preciso para la información relacionada con los modelos de vehículos de Toyota. Nos comprometemos a recopilar y mantener datos detallados sobre precios, dimensiones, especificaciones técnicas y características clave de cada vehículo Toyota.

—-Nuestra misión es:—-

Facilitar Decisiones Informadas para los Consumidores: Proporcionar a los consumidores datos fiables y relevantes que les permitan tomar decisiones informadas al elegir un vehículo Toyota. Desde precios hasta especificaciones técnicas, nuestro conjunto de datos busca ser una fuente confiable para aquellos que buscan comprar un vehículo.

Apoyar la Toma de Decisiones Estratégicas Internas: Contribuir al proceso de toma de decisiones estratégicas dentro de la empresa Toyota. Al ofrecer información detallada sobre los modelos de vehículos, nuestro conjunto de datos se convierte en una herramienta valiosa para la gestión interna, respaldando la planificación y el desarrollo de productos.

Proporcionar Datos Precisos y Actualizados: Mantener el conjunto de datos actualizado y preciso, asegurando que la información refleje las últimas especificaciones y características de los vehículos Toyota. Esto garantiza que tanto los consumidores como la empresa tengan acceso a información relevante y confiable.

Fomentar la Transparencia y Confianza: Operar con transparencia en la recopilación y presentación de datos, promoviendo la confianza tanto entre los consumidores como dentro de la empresa. Nuestro objetivo es ser una fuente confiable y objetiva de información sobre los vehículos Toyota.

La visión Posicionar nuestro conjunto de datos como la fuente líder en la industria automotriz, destacando por su exhaustividad y calidad. Aspiramos a ser reconocidos como el estándar de referencia para la información detallada sobre vehículos Toyota, contribuyendo a la satisfacción del cliente y alimentando la innovación en la industria. Buscamos continuamente expandir y mejorar nuestro conjunto de datos, anticipando las necesidades cambiantes del mercado y siendo una herramienta esencial para profesionales y entusiastas del automóvil.

1.3 Descripción del servicio/productos que se va a analizar

Conjunto de datos abarca una extensa variedad de modelos de vehículos fabricados por Toyota, ofreciendo información detallada sobre precios, dimensiones, características técnicas y especificaciones clave. Desde automóviles convencionales hasta SUVs y vehículos comerciales, esta compilación exhaustiva permite a consumidores y profesionales de la industria automotriz analizar y comparar opciones de manera informada. Con detalles precisos sobre precios, dimensiones físicas, características técnicas y especificaciones clave, el conjunto de datos es esencial para compradores en busca de información detallada y para la toma de decisiones estratégicas dentro de la empresa, desde la planificación de inventario hasta estrategias de marketing.

1.4 Problemática de estudio

Se centra en la optimización de estrategias de marketing y la satisfacción del cliente en la industria automotriz, específicamente en el contexto de la diversidad de modelos de vehículos de Toyota. Ante la amplia variedad de opciones, se plantea la necesidad de personalizar estrategias de marketing para segmentos específicos, considerando cómo las características técnicas influyen en las decisiones de compra. Además, se busca mejorar la satisfacción del cliente a lo largo del ciclo de vida del vehículo, desde la compra hasta el servicio postventa, aprovechando el análisis de competencia y la identificación de tendencias del mercado. Abordar esta problemática no solo fortalecerá la posición de Toyota en el mercado, sino que también contribuirá a la mejora continua de la experiencia del cliente en la industria automotriz.

II. Fundamentos básicos de la Estadística

2.1 Objetivo de estudio

Analizar y aprovechar el conjunto de datos de modelos de vehículos de Toyota para mejorar estrategias de marketing y la satisfacción del cliente en la industria automotriz. Específicamente, se busca personalizar estrategias de marketing, comprender la influencia de las características técnicas en las decisiones de compra, optimizar la satisfacción del cliente a lo largo del ciclo de vida del vehículo, realizar análisis comparativos con la competencia, y detectar tendencias del mercado. Al alcanzar estos objetivos, se pretende ofrecer a Toyota herramientas informadas para la toma de decisiones estratégicas, fortaleciendo su posición en el mercado y elevando la experiencia global del cliente.

2.2 Población de estudio

Comprende la totalidad de los modelos de vehículos fabricados por Toyota, abarcando todas las categorías, desde automóviles convencionales hasta SUVs y vehículos comerciales. Esta amplia gama representa la oferta completa de la empresa en el mercado automotriz. La población incluirá todos los modelos disponibles en el conjunto de datos, considerando variables como precios, dimensiones, características técnicas y especificaciones clave. Al abordar la diversidad de la población, se busca obtener insights significativos que puedan ser aplicados de manera efectiva en estrategias de marketing y mejoras en la satisfacción del cliente.

2.3 Muestra

Se elegirán modelos de diversas categorías, representando tanto automóviles convencionales como SUVs y vehículos comerciales. La selección de la muestra se basará en criterios estratégicos, incluyendo la popularidad de los modelos, la variabilidad en precios, y la presencia de características técnicas distintivas. Se procurará que la muestra sea lo suficientemente diversa para abordar la problemática de estudio de manera integral. Analizar esta muestra proporcionará información específica y aplicable, permitiendo realizar inferencias significativas sobre el comportamiento general de la población de modelos de vehículos de Toyota.

2.4 Unidad de análisis

Cada modelo constituirá una entidad única y distintiva para el análisis, permitiendo examinar detalladamente sus precios, dimensiones, características técnicas y especificaciones clave. Al desglosar la población en unidades específicas, se facilitará una evaluación exhaustiva de cada modelo, identificando patrones y tendencias que contribuirán a la formulación de estrategias de marketing personalizadas y mejoras en la satisfacción del cliente. Esta enfoque permitirá una comprensión profunda de las características distintivas de cada modelo, así como la identificación de oportunidades para la optimización de prácticas comerciales y estrategias de ventas.

2.5 Tipo de muestreo a utilizar

Garantizar una representación adecuada de la diversidad de modelos de vehículos de Toyota. La estratificación se llevará a cabo considerando las distintas categorías de vehículos, como automóviles convencionales, SUVs y vehículos comerciales, como estratos. Dentro de cada estrato, se seleccionarán modelos de manera aleatoria o mediante un método sistemático, considerando factores clave como la popularidad y la disponibilidad de datos detallados. Este enfoque permitirá capturar la variabilidad completa de la población, asegurando que la muestra refleje de manera precisa la diversidad de modelos presentes en el conjunto de datos.

III. Variables y tipo de variables

3.2 Variables y descripción de cada variable

Cualitativas:

Model (Modelo): Cualitativa nominal. Representa distintos modelos de vehículos, y no hay un orden inherente entre ellos.

Engine_Type (Tipo de motor): Cualitativa nominal. Indica el tipo de motor del vehículo, como gasolina, diésel, eléctrico, etc.

Fuel (Tipo de combustible): Cualitativa nominal. Describe el tipo de combustible que utiliza el vehículo, como gasolina, diésel, híbrido, etc.

Power_Transmission (Tipo de transmisión): Cualitativa nominal. Representa el tipo de transmisión del vehículo, como automática, manual, CVT, etc.

Brake (Sistema de frenos): Cualitativa nominal. Indica el sistema de frenos del vehículo, como ABS, frenos de disco, frenos de tambor, etc.

Tires (Tipo de neumáticos): Cualitativa nominal. Describe el tipo de neumáticos que tiene el vehículo, como radiales, de verano, de invierno, etc.

Cuantitativas:

Price (Precio): Cuantitativa continua. Representa el valor numérico del precio del vehículo.

Dimensions (Dimensiones): Cuantitativa continua. Incluye las medidas de longitud, ancho y altura del vehículo, que son valores numéricos.

Wheelbase (Distancia entre ejes): Cuantitativa continua. Representa la distancia entre ejes del vehículo en unidades numéricas.

Seats (Número de asientos): Cuantitativa discreta. Indica el número de asientos en el vehículo, que toma valores enteros.

Engine_Displacement (Cilindrada del motor): Cuantitativa continua. Representa la capacidad del motor en unidades numéricas.

Max_Output (Potencia máxima del motor): Cuantitativa continua. Indica la potencia máxima del motor en unidades numéricas.

Max_Torque (Par máximo del motor): Cuantitativa continua. Representa el par máximo del motor en unidades numéricas.

Wheels_Size (Tamaño de las ruedas): Cuantitativa discreta. Indica el tamaño de las ruedas del vehículo, que toma valores específicos.

IV. Tablas estadísticas y gráficos adecuados (Considerar todos los estudiados)

###### Cargar los datos de modelos y precios de carros de Toyota 
datos_carros <- data.frame(
  Modelo = c("Camry", "Corolla", "GR Yaris", "Prius", "Vios", "Wigo"),
  Precio = c(2355000, 1302000, 2740000, 2436000, 985000, 705000)
)

###### Visualizar las primeras filas de los datos simulados de modelos y precios de Toyota
head(datos_carros)
###### Cargar librería ggplot2 para visualización de datos
library(ggplot2)
# Crear un gráfico de barras con colores para modelo y precio
bar_plot_colores <- ggplot(datos_carros, aes(x = Modelo, y = Precio, fill = Modelo)) +
  geom_bar(stat = "identity") +
  labs(title = "Precios por Modelo de Carro",
       x = "Modelo",
       y = "Precio",
       fill = "Modelo") +
  scale_fill_manual(values = rainbow(length(unique(datos_carros$Modelo)))) +  # Asignar colores automáticamente
  theme_minimal()

# Visualizar el gráfico de barras con colores
print(bar_plot_colores)

###### Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Crear un histograma con colores
grafico_histograma <- ggplot(datos_carros, aes(x = Precio, fill = Modelo)) +
  geom_histogram(binwidth = 100000, position = "identity", alpha = 0.7) +
  labs(title = "Histograma: Distribución de Precios por Modelo de Carro",
       x = "Precio",
       y = "Frecuencia") +
  theme_minimal() +
  scale_fill_manual(values = c("#81D4FA", "#BB8FCE", "#F9E79F", "#48C9B0", "#E91E63", "#FF8A65"))

# Imprimir el gráfico
print(grafico_histograma)

###### Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
#Gráfico de cajas con colores
grafico_cajas <- ggplot(datos_carros, aes(x = Modelo, y = Precio, fill = Modelo)) +
  geom_boxplot() +
  labs(title = "Gráfico de Cajas: Distribución de Precios por Modelo de Carro",
       x = "Modelo",
       y = "Precio") +
  theme_minimal() +
  scale_fill_manual(values = c("#E41A1C", "#33FFFF", "#FF00FF", "#00FF33", "#FFC20A", "#33FFCC"))

# Imprimir el gráfico
print(grafico_cajas)

 # Crear gráfico de densidad para los precios de los modelos de carros
density_plot <- ggplot(datos_carros, aes(x = Precio, fill = Modelo)) +
  geom_density(alpha = 0.5) +
  labs(title = "Distribución de Densidad de Precios por Modelo de Carro",
       x = "Precio",
       y = "Densidad") +
  theme_minimal()
 
# Visualizar el gráfico de densidad
print(density_plot)
## Warning: Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

## Warning in max(ids, na.rm = TRUE): ningun argumento finito para max; retornando
## -Inf

###### Cargar librería ggplot2 para visualización de datos
library(ggplot2)
 
# Gráfico circular con colores
grafico_circular <- ggplot(datos_carros, aes(x = "", y = Precio, fill = Modelo)) +
  geom_bar(stat = "identity", width = 2, color = "black") +
  coord_polar("y") +
  theme_void() +
  scale_fill_manual(values = c("#E41A1C", "#33FFFF", "#FF00FF", "#00FF33", "#FFC20A", "#33FFCC"))

# Imprimir el gráfico
print(grafico_circular)

V. Medidas estadísticas (Considerar todas las medidas estudiadas)

###### Calcular el promedio del precio
promedio_precio <- mean(datos_carros$Precio)
 
###### Imprimir el resultado
print(promedio_precio)
## [1] 1753833
###### Calcular el promedio del precio por modelo
promedio_precio_modelo <- aggregate(Precio ~ Modelo, data = datos_carros, mean)
 
###### Imprimir el resultado
print(promedio_precio_modelo)
##     Modelo  Precio
## 1    Camry 2355000
## 2  Corolla 1302000
## 3 GR Yaris 2740000
## 4    Prius 2436000
## 5     Vios  985000
## 6     Wigo  705000
###### Calcular la media del precio por modelo
media_precio_modelo <- tapply(datos_carros$Precio, datos_carros$Modelo, mean)
 
###### Imprimir el resultado
print(media_precio_modelo)
##    Camry  Corolla GR Yaris    Prius     Vios     Wigo 
##  2355000  1302000  2740000  2436000   985000   705000
###### Calcular la mediana del precio por modelo
mediana_precio_modelo <- tapply(datos_carros$Precio, datos_carros$Modelo, median)
 
###### Imprimir el resultado
print(mediana_precio_modelo)
##    Camry  Corolla GR Yaris    Prius     Vios     Wigo 
##  2355000  1302000  2740000  2436000   985000   705000
###### Tabla de frecuencias del precio por modelo
tabla_frecuencias_precio_modelo <- table(datos_carros$Modelo, datos_carros$Precio)
 
###### Imprimir el resultado
print(tabla_frecuencias_precio_modelo)
##           
##            705000 985000 1302000 2355000 2436000 2740000
##   Camry         0      0       0       1       0       0
##   Corolla       0      0       1       0       0       0
##   GR Yaris      0      0       0       0       0       1
##   Prius         0      0       0       0       1       0
##   Vios          0      1       0       0       0       0
##   Wigo          1      0       0       0       0       0
calculate_mode_df <- function(data) {
  modes <- function(x) {
    uniqx <- unique(x)
    uniqx[which.max(tabulate(match(x, uniqx)))]
  }
 
  lapply(data, function(col) {
    if (is.numeric(col)) {
      list(mean = mean(col), median = median(col), mode = modes(col))
    } else {
      list(mode = modes(col))
    }
  })
}
 
###### Aplicar la función a los datos de modelos y precios
resultados_moda <- calculate_mode_df(datos_carros[c("Modelo", "Precio")])
resultados_moda
## $Modelo
## $Modelo$mode
## [1] "Camry"
## 
## 
## $Precio
## $Precio$mean
## [1] 1753833
## 
## $Precio$median
## [1] 1828500
## 
## $Precio$mode
## [1] 2355000
# Opción 1
calculate_range <- function(data) {
  result <- lapply(data, function(col) {
    if (is.numeric(col)) {
      list(rango = max(col) - min(col))
    }
  })
  result
}
 
###### Aplicar la función al precio de los autos
resultado_rango <- calculate_range(datos_carros$Precio)
resultado_rango
## [[1]]
## [[1]]$rango
## [1] 0
## 
## 
## [[2]]
## [[2]]$rango
## [1] 0
## 
## 
## [[3]]
## [[3]]$rango
## [1] 0
## 
## 
## [[4]]
## [[4]]$rango
## [1] 0
## 
## 
## [[5]]
## [[5]]$rango
## [1] 0
## 
## 
## [[6]]
## [[6]]$rango
## [1] 0
###### Calcular la varianza del precio de los autos
varianza_precio <- var(datos_carros$Precio)
varianza_precio
## [1] 738917366667
###### Calcular la desviación estándar del precio de los autos
desviacion_estandar_precio <- sd(datos_carros$Precio)
desviacion_estandar_precio
## [1] 859603
###### Calcular el coeficiente de variación del precio de los autos
coeficiente_variacion <- sd(datos_carros$Precio) / mean(datos_carros$Precio)
coeficiente_variacion
## [1] 0.4901281
###### Resumen estadístico para el conjunto de datos de autos
summary(datos_carros)
##     Modelo              Precio       
##  Length:6           Min.   : 705000  
##  Class :character   1st Qu.:1064250  
##  Mode  :character   Median :1828500  
##                     Mean   :1753833  
##                     3rd Qu.:2415750  
##                     Max.   :2740000
###### Limpiar el espacio de trabajo
rm(list = ls())

###### Establecer el directorio de trabajo
setwd("F:/4 Ciclo zegel/C05-Estadística Aplicada a la Computación/Ejercicios de Rstudio/Practica calificada")

###### Cargar los datos
datos_carros <- read.csv("toyota.csv", sep=",")

###### Visualizar las primeras filas del conjunto de datos
head(datos_carros)
###### Categorizar en 4 grupos los precios de los carros (cuartiles - 4 grupos)
quantile_precios <- quantile(datos_carros$Precio)
 
###### Resultados
print(quantile_precios)
##   0%  25%  50%  75% 100% 
##   NA   NA   NA   NA   NA
###### Interpretación
cat("Interpretación:\n")
## Interpretación:
cat("Cuartil 1 (Q1): $", quantile_precios[2], "\n")
## Cuartil 1 (Q1): $ NA
cat("Cuartil 2 (Q2): $", quantile_precios[3], "\n")
## Cuartil 2 (Q2): $ NA
cat("Cuartil 3 (Q3): $", quantile_precios[4], "\n")
## Cuartil 3 (Q3): $ NA
###### Calcular cuartiles del tiempo de permanencia en el sitio web
quantile_tiempos <- quantile(datos_carros$Tiempo)
 
###### Resultados
print(quantile_tiempos)
##   0%  25%  50%  75% 100% 
##   NA   NA   NA   NA   NA
###### Interpretación
cat("Interpretación:\n")
## Interpretación:
cat("Cuartil 1 (Q1):", quantile_tiempos[2], "segundos\n")
## Cuartil 1 (Q1): NA segundos
cat("Cuartil 2 (Q2):", quantile_tiempos[3], "segundos\n")
## Cuartil 2 (Q2): NA segundos
cat("Cuartil 3 (Q3):", quantile_tiempos[4], "segundos\n")
## Cuartil 3 (Q3): NA segundos
###### Dividir en 10 grupos (deciles) los precios de los carros
deciles_precios <- quantile(datos_carros$Precio, probs = seq(0, 1, 0.1))
 
###### Resultados
print(deciles_precios)
##   0%  10%  20%  30%  40%  50%  60%  70%  80%  90% 100% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
# Eliminar valores faltantes en la columna de precios
datos_carros <- datos_carros[!is.na(datos_carros$Precio), ]

# Dividir en 100 grupos (percentiles) los precios de los carros
percentiles_precios <- quantile(datos_carros$Precio, probs = seq(0, 1, 0.01), na.rm = TRUE)

# Resultados
print(percentiles_precios)
##   0%   1%   2%   3%   4%   5%   6%   7%   8%   9%  10%  11%  12%  13%  14%  15% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  16%  17%  18%  19%  20%  21%  22%  23%  24%  25%  26%  27%  28%  29%  30%  31% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  32%  33%  34%  35%  36%  37%  38%  39%  40%  41%  42%  43%  44%  45%  46%  47% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  48%  49%  50%  51%  52%  53%  54%  55%  56%  57%  58%  59%  60%  61%  62%  63% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  64%  65%  66%  67%  68%  69%  70%  71%  72%  73%  74%  75%  76%  77%  78%  79% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  80%  81%  82%  83%  84%  85%  86%  87%  88%  89%  90%  91%  92%  93%  94%  95% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  96%  97%  98%  99% 100% 
##   NA   NA   NA   NA   NA