Estadísticas

Row

Información de los datos

999

Variables

16

Row

Estadísticas

  condition mmr odometer sellingprice year
Mean 33.9 23423 29316 22863 2013
Std.Dev 14.36 12688 34432 12926 0.7361
Min 1 6775 1 1000 2012
Q1 32 13500 16009 13200 2012
Median 39 21300 27312 21000 2013
Q3 44 28400 38131 27750 2013
Max 49 91000 1e+06 91000 2015
MAD 7.413 11268 16255 11268 0
IQR 12 14875 22080 14425 1
CV 0.4236 0.5417 1.174 0.5654 0.0003657
Skewness -1.351 1.464 22.48 1.358 0.9682
SE.Skewness 0.07881 0.07738 0.07738 0.07738 0.07738
Kurtosis 0.4874 2.471 629.4 2.485 1.503
N.Valid 963 999 999 999 999
Pct.Valid 96.4 100 100 100 100

Diagrama de Barras

Row

Diagrama de Barras

Diagrama de Barras Apilado

Tabla Cruzada

beige black blue brown burgundy gray off-white red silver tan white
0 6 23 0 0 0 5 0 0 0 0 0
beige 0 4 0 0 1 0 2 0 0 0 1 0
black 13 20 176 0 1 0 30 0 1 0 6 0
blue 4 3 30 0 2 0 24 1 0 0 2 0
brown 0 4 4 0 1 0 2 0 0 0 0 0
burgundy 2 3 4 0 0 0 0 0 0 0 1 0
charcoal 0 0 1 0 0 0 0 0 0 0 0 0
gold 0 3 0 0 1 0 0 0 0 0 0 0
gray 10 10 146 1 1 0 45 0 0 0 4 0
green 1 2 3 0 0 0 0 0 0 0 0 0
orange 0 0 2 0 0 0 0 0 0 0 0 0
purple 0 0 3 0 0 0 1 0 0 0 0 0
red 1 8 29 0 0 0 5 0 0 0 3 0
silver 6 1 68 0 0 0 31 1 0 1 1 0
white 18 43 110 0 3 1 42 1 0 0 11 3
yellow 0 0 1 0 0 0 0 0 0 0 0 0

Boxplot

Row

Boxplot

Correlación

Row

Correlación

Diagrama de Cajas

Row

Diagrama de Cajas

Conclusiones

Row

Conclusiones

Este código de R construye un tablero interactivo con visualizaciones y análisis sobre un conjunto de datos de vehículos. A continuación se presentan las conclusiones clave que se pueden extraer a partir de cada sección:

Información y Estadísticas de los Datos:

  • Se tiene una base de 898 observaciones de vehículos con 16 variables clave, incluyendo año de fabricación, marca, modelo, estado de conservación, kilometraje, color, precio de venta y fecha de venta.

  • Al analizar los datos, es crucial prestar atención a la limpieza de valores faltantes y la uniformidad de niveles en variables categóricas como la marca (“make”).

Distribución de Marcas (Diagrama de Barras):

  • El diagrama de barras ofrece un resumen visual de la frecuencia de cada marca, útil para observar la popularidad relativa de diferentes marcas en el mercado.

  • La rotación de etiquetas permite una mejor visualización en el caso de nombres de marca largos o una gran cantidad de categorías.

Análisis de Color e Interior (Diagrama de Barras Apilado):

  • Este gráfico ayuda a entender la relación entre el color exterior del vehículo y el tipo de interior, lo cual puede ser útil para identificar combinaciones de colores preferidas en el mercado.

  • Puede sugerir si ciertas combinaciones de colores e interiores son más demandadas.

Boxplot del Precio de Venta:

  • Los diagramas de cajas muestran la distribución del precio de venta de los vehículos, ayudando a identificar la mediana, la dispersión y posibles valores atípicos en los precios.

  • Permite ver las variaciones de precio según la marca, útil para definir rangos de precios comunes y detectar vehículos sobrevalorados o subvalorados.

Análisis de Correlación:

  • La matriz de correlación con las variables cuantitativas (como precio de venta, kilometraje, etc.) es esencial para entender relaciones entre variables, por ejemplo, si el kilometraje está correlacionado negativamente con el precio de venta.

  • Esto es útil para análisis predictivos, pues permite identificar variables que influyen más en el precio final.

Diagrama de Cajas por Marca y Precio de Venta:

  • Este gráfico analiza las variaciones de precio según la marca, revelando si hay marcas con precios consistentemente más altos o más bajos.

  • Es útil para evaluar la percepción de valor por marca y detectar oportunidades de ajuste en precios según el comportamiento del mercado.

En conclusión, este tablero proporciona una estructura sólida para el análisis del mercado de vehículos, enfocándose en aspectos como precios, popularidad de colores y variaciones por marca, lo cual es muy valioso para empresas de renta o venta de autos al tomar decisiones estratégicas en precios y marketing.

---
title: "Tablero - Renta de Vehíuclos"
author: Juan José Becerra y Juan Manuel Betancourt 
output: 
  flexdashboard::flex_dashboard:
    orientation: rows
    social: menu
    source_code: embed
editor_options: 
  markdown: 
    wrap: sentence
---

```{r setup, include=FALSE}
#cargar librerias
library(flexdashboard)
library(corrplot)
library(PerformanceAnalytics)
library(ggplot2)
library(patchwork)
library(dplyr)
library(kableExtra)
library(flexdashboard)
library(summarytools)
library(psych)
library(pander)
library(tidyr)
library(readr)
Datos_Vehiculos <- read_delim("Datos_Vehiculos.csv", 
    delim = ";", escape_double = FALSE, trim_ws = TRUE)


Datos_Vehiculos<- read_delim("Datos_Vehiculos.csv", 
    delim = ";", escape_double = FALSE, trim_ws = TRUE)

#procesamiento de datos
#str(Datos_Vehiculos)
Datos_Vehiculos$make <- as.factor(Datos_Vehiculos$make)

# Declaración de niveles correctos para las variables tipo Factor
level_make=c(BMW="BMW",bmw="BMW",lincoln="Lincoln", Lincoln= "Lincoln")
## Modificación del formato y transformación de variables
Datos_Vehiculos = transform(Datos_Vehiculos,
                  make=factor(dplyr::recode(make,!!!level_make))
)

#str(Datos_Vehiculos)

```

# Estadísticas

## Row

### Información de los datos
```{r}
valueBox(value = nrow(Datos_Vehiculos),
         caption = "El conjunto de datos a trabajar será de una base de datos sobre la venta de vehículos.El tamaño de la muestra es de 999 en primera instancia, pero con la eliminación de las inconsistencias u datos faltantes, se redujo a 898 observaciones, dentro de las cuales encontramos 16 variables que abarcan desde el año de modelo del vehículo, su precio y marca; hasta el año y precio de venta.",color="skyblue")
```


### Variables
```{r}
valueBox(value = ncol(Datos_Vehiculos),
         caption = "Este conjunto de datos incluye detalles como el año, la marca, el modelo, el acabado, el tipo de carrocería, el tipo de transmisión, el VIN (Número de Identificación del Vehículo), el estado de matriculación, el estado de conservación, la lectura del cuentakilómetros, los colores exterior e interior, la información del vendedor, los valores del Informe de Mercado Manheim (MMR), los precios de venta y las fechas de venta.” (Vehicle Sales Data, 2024)",color="skyblue")
```

Row
------------------------------------------------------------------------------


### Estadísticas

```{r}
result<- descr(Datos_Vehiculos)
pander(result)
```

# Diagrama de Barras

## Row {.tabset}

### Diagrama de Barras

```{r}
ggplot(Datos_Vehiculos,aes(x=make,fill=Datos_Vehiculos$make)) +
  geom_bar(show.legend=FALSE)+
  xlab("make")+ #nombre de la variable seleccionada+
  ylab("frecuencia")+ #dejar igual 
  theme(axis.text.x= element_text(angle=45,hjust = 1))

```

### Diagrama de Barras Apilado

```{r}
#1 . Crear el gráfico de barras apiladas
ggplot(Datos_Vehiculos, aes(x = color, fill = interior)) +
  geom_bar(position = "stack") +
  labs(title = "Diagrama de Barras Apiladas de Color e Interior",
       x = "Color del Vehículo",
       y = "Cantidad",
       fill = "Tipo de Interior") +
  theme_minimal()+
   theme(axis.text.x = element_text(angle = 45, hjust = 1))
```

### Tabla Cruzada

```{r}
# 1. Crear una tabla cruzada (frecuencias)

tabla_cruzada <- table(Datos_Vehiculos$color, Datos_Vehiculos$interior)

# Mostrar la tabla cruzada de manera más legible
kable(tabla_cruzada)
```

# Boxplot

## Row

### Boxplot

```{r}
ggplot(Datos_Vehiculos,aes(y=Datos_Vehiculos$"sellingprice"))+
  stat_boxplot(geom="errorbar",
               width=0.25)+
  geom_boxplot(alpha=0.4,
               colour="black",
               outlier.colour=4,
               fill="green")+
  ylab("sellingprice") #nombre variable seleccionada
```

# Correlación

## Row

### Correlación

```{r}
###Punto 1###
#Correlacion
correlacion<-cor(Datos_Vehiculos[,c(9,10,14,15)],use ="complete.obs")
#correlacion de las variables cuantitativas
corrplot(correlacion, method = "number", type = "full")#grafico
```

# Diagrama de Cajas

## Row

### Diagrama de Cajas

```{r}
#Punto 2 
#Crear el diagrama de cajas
ggplot(Datos_Vehiculos, aes(x = make, y = sellingprice)) +
  geom_boxplot(fill = "skyblue", color = "black") +
  labs(title = "Diagrama de cajas de Precio de Venta por Marca",
       x = "Marca",
       y = "Precio de Venta") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))  # Rotación de los nombres de las marcas
```

# Conclusiones

## Row

### Conclusiones

Este código de R construye un tablero interactivo con visualizaciones y análisis sobre un conjunto de datos de vehículos.
A continuación se presentan las conclusiones clave que se pueden extraer a partir de cada sección:

**Información y Estadísticas de los Datos:**

-   Se tiene una base de 898 observaciones de vehículos con 16 variables clave, incluyendo año de fabricación, marca, modelo, estado de conservación, kilometraje, color, precio de venta y fecha de venta.

-   Al analizar los datos, es crucial prestar atención a la limpieza de valores faltantes y la uniformidad de niveles en variables categóricas como la marca ("make").

**Distribución de Marcas (Diagrama de Barras):**

-   El diagrama de barras ofrece un resumen visual de la frecuencia de cada marca, útil para observar la popularidad relativa de diferentes marcas en el mercado.

-   La rotación de etiquetas permite una mejor visualización en el caso de nombres de marca largos o una gran cantidad de categorías.

**Análisis de Color e Interior (Diagrama de Barras Apilado):**

-   Este gráfico ayuda a entender la relación entre el color exterior del vehículo y el tipo de interior, lo cual puede ser útil para identificar combinaciones de colores preferidas en el mercado.

-   Puede sugerir si ciertas combinaciones de colores e interiores son más demandadas.

**Boxplot del Precio de Venta:**

-   Los diagramas de cajas muestran la distribución del precio de venta de los vehículos, ayudando a identificar la mediana, la dispersión y posibles valores atípicos en los precios.

-   Permite ver las variaciones de precio según la marca, útil para definir rangos de precios comunes y detectar vehículos sobrevalorados o subvalorados.

**Análisis de Correlación:**

-   La matriz de correlación con las variables cuantitativas (como precio de venta, kilometraje, etc.) es esencial para entender relaciones entre variables, por ejemplo, si el kilometraje está correlacionado negativamente con el precio de venta.

-   Esto es útil para análisis predictivos, pues permite identificar variables que influyen más en el precio final.

**Diagrama de Cajas por Marca y Precio de Venta:**

-   Este gráfico analiza las variaciones de precio según la marca, revelando si hay marcas con precios consistentemente más altos o más bajos.

-   Es útil para evaluar la percepción de valor por marca y detectar oportunidades de ajuste en precios según el comportamiento del mercado.

En conclusión, este tablero proporciona una estructura sólida para el análisis del mercado de vehículos, enfocándose en aspectos como precios, popularidad de colores y variaciones por marca, lo cual es muy valioso para empresas de renta o venta de autos al tomar decisiones estratégicas en precios y marketing.