condition | mmr | odometer | sellingprice | year | |
---|---|---|---|---|---|
Mean | 33.9 | 23423 | 29316 | 22863 | 2013 |
Std.Dev | 14.36 | 12688 | 34432 | 12926 | 0.7361 |
Min | 1 | 6775 | 1 | 1000 | 2012 |
Q1 | 32 | 13500 | 16009 | 13200 | 2012 |
Median | 39 | 21300 | 27312 | 21000 | 2013 |
Q3 | 44 | 28400 | 38131 | 27750 | 2013 |
Max | 49 | 91000 | 1e+06 | 91000 | 2015 |
MAD | 7.413 | 11268 | 16255 | 11268 | 0 |
IQR | 12 | 14875 | 22080 | 14425 | 1 |
CV | 0.4236 | 0.5417 | 1.174 | 0.5654 | 0.0003657 |
Skewness | -1.351 | 1.464 | 22.48 | 1.358 | 0.9682 |
SE.Skewness | 0.07881 | 0.07738 | 0.07738 | 0.07738 | 0.07738 |
Kurtosis | 0.4874 | 2.471 | 629.4 | 2.485 | 1.503 |
N.Valid | 963 | 999 | 999 | 999 | 999 |
Pct.Valid | 96.4 | 100 | 100 | 100 | 100 |
— | beige | black | blue | brown | burgundy | gray | off-white | red | silver | tan | white | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
— | 0 | 6 | 23 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 |
beige | 0 | 4 | 0 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 1 | 0 |
black | 13 | 20 | 176 | 0 | 1 | 0 | 30 | 0 | 1 | 0 | 6 | 0 |
blue | 4 | 3 | 30 | 0 | 2 | 0 | 24 | 1 | 0 | 0 | 2 | 0 |
brown | 0 | 4 | 4 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 0 | 0 |
burgundy | 2 | 3 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
charcoal | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
gold | 0 | 3 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
gray | 10 | 10 | 146 | 1 | 1 | 0 | 45 | 0 | 0 | 0 | 4 | 0 |
green | 1 | 2 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
orange | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
purple | 0 | 0 | 3 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
red | 1 | 8 | 29 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 3 | 0 |
silver | 6 | 1 | 68 | 0 | 0 | 0 | 31 | 1 | 0 | 1 | 1 | 0 |
white | 18 | 43 | 110 | 0 | 3 | 1 | 42 | 1 | 0 | 0 | 11 | 3 |
yellow | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Este código de R construye un tablero interactivo con visualizaciones y análisis sobre un conjunto de datos de vehículos. A continuación se presentan las conclusiones clave que se pueden extraer a partir de cada sección:
Información y Estadísticas de los Datos:
Se tiene una base de 898 observaciones de vehículos con 16 variables clave, incluyendo año de fabricación, marca, modelo, estado de conservación, kilometraje, color, precio de venta y fecha de venta.
Al analizar los datos, es crucial prestar atención a la limpieza de valores faltantes y la uniformidad de niveles en variables categóricas como la marca (“make”).
Distribución de Marcas (Diagrama de Barras):
El diagrama de barras ofrece un resumen visual de la frecuencia de cada marca, útil para observar la popularidad relativa de diferentes marcas en el mercado.
La rotación de etiquetas permite una mejor visualización en el caso de nombres de marca largos o una gran cantidad de categorías.
Análisis de Color e Interior (Diagrama de Barras Apilado):
Este gráfico ayuda a entender la relación entre el color exterior del vehículo y el tipo de interior, lo cual puede ser útil para identificar combinaciones de colores preferidas en el mercado.
Puede sugerir si ciertas combinaciones de colores e interiores son más demandadas.
Boxplot del Precio de Venta:
Los diagramas de cajas muestran la distribución del precio de venta de los vehículos, ayudando a identificar la mediana, la dispersión y posibles valores atípicos en los precios.
Permite ver las variaciones de precio según la marca, útil para definir rangos de precios comunes y detectar vehículos sobrevalorados o subvalorados.
Análisis de Correlación:
La matriz de correlación con las variables cuantitativas (como precio de venta, kilometraje, etc.) es esencial para entender relaciones entre variables, por ejemplo, si el kilometraje está correlacionado negativamente con el precio de venta.
Esto es útil para análisis predictivos, pues permite identificar variables que influyen más en el precio final.
Diagrama de Cajas por Marca y Precio de Venta:
Este gráfico analiza las variaciones de precio según la marca, revelando si hay marcas con precios consistentemente más altos o más bajos.
Es útil para evaluar la percepción de valor por marca y detectar oportunidades de ajuste en precios según el comportamiento del mercado.
En conclusión, este tablero proporciona una estructura sólida para el análisis del mercado de vehículos, enfocándose en aspectos como precios, popularidad de colores y variaciones por marca, lo cual es muy valioso para empresas de renta o venta de autos al tomar decisiones estratégicas en precios y marketing.
---
title: "Tablero - Renta de Vehíuclos"
author: Juan José Becerra y Juan Manuel Betancourt
output:
flexdashboard::flex_dashboard:
orientation: rows
social: menu
source_code: embed
editor_options:
markdown:
wrap: sentence
---
```{r setup, include=FALSE}
#cargar librerias
library(flexdashboard)
library(corrplot)
library(PerformanceAnalytics)
library(ggplot2)
library(patchwork)
library(dplyr)
library(kableExtra)
library(flexdashboard)
library(summarytools)
library(psych)
library(pander)
library(tidyr)
library(readr)
Datos_Vehiculos <- read_delim("Datos_Vehiculos.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
Datos_Vehiculos<- read_delim("Datos_Vehiculos.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
#procesamiento de datos
#str(Datos_Vehiculos)
Datos_Vehiculos$make <- as.factor(Datos_Vehiculos$make)
# Declaración de niveles correctos para las variables tipo Factor
level_make=c(BMW="BMW",bmw="BMW",lincoln="Lincoln", Lincoln= "Lincoln")
## Modificación del formato y transformación de variables
Datos_Vehiculos = transform(Datos_Vehiculos,
make=factor(dplyr::recode(make,!!!level_make))
)
#str(Datos_Vehiculos)
```
# Estadísticas
## Row
### Información de los datos
```{r}
valueBox(value = nrow(Datos_Vehiculos),
caption = "El conjunto de datos a trabajar será de una base de datos sobre la venta de vehículos.El tamaño de la muestra es de 999 en primera instancia, pero con la eliminación de las inconsistencias u datos faltantes, se redujo a 898 observaciones, dentro de las cuales encontramos 16 variables que abarcan desde el año de modelo del vehículo, su precio y marca; hasta el año y precio de venta.",color="skyblue")
```
### Variables
```{r}
valueBox(value = ncol(Datos_Vehiculos),
caption = "Este conjunto de datos incluye detalles como el año, la marca, el modelo, el acabado, el tipo de carrocería, el tipo de transmisión, el VIN (Número de Identificación del Vehículo), el estado de matriculación, el estado de conservación, la lectura del cuentakilómetros, los colores exterior e interior, la información del vendedor, los valores del Informe de Mercado Manheim (MMR), los precios de venta y las fechas de venta.” (Vehicle Sales Data, 2024)",color="skyblue")
```
Row
------------------------------------------------------------------------------
### Estadísticas
```{r}
result<- descr(Datos_Vehiculos)
pander(result)
```
# Diagrama de Barras
## Row {.tabset}
### Diagrama de Barras
```{r}
ggplot(Datos_Vehiculos,aes(x=make,fill=Datos_Vehiculos$make)) +
geom_bar(show.legend=FALSE)+
xlab("make")+ #nombre de la variable seleccionada+
ylab("frecuencia")+ #dejar igual
theme(axis.text.x= element_text(angle=45,hjust = 1))
```
### Diagrama de Barras Apilado
```{r}
#1 . Crear el gráfico de barras apiladas
ggplot(Datos_Vehiculos, aes(x = color, fill = interior)) +
geom_bar(position = "stack") +
labs(title = "Diagrama de Barras Apiladas de Color e Interior",
x = "Color del Vehículo",
y = "Cantidad",
fill = "Tipo de Interior") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 45, hjust = 1))
```
### Tabla Cruzada
```{r}
# 1. Crear una tabla cruzada (frecuencias)
tabla_cruzada <- table(Datos_Vehiculos$color, Datos_Vehiculos$interior)
# Mostrar la tabla cruzada de manera más legible
kable(tabla_cruzada)
```
# Boxplot
## Row
### Boxplot
```{r}
ggplot(Datos_Vehiculos,aes(y=Datos_Vehiculos$"sellingprice"))+
stat_boxplot(geom="errorbar",
width=0.25)+
geom_boxplot(alpha=0.4,
colour="black",
outlier.colour=4,
fill="green")+
ylab("sellingprice") #nombre variable seleccionada
```
# Correlación
## Row
### Correlación
```{r}
###Punto 1###
#Correlacion
correlacion<-cor(Datos_Vehiculos[,c(9,10,14,15)],use ="complete.obs")
#correlacion de las variables cuantitativas
corrplot(correlacion, method = "number", type = "full")#grafico
```
# Diagrama de Cajas
## Row
### Diagrama de Cajas
```{r}
#Punto 2
#Crear el diagrama de cajas
ggplot(Datos_Vehiculos, aes(x = make, y = sellingprice)) +
geom_boxplot(fill = "skyblue", color = "black") +
labs(title = "Diagrama de cajas de Precio de Venta por Marca",
x = "Marca",
y = "Precio de Venta") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotación de los nombres de las marcas
```
# Conclusiones
## Row
### Conclusiones
Este código de R construye un tablero interactivo con visualizaciones y análisis sobre un conjunto de datos de vehículos.
A continuación se presentan las conclusiones clave que se pueden extraer a partir de cada sección:
**Información y Estadísticas de los Datos:**
- Se tiene una base de 898 observaciones de vehículos con 16 variables clave, incluyendo año de fabricación, marca, modelo, estado de conservación, kilometraje, color, precio de venta y fecha de venta.
- Al analizar los datos, es crucial prestar atención a la limpieza de valores faltantes y la uniformidad de niveles en variables categóricas como la marca ("make").
**Distribución de Marcas (Diagrama de Barras):**
- El diagrama de barras ofrece un resumen visual de la frecuencia de cada marca, útil para observar la popularidad relativa de diferentes marcas en el mercado.
- La rotación de etiquetas permite una mejor visualización en el caso de nombres de marca largos o una gran cantidad de categorías.
**Análisis de Color e Interior (Diagrama de Barras Apilado):**
- Este gráfico ayuda a entender la relación entre el color exterior del vehículo y el tipo de interior, lo cual puede ser útil para identificar combinaciones de colores preferidas en el mercado.
- Puede sugerir si ciertas combinaciones de colores e interiores son más demandadas.
**Boxplot del Precio de Venta:**
- Los diagramas de cajas muestran la distribución del precio de venta de los vehículos, ayudando a identificar la mediana, la dispersión y posibles valores atípicos en los precios.
- Permite ver las variaciones de precio según la marca, útil para definir rangos de precios comunes y detectar vehículos sobrevalorados o subvalorados.
**Análisis de Correlación:**
- La matriz de correlación con las variables cuantitativas (como precio de venta, kilometraje, etc.) es esencial para entender relaciones entre variables, por ejemplo, si el kilometraje está correlacionado negativamente con el precio de venta.
- Esto es útil para análisis predictivos, pues permite identificar variables que influyen más en el precio final.
**Diagrama de Cajas por Marca y Precio de Venta:**
- Este gráfico analiza las variaciones de precio según la marca, revelando si hay marcas con precios consistentemente más altos o más bajos.
- Es útil para evaluar la percepción de valor por marca y detectar oportunidades de ajuste en precios según el comportamiento del mercado.
En conclusión, este tablero proporciona una estructura sólida para el análisis del mercado de vehículos, enfocándose en aspectos como precios, popularidad de colores y variaciones por marca, lo cual es muy valioso para empresas de renta o venta de autos al tomar decisiones estratégicas en precios y marketing.