Integrantes:
Leyder Camilo Gomez
Estefania Muñoz Rodriguez
Krizzia Manchola
Tabla de contenido
Como objetivos tenemos:
| Variable | Mínimo | Máximo | Promedio | Mediana | Rango Intercuartílico | Desviación Estándar |
|---|---|---|---|---|---|---|
| AÑO | 2010.000 | 2022.000 | 2016.0000 | 2016.000 | 6.000 | 3.89444 |
| VEHICULOS_POR_AÑO | 44.000 | 1539.000 | 579.7692 | 431.000 | 732.000 | 508.49929 |
| VEHICULOS_POR_DEPARTAMENTOS | 0.000 | 4164.000 | 235.5312 | 8.000 | 33.000 | 827.87552 |
| INDICE_DE_ENGEL | 4.687 | 64.379 | 31.7925 | 30.093 | 18.978 | 14.86920 |
Después de observar la gráfica, se nota un crecimiento constante en la adquisición de vehículos eléctricos a lo largo de los años, lo que sugiere un creciente interés por parte de las personas en estos automóviles.
Sin embargo, se observa una disminución en las compras durante el año 2022, la cual no parece seguir la tendencia de crecimiento previa.
La correlación de Pearson entre vehículos por departamento y indice de engel es: 0.06309135
Una correlación de Pearson cercana a cero indica una relación muy débil o prácticamente inexistente entre las dos variables, en este caso, el índice de Engel y el número de vehículos eléctricos por departamento no tienen correlación.
En el caso de las camionetas y los automóviles, notamos que algunos valores atípicos se encuentran notablemente lejos de la caja principal. Esto significa que estos vehículos tienen una variabilidad significativa en los datos.
La cantidad de vehículos en la categoría de Bus puede variar más ampliamente entre los diferentes departamentos en comparación con otras categorías de vehículos como son el Mototriciclo y el Motocarro.
En el caso donde no aparecen las cajas es porque en este caso no tenemos datos muy relevantes. Es decir, no hay suficiente información disponible para proporcionar una representación visual de la distribución de los datos dentro de esa categoría.
Nuestro análisis de la adquisición de vehículos eléctricos en Colombia y su relación con el Índice de Engel Vial reveló una correlación más débil de lo esperado, desafiando nuestras expectativas iniciales.
El análisis de la variabilidad en las categorías de vehículos, evidenciado mediante diagramas de cajas, muestra la complejidad de los datos y la necesidad de investigaciones adicionales en áreas con datos faltantes.
Este proyecto subraya la importancia de mantener una mentalidad abierta en la investigación. Cada resultado, sea esperado o no, ofrece lecciones valiosas y contribuye al avance del conocimiento.
---
title: "tableroproject"
author: "leyder"
date: "2024-06-02"
output:
flexdashboard::flex_dashboard:
orientation: columns
social: menu
source_code: embed
---
```{r setup, include=FALSE}
library(flexdashboard)
library(ggplot2)
library(readxl)
library(shiny)
library(readxl)
library(kableExtra)
library(dplyr)
```
Presentacion
=========================================
ROW
-----------------------------------------
### **VEHÍCULOS ELECTRICOS EN COLOMBIA**
**Integrantes:**
Leyder Camilo Gomez
Estefania Muñoz Rodriguez
Krizzia Manchola
**Tabla de contenido**
1. Objetivos
2. Análisis Y discusiones
3. Conclusión
Row
-----------------------------------------
### **1. Objetivos**
Como objetivos tenemos:
1. Analizar cómo varía la adquisición de vehículos eléctricos a lo largo del tiempo y si existe un aumento gradual en la compra de estos vehículos en Colombia.
2. Relacionar el Índice de Engel en Infraestructura Vial con los vehículos adquiridos en los departamentos.
3. Analizar la clase en función con los vehículos por departamentos
Estadististicas descriptivas
=========================================
ROW
-----------------------------------------
```{r}
datos_excel <- read_excel('datosestadisticos.xlsx')
# Calcular las estadísticas para las variables cuantitativas
resumen <- datos_excel %>%
summarise(
Variable = c("AÑO", "VEHICULOS_POR_AÑO", "VEHICULOS_POR_DEPARTAMENTOS", "INDICE_DE_ENGEL"), # Agregar la nueva variable aquí
Mínimo = c(min(AÑO, na.rm = TRUE), min(VEHICULOS_POR_AÑO, na.rm = TRUE), min(VEHICULOS_POR_DEPARTAMENTOS, na.rm = TRUE), min(INDICE_DE_ENGEL, na.rm = TRUE)),
Máximo = c(max(AÑO, na.rm = TRUE), max(VEHICULOS_POR_AÑO, na.rm = TRUE), max(VEHICULOS_POR_DEPARTAMENTOS, na.rm = TRUE), max(INDICE_DE_ENGEL, na.rm = TRUE)),
Promedio = c(mean(AÑO, na.rm = TRUE), mean(VEHICULOS_POR_AÑO, na.rm = TRUE), mean(VEHICULOS_POR_DEPARTAMENTOS, na.rm = TRUE), mean(INDICE_DE_ENGEL, na.rm = TRUE)),
Mediana = c(median(AÑO, na.rm = TRUE), median(VEHICULOS_POR_AÑO, na.rm = TRUE), median(VEHICULOS_POR_DEPARTAMENTOS, na.rm = TRUE), median(INDICE_DE_ENGEL, na.rm = TRUE)),
`Rango Intercuartílico` = c(IQR(AÑO, na.rm = TRUE), IQR(VEHICULOS_POR_AÑO, na.rm = TRUE), IQR(VEHICULOS_POR_DEPARTAMENTOS, na.rm = TRUE), IQR(INDICE_DE_ENGEL, na.rm = TRUE)),
`Desviación Estándar` = c(sd(AÑO, na.rm = TRUE), sd(VEHICULOS_POR_AÑO, na.rm = TRUE), sd(VEHICULOS_POR_DEPARTAMENTOS, na.rm = TRUE), sd(INDICE_DE_ENGEL, na.rm = TRUE))
)
# Mostrar la tabla formateada
resumen %>%
kable("html") %>%
kable_styling(full_width = FALSE, bootstrap_options = c("striped", "hover", "condensed", "responsive"))
```
Vehículos eléctricos
=========================================
ROW
-----------------------------------------
### Número de vehículos eléctricos adquiridos en cada año.
```{r}
datos_excel <- read_excel("datosestadisticos.xlsx")
# Lista para almacenar las sumas de todos los tipos de vehículos para cada año
años_de_interes <- c(2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022)
total_vehiculos_por_año <- numeric(length(años_de_interes))
# Iterar sobre cada año de interés
for (i in 1:length(años_de_interes)) {
año <- años_de_interes[i]
# Filtrar los datos del DataFrame para el año actual
datos_año_actual <- subset(datos_excel, ANIO_REGISTRO == año)
# Contar el número total de vehículos para el año actual
total_vehiculos_año_actual <- nrow(datos_año_actual)
# Agregar el total a la lista
total_vehiculos_por_año[i] <- total_vehiculos_año_actual
}
# Crear gráfico de barras para la suma de todos los tipos de vehículos por año
barplot(total_vehiculos_por_año, names.arg = años_de_interes, col = 'blue',
xlab = 'Año', ylab = 'Total de Vehículos', main = 'Total de Vehículos por Año')
```
Row
------------------------------------------------
### Explicación gráfica
Después de observar la gráfica, se nota un crecimiento constante en la adquisición de vehículos eléctricos a lo largo de los años, lo que sugiere un creciente interés por parte de las personas en estos automóviles.
Sin embargo, se observa una disminución en las compras durante el año 2022, la cual no parece seguir la tendencia de crecimiento previa.
Tabla Cruzada
===================================================
Row
---------------------------------------------------
### Tabla Cruzada
```{r, fig.width=12, fig.height=9.5}
datos_excel <- read_excel("datosestadisticos.xlsx")
# Crear la tabla cruzada entre ANIO_REGISTRO y DEPARTAMENTO
tabla_cruzada <- table(datos_excel$ANIO_REGISTRO, datos_excel$DEPARTAMENTO)
# Convertir la tabla cruzada en un data frame para ggplot2
df_cruzada <- as.data.frame(tabla_cruzada)
# Crear un gráfico de barras apiladas para visualizar la tabla cruzada
ggplot(df_cruzada, aes(x = Var1, y = Freq, fill = Var2)) +
geom_bar(stat = "identity") +
labs(
title = "Distribución de Vehículos por Año y Departamento",
x = "Año de Registro",
y = "Frecuencia",
fill = "Departamento"
) +
theme_minimal() +
theme(
axis.text.x = element_text(angle = 45, hjust = 1, size = 12), # Ajustar el tamaño del texto del eje x
plot.margin = margin(10, 10, 10, 10) # Añadir márgenes alrededor del gráfico
) +
scale_y_continuous(expand = expansion(mult = c(0, 0.1)))
```
Aplicación Pearson
=========================================
Row
------------------------------------------------
### Gráfica de dispersión
```{r}
# Crear el gráfico de dispersión
ggplot(datos_excel, aes(y = VEHICULOS_POR_DEPARTAMENTOS, x = INDICE_DE_ENGEL)) +
geom_point(color = 'red', alpha = 0.4) +
labs(title = "Gráfico de Dispersión",
y = "Vehículos por Departamento",
x = "Indice de Engel") +
theme_minimal()
```
ROW
-----------------------------------------
### Correlación y Gráfico de Dispersión
```{r}
datos_excel <- read_excel("datosestadisticos.xlsx")
# Asegurarse de que las columnas son numéricas
datos_excel$VEHICULOS_POR_DEPARTAMENTOS <- as.numeric(datos_excel$VEHICULOS_POR_DEPARTAMENTOS)
datos_excel$INDICE_DE_ENGEL <- as.numeric(datos_excel$INDICE_DE_ENGEL)
# Eliminar filas con NA en las columnas relevantes
datos_excel <- na.omit(datos_excel[, c("VEHICULOS_POR_DEPARTAMENTOS", "INDICE_DE_ENGEL")])
# Calcular la correlación de Pearson
correlacion_pearson <- cor(datos_excel$VEHICULOS_POR_DEPARTAMENTOS, datos_excel$INDICE_DE_ENGEL, method = "pearson")
# Imprimir la correlación de Pearson
cat("La correlación de Pearson entre vehículos por departamento y indice de engel es:", correlacion_pearson, "\n")
```
Una correlación de Pearson cercana a cero indica una relación muy débil o prácticamente inexistente entre las dos variables, en este caso, el índice de Engel y el número de vehículos eléctricos por departamento no tienen correlación.
Diagrama de cajas
===================================================
Row
---------------------------------------------------
### Diagrama de cajas por grupos: vehículos por departamento según clase
```{r}
datos_excel <- read_excel("datosestadisticos.xlsx")
# Crear el diagrama de cajas por grupos
ggplot(datos_excel, aes(x = CLASE, y = VEHICULOS_POR_DEPARTAMENTOS)) +
geom_boxplot() +
labs(
title = "Diagrama de Cajas",
x = "Clase",
y = "Vehículos por Departamento"
) +
theme_minimal() +
theme(
axis.text.x = element_text(angle = 45, hjust = 1)
)
```
ROW
-----------------------------------------
### interpretacion de resultado de las cajas de dispercion
En el caso de las camionetas y los automóviles, notamos que algunos valores atípicos se encuentran notablemente lejos de la caja principal. Esto significa que estos vehículos tienen una variabilidad significativa en los datos.
La cantidad de vehículos en la categoría de Bus puede variar más ampliamente entre los diferentes departamentos en comparación con otras categorías de vehículos como son el Mototriciclo y el Motocarro.
En el caso donde no aparecen las cajas es porque en este caso no tenemos datos muy relevantes. Es decir, no hay suficiente información disponible para proporcionar una representación visual de la distribución de los datos dentro de esa categoría.
Conclusión
=========================================
ROW
-----------------------------------------
### **CONCLUSIÓN**
Nuestro análisis de la adquisición de vehículos eléctricos en Colombia y su relación con el Índice de Engel Vial reveló una correlación más débil de lo esperado, desafiando nuestras expectativas iniciales.
El análisis de la variabilidad en las categorías de vehículos, evidenciado mediante diagramas de cajas, muestra la complejidad de los datos y la necesidad de investigaciones adicionales en áreas con datos faltantes.
Este proyecto subraya la importancia de mantener una mentalidad abierta en la investigación. Cada resultado, sea esperado o no, ofrece lecciones valiosas y contribuye al avance del conocimiento.