introduccion

columns

[1] "🚩introduccion"
[1] "Este informe presenta un análisis exploratorio de los datos relacionados con las entradas de extranjeros a Colombia. Se utiliza una matriz de correlación para identificar relaciones entre las variables numéricas (masculino, femenino y total), y se realiza una visualización de la distribución de nacionalidades agrupadas por continente. El objetivo es entender mejor los patrones migratorios y la composición geográfica de los visitantes que ingresan al país."

Matriz de Correlación con corrplot

columns

[1] "🚩interpretacion"
[1] "El gráfico representa una matriz de similitud o coincidencia que compara las categorías de sexo (Masculino y Femenino) en términos de correspondencia entre valores reales y predichos o analizados. En la diagonal principal (Masculino-Masculino, Femenino-Femenino y Total-Total) se observa una coincidencia perfecta (1.00), lo que indica que el modelo o análisis clasifica correctamente a hombres y mujeres en su propia categoría. Sin embargo, fuera de la diagonal (Masculino-Femenino y Femenino-Masculino), se presenta una similitud del 0.96, lo que sugiere una ligera confusión o error en la clasificación entre sexos, posiblemente debido a características compartidas. A nivel general, la precisión es muy alta (0.99 en las combinaciones con Total), lo que refleja un excelente desempeño del modelo o análisis. Los colores azulados del gráfico refuerzan esta alta similitud, ya que los valores están muy cerca de 1, el máximo del rango. En conclusión, el análisis es altamente preciso, aunque existe una pequeña confusión entre las categorías de sexo."

filtrado

columns

[1] "🚩Intepretacion"
[1] "Primero se organiza la base de datos eliminando las filas sin información sobre el continente, luego se seleccionan solo los registros de África, América, Asia, Europa y Oceanía, y con ellos se crea un gráfico de barras que muestra cuántas personas provienen de cada uno, usando colores distintos para facilitar la lectura, etiquetas descriptivas y un diseño claro. El análisis revela que América es el continente con más entradas a Colombia, con 30,568 personas, seguido por Asia con 28,228 y África con 28,034, lo que muestra una fuerte conexión con estas regiones, mientras que Europa aporta 24,142 visitantes y Oceanía 18,093, posiblemente debido a la lejanía geográfica, lo cual permite comprender mejor de dónde proviene el turismo internacional hacia el país."
---
title: "dash board"
author: "Tomas Bautista"
date: "2025-05-14"
output: 
  flexdashboard::flex_dashboard:
    orientation: columns
    vertical_layout: fill
    theme: flatly
    source_code: embed
---

```{r cargar-datos, include=FALSE}
library(flexdashboard)
library(ggplot2)
library(readr)
library(dplyr)
library(knitr)
library(GGally)
library(forecast)
```

# introduccion
columns
--------------------------------------------

```{r}
"🚩introduccion"
"Este informe presenta un análisis exploratorio de los datos relacionados con las entradas de extranjeros a Colombia. Se utiliza una matriz de correlación para identificar relaciones entre las variables numéricas (masculino, femenino y total), y se realiza una visualización de la distribución de nacionalidades agrupadas por continente. El objetivo es entender mejor los patrones migratorios y la composición geográfica de los visitantes que ingresan al país."
```

# Matriz de Correlación con corrplot
columns
--------------------------------------------


```{r}


basededatos <- read.csv("/cloud/project/Entradas_de_extranjeros_a_Colombia_20250313 (2).csv", stringsAsFactors=TRUE)

if (!require(corrplot)) install.packages("corrplot", dependencies = TRUE)
library(corrplot)


base_numerica <- basededatos[, c("Masculino", "Femenino", "Total")]

cor_matrix <- cor(base_numerica, use = "complete.obs")

corrplot(cor_matrix, method = "number", tl.col = "black", tl.cex = 1)
```


```{r}
"🚩interpretacion"
"El gráfico representa una matriz de similitud o coincidencia que compara las categorías de sexo (Masculino y Femenino) en términos de correspondencia entre valores reales y predichos o analizados. En la diagonal principal (Masculino-Masculino, Femenino-Femenino y Total-Total) se observa una coincidencia perfecta (1.00), lo que indica que el modelo o análisis clasifica correctamente a hombres y mujeres en su propia categoría. Sin embargo, fuera de la diagonal (Masculino-Femenino y Femenino-Masculino), se presenta una similitud del 0.96, lo que sugiere una ligera confusión o error en la clasificación entre sexos, posiblemente debido a características compartidas. A nivel general, la precisión es muy alta (0.99 en las combinaciones con Total), lo que refleja un excelente desempeño del modelo o análisis. Los colores azulados del gráfico refuerzan esta alta similitud, ya que los valores están muy cerca de 1, el máximo del rango. En conclusión, el análisis es altamente preciso, aunque existe una pequeña confusión entre las categorías de sexo."
```


# filtrado
```{r filtrado, , include=FALSE}

#ESTA PARTE FILTRA LOS PAISES POR CONTINENTE 
# Crear un diccionario completo de nacionalidades y continentes
continentes <- c(
  "Islas Alboran y Perejil" = "África",
  "Albania" = "Europa", 
  "Alemania" = "Europa", 
  "Andorra" = "Europa", 
  "Angola" = "África", 
  "Antigua y Barbuda" = "América", 
  "Países Bajos" = "Europa", 
  "Argelia" = "África", 
  "Argentina" = "América", 
  "Aruba" = "América", 
  "Australia" = "Oceanía", 
  "Austria" = "Europa", 
  "Azerbaiyán" = "Asia", 
  "Bahamas" = "América", 
  "Bahréin" = "Asia", 
  "Bangladesh" = "Asia", 
  "Barbados" = "América", 
  "República de Belarús" = "Europa", 
  "Bélgica" = "Europa", 
  "Belice" = "América", 
  "Bermudas/Territorio Británico de Ultramar" = "América", 
  "Bolivia" = "América", 
  "Bosnia y Herzegovina" = "Europa", 
  "Botsuana" = "África", 
  "Brasil" = "América", 
  "Bulgaria" = "Europa", 
  "Burkina Faso" = "África", 
  "Islas Caimán/Territorio Británico de Ultramar" = "América", 
  "Camerún" = "África", 
  "Canadá" = "América", 
  "Chad" = "África", 
  "España" = "Europa", 
  "República Democrática del Congo" = "África", 
  "República de Corea" = "Asia", 
  "Costa de Marfil" = "África", 
  "Costa Rica" = "América", 
  "Croacia" = "Europa", 
  "Cuba" = "América", 
  "Curazao" = "América", 
  "República Checa" = "Europa", 
  "Chile" = "América", 
  "China" = "Asia", 
  "Taiwán" = "Asia", 
  "Chipre" = "Europa", 
  "Dinamarca" = "Europa", 
  "Dominica" = "América", 
  "Ecuador" = "América", 
  "Egipto" = "África", 
  "El Salvador" = "América", 
  "Eslovaquia" = "Europa", 
  "Eslovenia" = "Europa", 
  "Estados Unidos de América" = "América", 
  "Estonia" = "Europa", 
  "Etiopia" = "África", 
  "Filipinas" = "Asia", 
  "Finlandia" = "Europa", 
  "Francia" = "Europa", 
  "Gabón" = "África", 
  "Georgia" = "Asia", 
  "Ghana" = "África", 
  "Granada" = "América", 
  "Grecia" = "Europa", 
  "Guatemala" = "América", 
  "Guyana" = "América", 
  "Guinea" = "África", 
  "Guinea Ecuatorial" = "África", 
  "Guayana Francesa/Departamento de Ultramar Francés" = "América", 
  "Haití" = "América", 
  "Honduras" = "América", 
  "Hungría" = "Europa", 
  "India" = "Asia", 
  "Indonesia" = "Asia", 
  "Irán" = "Asia", 
  "República de Irlanda" = "Europa", 
  "Islandia" = "Europa", 
  "Isla de Man" = "Europa", 
  "Isla Johnston" = "Oceanía", 
  "Israel" = "Asia", 
  "Islas Aland/Provincia de Finlandia" = "Europa", 
  "Isla Wake" = "Oceanía", 
  "Italia" = "Europa", 
  "Islas del Canal" = "Europa", 
  "Jamaica" = "América", 
  "Islas Marianas del Norte" = "Oceanía", 
  "Japón" = "Asia", 
  "Jordania" = "Asia", 
  "Kazajistán" = "Asia", 
  "Kenia" = "África", 
  "Kuwait" = "Asia", 
  "Letonia" = "Europa", 
  "Lituania" = "Europa", 
  "Líbano" = "Asia", 
  "Libia" = "África", 
  "Liechtenstein" = "Europa", 
  "Luxemburgo" = "Europa", 
  "Macedonia" = "Europa", 
  "Malasia" = "Asia", 
  "Malta" = "Europa", 
  "Marruecos" = "África", 
  "Mauricio" = "África", 
  "México" = "América", 
  "República de Moldavia" = "Europa", 
  "Mónaco" = "Europa", 
  "Myanmar" = "Asia", 
  "Namibia" = "África", 
  "Nepal" = "Asia", 
  "Nicaragua" = "América", 
  "Nigeria" = "África", 
  "Noruega" = "Europa", 
  "Nueva Zelanda" = "Oceanía", 
  "Pakistán" = "Asia", 
  "Panamá" = "América", 
  "Paraguay" = "América", 
  "Perú" = "América", 
  "Palestina" = "Asia", 
  "Polonia" = "Europa", 
  "Portugal" = "Europa", 
  "Puerto Rico/Territorio de Estados Unidos" = "América", 
  "Reino Unido de Gran Bretaña e Irlanda del Norte" = "Europa", 
  "República Dominicana" = "América", 
  "República Democrática Popular de Corea" = "Asia", 
  "Rumania" = "Europa", 
  "Federación de Rusia" = "Europa/Asia", 
  "Rwanda" = "África", 
  "San Marino" = "Europa", 
  "San Vicente y las Granadinas" = "América", 
  "Santa Lucia" = "América", 
  "Santa Sede/Ciudad del Vaticano" = "Europa", 
  "Santo Tomé y Príncipe" = "África", 
  "Senegal" = "África", 
  "Serbia" = "Europa", 
  "Sierra Leona" = "África", 
  "Singapur" = "Asia", 
  "República Árabe Siria" = "Asia", 
  "Sri Lanka" = "Asia", 
  "Sudáfrica" = "África", 
  "Sudán" = "África", 
  "Suecia" = "Europa", 
  "Suiza" = "Europa", 
  "Surinam" = "América", 
  "Tailandia" = "Asia", 
  "Territorio Antártico Británico/Territorio Británico de Ultramar" = "Antártida", 
  "Tanzania" = "África", 
  "República Democrática de Timor Oriental" = "Asia", 
  "Togo" = "África", 
  "Trinidad y Tobago" = "América", 
  "Túnez" = "África", 
  "Turquía" = "Asia", 
  "Turkmenistán" = "Asia", 
  "Ucrania" = "Europa", 
  "Uganda" = "África", 
  "Uruguay" = "América", 
  "Uzbekistán" = "Asia", 
  "Venezuela" = "América", 
  "Vietnam" = "Asia", 
  "Yugoslavia" = "Europa", 
  "Zimbabue" = "África",
  "Desconocido" = "Desconocido", 
  "República CentroÁfricana" = "África", 
  "Arabia Saudita" = "Asia", 
  "República de Armenia" = "Asia", 
  "Benín" = "África", 
  "Burundi" = "África", 
  "Camboya" = "Asia", 
  "República de Yibuti" = "África", 
  "Emiratos Árabes" = "Asia", 
  "Gambia" = "África", 
  "Islas Salomón" = "Oceanía", 
  "Papúa Occidental" = "Oceanía", 
  "Kirguistán" = "Asia", 
  "República de Kosovo" = "Europa", 
  "Lesoto" = "África", 
  "Madagascar" = "África", 
  "Mongolia" = "Asia", 
  "Mozambique" = "África", 
  "Papúa Nueva Guinea" = "Oceanía", 
  "San Cristóbal y Nevis" = "América", 
  "Samoa Occidental" = "Oceanía", 
  "Tíbet/Región Autónoma de China" = "Asia", 
  "Zambia" = "África", 
  "Guinea Bissau" = "África", 
  "Iraq" = "Asia", 
  "Liberia" = "África", 
  "Malawi" = "África", 
  "Nueva Caledonia/Territorio francés" = "Oceanía", 
  "Omán" = "Asia", 
  "Suazilandia" = "África", 
  "República de Tayikistán" = "Asia", 
  "Montenegro" = "Europa", 
  "Níger" = "África", 
  "República Árabe de Yemen" = "Asia", 
  "Afganistán" = "Asia", 
  "Cabo Verde" = "África", 
  "Islas Fiji" = "Oceanía", 
  "Hong Kong" = "Asia", 
  "Mauritania" = "África", 
  "Qatar" = "Asia", 
  "Islas Vírgenes Británicas/Territorio Británico de Ultramar" = "América", 
  "Brunei Darussalam" = "Asia", 
  "Bután" = "Asia", 
  "Eritrea" = "África", 
  "República Democrática Popular Lao" = "Asia", 
  "Somalia" = "África", 
  "Vanuatu" = "Oceanía", 
  "Palau" = "Oceanía", 
  "Anguila/Territorio Británico de Ultramar" = "América", 
  "Malí" = "África", 
  "Samoa Estadounidense/Territorio no incorporado de Estados Unidos" = "Oceanía", 
  "Islas Midway/Territorio no incorporado de Estados Unidos" = "Oceanía", 
  "Montserrat/Territorio Británico de Ultramar" = "América", 
  "Polinesia Francesa/Colectividad de Ultramar Francesa" = "Oceanía", 
  "Islas Turcas y Caicos/Territorio Británico de Ultramar" = "América", 
  "República Del Congo" = "África", 
  "Islas Pitcairn/Territorio Británico de Ultramar" = "Oceanía", 
  "Mayotte/Colectividad Territorial Francesa" = "África", 
  "Maldivas" = "Asia", 
  "Gibraltar/Territorio Británico de Ultramar" = "Europa", 
  "Seychelles" = "África", 
  "Comoras" = "África", 
  "Islas Marshall" = "Oceanía", 
  "Sahara Occidental/Desierto Sahara" = "África", 
  "Antártida" = "Antártida", 
  "Tonga" = "Oceanía", 
  "Tuvalu" = "Oceanía", 
  "Kiribati" = "Oceanía", 
  "Territorio Británico del Océano Índico/Territorios Británicos de Ultramar" = "Oceanía", 
  "Micronesia" = "Oceanía", 
  "Guam/Territorio no incorporado de Estados Unidos" = "Oceanía", 
  "Guernsey" = "Europa", 
  "Islas Heard Y Mcdonald" = "Oceanía", 
  "Islas Christmas" = "Oceanía", 
  "Refugiado" = "Desconocido", 
  "Refugiado Otro" = "Desconocido", 
  "Nauru" = "Oceanía", 
  "903" = "Desconocido", 
  "Islas Wallis y Futuna" = "Oceanía", 
  "Islas Cocos" = "Oceanía", 
  "534" = "Desconocido", 
  "Reunión" = "Europa", 
  "Islas Cook" = "Oceanía", 
  "Sudán del Sur" = "África"
)

# Asignar continente a la columna 'Continente' según la nacionalidad
basededatos$Continente <- sapply(basededatos$Nacionalidad, function(x) {
  if (x %in% names(continentes)) {
    return(continentes[x])
  } else {
    return(NA)  # Para las nacionalidades no mapeadas
  }
})

```
columns
-------------------------
```{r}
library(dplyr)
basededatos_filtrado <- basededatos %>% filter(!is.na(Continente))
basededatos_filtrado2 <- basededatos_filtrado %>%
  filter(Continente %in% c("África","América","Asia","Europa","Oceanía"))
library(ggplot2)

#Crear el gráfico de barras
  ggplot(basededatos_filtrado2, aes(x=Continente, fill=Continente)) +
     geom_bar() +
     labs(title = "Distribución de Nacionalidades por Continente",
          x = "Continente",
          y = "Cantidad de Personas") +
     theme_minimal() +
     scale_fill_brewer(palette = "Set2") + 
     theme(axis.text.x = element_text(angle = 45, hjust = 1))  # Rotar etiquetas para mejor lectura
```
  
```{r}
"🚩Intepretacion"
"Primero se organiza la base de datos eliminando las filas sin información sobre el continente, luego se seleccionan solo los registros de África, América, Asia, Europa y Oceanía, y con ellos se crea un gráfico de barras que muestra cuántas personas provienen de cada uno, usando colores distintos para facilitar la lectura, etiquetas descriptivas y un diseño claro. El análisis revela que América es el continente con más entradas a Colombia, con 30,568 personas, seguido por Asia con 28,228 y África con 28,034, lo que muestra una fuerte conexión con estas regiones, mientras que Europa aporta 24,142 visitantes y Oceanía 18,093, posiblemente debido a la lejanía geográfica, lo cual permite comprender mejor de dónde proviene el turismo internacional hacia el país."
```