Analizar el comportamiento del consumidor de productos y servicios de turismo para el mercado colombiano en cinco ciudades principales, bajo el marco de la Encuesta de Gasto Interno en Turismo (EGIT) del DANE, trimestre IV del año 2023, y proponer un plan de acción para “Global Corporation”.
Las ciudades seleccionadas para el estudio fueron:
# Cargar datos
datos <- read.csv("TURISMO.csv", sep = "|")
# Preparación mejorada de datos
df_turismo <- datos %>%
filter(P7570 == 1) %>%
filter(P7573S2 %in% c(11001, 47001, 05001, 13001, 08001)) %>%
transmute(
vlr_total = P7578,
duracion = P7571S2A1,
num_personas = P7576S1,
gasto_alojamiento = P7577S1,
gasto_transporte = P7577S2,
gasto_alimentos = P7577S3,
gasto_actividades = P7577S6,
ciudad = factor(P7573S2,
levels = c(11001, 47001, 05001, 13001, 08001),
labels = c("Bogotá", "Santa Marta", "Medellín", "Cartagena", "Barranquilla")
),
gasto_diario = vlr_total / duracion,
segmento = case_when(
gasto_diario <= quantile(gasto_diario, 0.33, na.rm = TRUE) ~ "Económico",
gasto_diario <= quantile(gasto_diario, 0.66, na.rm = TRUE) ~ "Medio",
TRUE ~ "Premium"
) %>% factor(levels = c("Económico", "Medio", "Premium")),
temporada = case_when(
duracion <= 3 ~ "Corta",
duracion <= 7 ~ "Media",
TRUE ~ "Larga"
) %>% factor(levels = c("Corta", "Media", "Larga"))
)
# Resumen inicial de los datos
summary_stats <- df_turismo %>%
group_by(ciudad) %>%
summarise(
n = n(),
gasto_medio = mean(vlr_total, na.rm = TRUE),
duracion_media = mean(duracion, na.rm = TRUE),
personas_media = mean(num_personas, na.rm = TRUE)
)
kable(summary_stats,
format = "html",
caption = "Resumen Estadístico por Ciudad") %>%
kable_styling(bootstrap_options = c("striped", "hover"))| ciudad | n | gasto_medio | duracion_media | personas_media |
|---|---|---|---|---|
| Bogotá | 149 | 937735.2 | 1.107383 | 4.000000 |
| Santa Marta | 56 | 1647083.8 | 1.035714 | 3.000000 |
| Medellín | 85 | 1098835.1 | 1.035294 | NaN |
| Cartagena | 57 | 2612303.4 | 1.122807 | 1.769231 |
| Barranquilla | 81 | 944678.8 | 1.037037 | NaN |
# Matriz de correlaciones
vars_numericas <- c("vlr_total", "duracion", "num_personas",
"gasto_alojamiento", "gasto_transporte",
"gasto_alimentos")
matriz_cor <- df_turismo %>%
select(all_of(vars_numericas)) %>%
cor(use = "complete.obs")
corrplot(
matriz_cor,
method = "color",
type = "upper",
addCoef.col = "black",
tl.col = "black",
tl.srt = 45,
col = colorRampPalette(c("#FF9999", "#FFFFFF", "#66B2FF"))(100),
title = "Matriz de Correlación - Variables Principales",
mar = c(0,0,2,0)
)# Gráfico de violín y barras
p1 <- ggplot(df_turismo, aes(x = ciudad, y = vlr_total/1000000, fill = ciudad)) +
geom_violin(alpha = 0.7) +
geom_boxplot(width = 0.2, alpha = 0.6, color = "white") +
scale_fill_manual(values = tourism_colors) +
scale_y_continuous(
labels = scales::comma_format(suffix = "M"),
breaks = seq(0, max(df_turismo$vlr_total/1000000, na.rm = TRUE), by = 2)
) +
labs(
title = "Distribución del Gasto Turístico por Ciudad",
subtitle = "Análisis de la variabilidad del gasto total en millones de COP",
x = "Ciudad de Destino",
y = "Gasto Total (Millones COP)",
fill = "Ciudad"
) +
theme_tourism() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))Variabilidad del Gasto: El gráfico de violín muestra la distribución del gasto total en millones de COP (pesos colombianos) para cada ciudad de destino. Las formas de los gráficos de violín indican la variabilidad en el gasto turístico, destacando las diferencias en la dispersión y la concentración de los datos.
Conclusión: Cartagena y Santa Marta destacan como destinos con mayor gasto, mientras que Bogotá, Medellín y Barranquilla tienen una base de turistas que tienden a gastar menos, reflejando diferencias en el tipo de turismo (lujo vs. económico) y en las actividades disponibles en cada ciudad.
p2 <- df_turismo %>%
group_by(ciudad, segmento) %>%
summarise(
gasto_promedio = mean(vlr_total/1000000, na.rm = TRUE),
n = n()
) %>%
ggplot(aes(x = ciudad, y = gasto_promedio, fill = segmento)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_manual(values = c("#FFD93D", "#6BCB77", "#4D96FF")) +
scale_y_continuous(labels = scales::comma_format(suffix = "M")) +
labs(
title = "Gasto Promedio por Segmento y Ciudad",
subtitle = "Comparación del gasto turístico entre segmentos de mercado",
x = "Ciudad de Destino",
y = "Gasto Promedio (Millones COP)",
fill = "Segmento"
) +
theme_tourism() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
# Combinar gráficos
p1 / p2 + plot_layout(heights = c(1.2, 1))Conclusión: Cartagena y Santa Marta se posicionan como destinos premium, con altos niveles de gasto en el segmento de lujo. Bogotá y Medellín tienen una oferta turística orientada al segmento medio, mientras que Barranquilla muestra un predominio de opciones económicas.
Incrementar la rentabilidad de Global Corporation en el sector turístico mediante la implementación de paquetes premium enfocados en turistas de alto gasto, ofreciendo experiencias integrales en alojamiento y gastronomía.