1. Introducción y Alcance del Proyecto

1.1 Objetivo

Analizar el comportamiento del consumidor de productos y servicios de turismo para el mercado colombiano en cinco ciudades principales, bajo el marco de la Encuesta de Gasto Interno en Turismo (EGIT) del DANE, trimestre IV del año 2023, y proponer un plan de acción para “Global Corporation”.

1.2 Delimitación del Estudio

Las ciudades seleccionadas para el estudio fueron:

  • Bogotá D.C. (Código DANE: 11001) - Ranking ICTR: 1, Puntaje: 8.02
  • Medellín (Código DANE: 05001) - Ranking ICTR: 2, Puntaje: 6.94
  • Cartagena (Código DANE: 13001) - Ranking ICTR: 4, Puntaje: 6.58
  • Barranquilla (Código DANE: 08001) - Ranking ICTR: 6, Puntaje: 6.41
  • Santa Marta (Código DANE: 47001) - Ranking ICTR: 9, Puntaje: 6.00

1.3 Preparación y Carga de Datos

# Cargar datos
datos <- read.csv("TURISMO.csv", sep = "|")

# Preparación mejorada de datos
df_turismo <- datos %>%
  filter(P7570 == 1) %>%
  filter(P7573S2 %in% c(11001, 47001, 05001, 13001, 08001)) %>%
  transmute(
    vlr_total = P7578,
    duracion = P7571S2A1,
    num_personas = P7576S1,
    gasto_alojamiento = P7577S1,
    gasto_transporte = P7577S2,
    gasto_alimentos = P7577S3,
    gasto_actividades = P7577S6,
    ciudad = factor(P7573S2,
      levels = c(11001, 47001, 05001, 13001, 08001),
      labels = c("Bogotá", "Santa Marta", "Medellín", "Cartagena", "Barranquilla")
    ),
    gasto_diario = vlr_total / duracion,
    segmento = case_when(
      gasto_diario <= quantile(gasto_diario, 0.33, na.rm = TRUE) ~ "Económico",
      gasto_diario <= quantile(gasto_diario, 0.66, na.rm = TRUE) ~ "Medio",
      TRUE ~ "Premium"
    ) %>% factor(levels = c("Económico", "Medio", "Premium")),
    temporada = case_when(
      duracion <= 3 ~ "Corta",
      duracion <= 7 ~ "Media",
      TRUE ~ "Larga"
    ) %>% factor(levels = c("Corta", "Media", "Larga"))
  )

# Resumen inicial de los datos
summary_stats <- df_turismo %>%
  group_by(ciudad) %>%
  summarise(
    n = n(),
    gasto_medio = mean(vlr_total, na.rm = TRUE),
    duracion_media = mean(duracion, na.rm = TRUE),
    personas_media = mean(num_personas, na.rm = TRUE)
  )

kable(summary_stats, 
      format = "html",
      caption = "Resumen Estadístico por Ciudad") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Resumen Estadístico por Ciudad
ciudad n gasto_medio duracion_media personas_media
Bogotá 149 937735.2 1.107383 4.000000
Santa Marta 56 1647083.8 1.035714 3.000000
Medellín 85 1098835.1 1.035294 NaN
Cartagena 57 2612303.4 1.122807 1.769231
Barranquilla 81 944678.8 1.037037 NaN

2. Análisis del Comportamiento del Consumidor

2.1 Patrones de Gasto y Correlaciones

# Matriz de correlaciones
vars_numericas <- c("vlr_total", "duracion", "num_personas", 
                    "gasto_alojamiento", "gasto_transporte", 
                    "gasto_alimentos")

matriz_cor <- df_turismo %>%
  select(all_of(vars_numericas)) %>%
  cor(use = "complete.obs")

corrplot(
  matriz_cor,
  method = "color",
  type = "upper",
  addCoef.col = "black",
  tl.col = "black",
  tl.srt = 45,
  col = colorRampPalette(c("#FF9999", "#FFFFFF", "#66B2FF"))(100),
  title = "Matriz de Correlación - Variables Principales",
  mar = c(0,0,2,0)
)

2.1.1 Interpretación de Correlaciones

  • Perfil de Gasto Prolongado: Mayor duración se asocia con mayores gastos en alojamiento y alimentos
  • Viajes en Grupo: Tendencia a optimizar costos en alojamiento y transporte
  • Segmentación Premium: Correlación positiva entre gastos de alojamiento y alimentación

2.2 Análisis por Ciudad

# Gráfico de violín y barras
p1 <- ggplot(df_turismo, aes(x = ciudad, y = vlr_total/1000000, fill = ciudad)) +
  geom_violin(alpha = 0.7) +
  geom_boxplot(width = 0.2, alpha = 0.6, color = "white") +
  scale_fill_manual(values = tourism_colors) +
  scale_y_continuous(
    labels = scales::comma_format(suffix = "M"),
    breaks = seq(0, max(df_turismo$vlr_total/1000000, na.rm = TRUE), by = 2)
  ) +
  labs(
    title = "Distribución del Gasto Turístico por Ciudad",
    subtitle = "Análisis de la variabilidad del gasto total en millones de COP",
    x = "Ciudad de Destino",
    y = "Gasto Total (Millones COP)",
    fill = "Ciudad"
  ) +
  theme_tourism() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

2.2.1 Análisis de la Distribución del Gasto

Variabilidad del Gasto: El gráfico de violín muestra la distribución del gasto total en millones de COP (pesos colombianos) para cada ciudad de destino. Las formas de los gráficos de violín indican la variabilidad en el gasto turístico, destacando las diferencias en la dispersión y la concentración de los datos.

Conclusión: Cartagena y Santa Marta destacan como destinos con mayor gasto, mientras que Bogotá, Medellín y Barranquilla tienen una base de turistas que tienden a gastar menos, reflejando diferencias en el tipo de turismo (lujo vs. económico) y en las actividades disponibles en cada ciudad.

p2 <- df_turismo %>%
  group_by(ciudad, segmento) %>%
  summarise(
    gasto_promedio = mean(vlr_total/1000000, na.rm = TRUE),
    n = n()
  ) %>%
  ggplot(aes(x = ciudad, y = gasto_promedio, fill = segmento)) +
  geom_bar(stat = "identity", position = "dodge") +
  scale_fill_manual(values = c("#FFD93D", "#6BCB77", "#4D96FF")) +
  scale_y_continuous(labels = scales::comma_format(suffix = "M")) +
  labs(
    title = "Gasto Promedio por Segmento y Ciudad",
    subtitle = "Comparación del gasto turístico entre segmentos de mercado",
    x = "Ciudad de Destino",
    y = "Gasto Promedio (Millones COP)",
    fill = "Segmento"
  ) +
  theme_tourism() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

# Combinar gráficos
p1 / p2 + plot_layout(heights = c(1.2, 1))

2.2.2 Análisis por Segmentos de Mercado

Conclusión: Cartagena y Santa Marta se posicionan como destinos premium, con altos niveles de gasto en el segmento de lujo. Bogotá y Medellín tienen una oferta turística orientada al segmento medio, mientras que Barranquilla muestra un predominio de opciones económicas.

3. Plan de Acción para Global Corporation

3.1 Objetivo General

Incrementar la rentabilidad de Global Corporation en el sector turístico mediante la implementación de paquetes premium enfocados en turistas de alto gasto, ofreciendo experiencias integrales en alojamiento y gastronomía.

3.2 Objetivos Específicos

  1. Identificar y segmentar turistas con perfil de alto gasto
  2. Diseñar y comercializar paquetes turísticos exclusivos
  3. Implementar estrategia de marketing digital dirigida
  4. Monitorear y optimizar acciones mediante KPIs

3.3 Plan de Implementación

Actividades Principales:

  1. Segmentación del Mercado (1 mes)
    • Análisis de datos históricos
    • Identificación de perfiles premium
    • Desarrollo de modelo predictivo
  2. Diseño de Paquetes Premium (2 meses)
    • Creación de experiencias exclusivas
    • Establecimiento de alianzas estratégicas
    • Definición de precios y márgenes
  3. Estrategia de Marketing Digital (3 meses, continuo)
    • Desarrollo de campaña digital
    • Creación de contenido premium
    • Optimización de canales
  4. Programa de Lealtad (4 meses)
    • Diseño del programa
    • Implementación de beneficios
    • Seguimiento de resultados
  5. Capacitación del Personal (1 mes)
    • Entrenamiento en servicio premium
    • Desarrollo de habilidades
    • Evaluación de competencias
  6. Monitoreo y Análisis (continuo)
    • Seguimiento de KPIs
    • Ajustes de estrategia
    • Reportes de resultados

3.4 Presupuesto Total: 500,000,000 COP

Distribución del Presupuesto:

  • Marketing Digital: 30% (150,000,000 COP)
  • Alianzas y Colaboraciones: 20% (100,000,000 COP)
  • Capacitación y Desarrollo: 15% (75,000,000 COP)
  • Diseño de Paquetes: 25% (125,000,000 COP)
  • Monitoreo y Análisis: 10% (50,000,000 COP)