setwd("/Users/valeriacantulobo/Downloads/LastDance")
Escenario del Festival Pa’l Norte por Juan Garza
Escenario del Festival Pa’l Norte por Juan Garza

Librerias

library(readxl)        # Leer archivos Excel (.xls, .xlsx)
library(dplyr)         # Manipulación de datos (filter, select, mutate, summarise, etc.)
library(ggplot2)       # Visualización de datos con la gramática de gráficos
library(vcd)           # Gráficos para análisis de variables categóricas y tablas de contingencia
library(ggmosaic)      # Crear mosaicos de gráficos para variables categóricas con ggplot2
library(scales)        # Funciones de escalas (formatos de ejes, etiquetas, breaks) para ggplot2
library(viridis)       # Para seleccionar paletas de color perceptualmente uniformes
library(ggthemes)      # Para elegir temas o plantillas de diseño para tus gráficos ggplot2
library(hrbrthemes)    # Para elegir más temas o plantillas de diseño orientados a publicaciones
library(grid)          # Sistema de gráficos base para organizar y combinar objetos gráficos (grobs)
library(leaflet)       # Crear mapas interactivos en R
library(leaflet.extras) # Para funciones adicionales de leaflet, como addHeatmap
library(lubridate)     # Manejo y manipulación sencilla de fechas y horas
library(corrplot)      # Visualización de matrices de correlación
library(tidyverse)     # Colección de paquetes para ciencia de datos (ggplot2, dplyr, tidyr, readr, etc.)
library(tidytext)      # Herramientas para análisis de texto usando la gramática de datos
library(textdata)      # Datasets de léxicos (sentimiento, categorías) para análisis de texto
library(wordcloud)     # Generar nubes de palabras a partir de texto
library(RColorBrewer)  # Paletas de color para gráficos
library(readr)         # Leer archivos de texto plano (CSV, TSV) de forma rápida
library(syuzhet)       # Extracción de sentimientos de texto usando varios métodos
library(stopwords)     # Listas de palabras vacías (stopwords) en múltiples idiomas
library(vcd)           # (Repetido) Visualización de datos categóricos y tablas de contingencia

Introducción

Contexto Actual

El turismo en Nuevo León se encuentra en una etapa de crecimiento, impulsado por el desarrollo de infraestructura, la digitalización de la industria y la organización de eventos de alto impacto, como el festival Pa’l Norte, que atrae a más de 300,000 asistentes cada año. Este tipo de eventos posiciona a la ZMM como gran atracción turística, generando una fuerte demanda en servicios de hospedaje y gastronomía.

Durante 2023, la entidad registró una derrama económica turística de más de $31,000 millones de pesos, reflejando un repunte significativo debido a la pandemia. Sin embargo, también se identifican retos en la capacidad de respuesta ante eventos masivos, así como oportunidades de crecimiento en la personalización de la oferta turística. En este contexto, el presente análisis se enfoca en entender el comportamiento y las preferencias de los turistas que asisten a Pa’l Norte, particularmente en lo que respecta a sus elecciones de hospedaje (Airbnb) y su consumo gastronómico.

A partir de encuestas aplicadas a asistentes del festival y el uso de plataformas como Google Places y Airbnb, se construyó una base de datos con información clave que nos permitirá identificar patrones de consumo, niveles de satisfacción y áreas de oportunidad para mejorar la experiencia del visitante en eventos de gran escala en Monterrey.

Glosario de Datos

Fuentes de información:

  • Encuestas aplicadas a asistentes de Pal Norte.
  • Google Places API (para clasificar y ubicar restaurantes y zonas gastronómicas).
  • Bases de datos de hospedaje de Airbnb (3 bases distintas con información sobre disponibilidad, precio y reseñas)

Método de recopilación de datos:

  • Datos cuantitativos y cualitativos recolectados mediante encuestas electrónicas.
  • Extracción automatizada de datos desde Google Places y Airbnb mediante web scraping / APIs.

Período de tiempo de los datos:

  • Base de datos demográfica y de reseñas de Airbnb:
  • Base de datos principal Airbnb: 15 de Abril del 2019 hasta 8 de Julio del 2024

Ubicación geográfica de los datos:

Monterrey, San Pedro Garza García, Guadalupe, San Nicolás, Santiago, Región Citrícola y municipios cercanos que integran la ZMM.

Diccionarios de Datos

Encuestas Pal Norte
Término Definición Fuente
compraBoletos Tipo o canal de venta del boleto (por ejemplo, Venta general, Preventa) Cuestionario Pal Norte
diasAsistencia Número total de días que el asistente asistió al evento Cuestionario Pal Norte
categoriaBoletos Categoría del boleto adquirido (por ejemplo, General, VIP) Cuestionario Pal Norte
proveniencia Origen geográfico del asistente (por ejemplo, Nacional, Internacional) Cuestionario Pal Norte
presupuestoBoletos Rango de presupuesto destinado a la compra de boletos Cuestionario Pal Norte
presupuestoAlojamiento Rango de presupuesto destinado al alojamiento (por noche) Cuestionario Pal Norte
presupuestoComidas Rango de presupuesto destinado a comidas (por día) Cuestionario Pal Norte
presupuestoTransporte Rango de presupuesto destinado a transporte (por día) Cuestionario Pal Norte
primeraVez Indica si el asistente acude por primera vez (Sí/No) Cuestionario Pal Norte
edad Rango de edad del asistente (por ejemplo, Entre 26 y 35 años) Cuestionario Pal Norte
ocupacion Ocupación o profesión declarada del asistente Cuestionario Pal Norte
gastoTurismo Variable binaria que indica si el asistente gastó en actividades de turismo (1=Sí, 0=No) Cuestionario Pal Norte
gastoSouvenirs Variable binaria que indica si el asistente compró souvenirs (1=Sí, 0=No) Cuestionario Pal Norte
gastoMerch Variable binaria que indica si el asistente compró merchandising oficial (1=Sí, 0=No) Cuestionario Pal Norte
gastoNo Variable binaria que indica si el asistente no realizó ningún gasto en las categorías anteriores (1=Sí, 0=No) Cuestionario Pal Norte
gastoOtro Variable binaria que indica si el asistente gastó en otra categoría no listada (1=Sí, 0=No) Cuestionario Pal Norte
Google Places
Término Definición Fuente
Nombre Nombre del lugar según la respuesta de la API de Lugares de Google Places API
Tipo Categoría o categorías del lugar (por ejemplo, restaurant, museum, etc.) Places API
Tiempo caminando Duración estimada de la caminata desde la ubicación del usuario hasta el lugar Places API
Distancia (km) Distancia en kilómetros desde la ubicación del usuario hasta el lugar Places API
Rango de precio Nivel de precios del lugar (de 0 = económico a 4 = muy caro) Places API
Calificación Valoración promedio del lugar en una escala de 1.0 a 5.0 Places API
Rango de tiempo Horario de apertura y cierre del lugar (por ejemplo, 09:00–18:00) Places API
Airbnb
Término Definición Fuente
Review text Descripción de la reseña dejada por los usuarios a cierto alojamiento. Reseñas Airbnb
User ID El identificador del usuario que dejó la reseña. Reseñas Airbnb
ADR Average Daily Rate. Costo promedio por noche. Airbnb principal
Occupancy Rate Total de noches ocupadas sobre el total de noches disponibles. Airbnb principal
Demand Total de noches reservadas. Airbnb principal
Revenue Ganancia recibida. Airbnb principal
RevPAR Ganancia por renta disponible. Costo promedio por noche multiplicado por el porcentaje de ocupación. Airbnb principal
Supply Total de noches ofertadas. Airbnb principal

Preguntas de Análisis

  • ¿Cuál es el tipo de hospedaje más utilizado por los turistas que asisten a Pal Norte?

  • ¿Qué zonas presentan mayor concentración de turistas en cuanto a hospedaje y gastronomía?

  • ¿Cuál es el gasto promedio en alimentos y hospedaje por perfil de visitante (edad, procedencia)?

  • ¿Qué tipo de cocina prefieren los turistas durante su estancia?

  • ¿Existe relación entre la satisfacción con la experiencia gastronómica y la ubicación del restaurante?

  • ¿Qué diferencias hay entre turistas nacionales e internacionales en patrones de consumo?

  • ¿Cuáles son los principales factores que influyen en la elección del tipo de hospedaje?

Análisis Exploratorio de los Datos

Alojamiento en Airbnb

A lo largo de 2019–2024 en la Zona Metropolitana de Monterrey, la oferta semanal de alojamientos (“Supply”) oscila entre unos 4 354 y 17 870, con un cuartil medio (Q2=12 630) por encima de la media (11 822), lo que sugiere que hay más semanas con oferta elevada y unos pocos picos muy bajos que empujan el promedio hacia abajo.

La demanda muestra un fuerte sesgo a la derecha: mientras en un 50 % de las semanas apenas se registran 303 huéspedes, el promedio (748) se ve arrastrado hacia arriba por episodios de alta ocupación de hasta 8 662 reservas. Esto se refleja en unas tasas de ocupación (“Occupancy_rate”) muy bajas de forma general, con un valor máximo de sólo 51 % en las semanas más exitosas.

El precio medio por habitación (ADR) se mantiene relativamente estable, con valores entre 46 USD y 153 USD, y una mediana de 73.71 USD casi idéntica a la media. Por su parte, el RevPAR presenta también un sesgo positivo, mostrando que la mayoría de las semanas generan muy poco ingreso por unidad, y sólo unas pocas alcanzan valores altos.

Finalmente, los ingresos semanales agregados (“Revenue”) evidencian altísima dispersión: la mitad de las semanas factura menos de 23 022 USD, pero el promedio se sitúa en 52 234 USD gracias a picos que superan los 758 770 USD. En conjunto, estos números apuntan a un negocio con ADR estable pero con grandes fluctuaciones en demanda y ocupación, que debería enfocarse en reducir la estacionalidad y en mejorar la tasa de ocupación promedio para rentabilizar la capacidad disponible.

##      Supply          Demand       Occupancy_rate         ADR        
##  Min.   : 4354   Min.   :  40.0   Min.   :0.00000   Min.   : 46.02  
##  1st Qu.: 8591   1st Qu.: 145.0   1st Qu.:0.01004   1st Qu.: 61.40  
##  Median :12630   Median : 303.5   Median :0.02992   Median : 73.71  
##  Mean   :11822   Mean   : 748.0   Mean   :0.06219   Mean   : 75.79  
##  3rd Qu.:14455   3rd Qu.: 752.2   3rd Qu.:0.06153   3rd Qu.: 83.99  
##  Max.   :17870   Max.   :8662.0   Max.   :0.51464   Max.   :153.45  
##     Rev_PAR          Revenue      
##  Min.   : 0.000   Min.   :  2677  
##  1st Qu.: 1.000   1st Qu.: 12890  
##  Median : 2.010   Median : 23022  
##  Mean   : 4.200   Mean   : 52234  
##  3rd Qu.: 4.078   3rd Qu.: 49646  
##  Max.   :52.000   Max.   :758770

Tendencias semanales de Supply, Demand, Occupancy_rate, ADR, RevPAR y Revenue

Distribución de variables

Gracias a estas gráficas podemos concluir lo siguiente:

  • Existen sesgos marcados en la distribución: Supply, la mediana (12 630) es mayor que la media (11 822), lo que indica que pocas semanas con oferta muy baja arrastran la media hacia abajo.Demand, Occupancy_rate y Revenue, aquí la media supera con creces a la mediana, mostrando un sesgo a la derecha, es decir, pocos picos de muy alta demanda y facturación elevan el promedio.

  • Baja ocupación relativa: Con una mediana de solo 2.99%, la mayoría de las semanas la tasa de ocupación es prácticamente nula, pese a que en algunas alcanza hasta 51%. Esto revela un desaprovechamiento sistemático de la capacidad ofertada.

  • Estabilidad del precio frente a volatilidad de ingresos: El ADR tiene media y mediana casi idénticas (~75 USD), lo que sugiere una política de precios consistente. Sin embargo, el RevPAR y los Revenue muestran altísima dispersión apuntando a que solo en contadas ocasiones esos precios generan ingresos sustanciales.

  • Identificación de outliers extremos: Los valores máximos quedan muy por encima del tercer cuartil, lo que indica eventos o temporadas excepcionales (festivales, congresos, fiestas) que conviene aprovechar estratégicamente.

Matriz de Correlación

De esta matriz de correlación podemos extraer varios hallazgos clave sobre cómo interactúan las métricas de Airbnb en Monterrey:

  • Demanda, RevPAR y Revenue van casi de la mano: Esto nos dice que el volumen de reservas es el principal motor de ingresos. A más reservas, más ingreso por habitación disponible y, en consecuencia, más facturación total.

  • Occupancy_rate refleja muy bien la demanda: La tasa de ocupación captura casi lo mismo que la demanda. Cuando sube la ocupación, suben directamente los ingresos por habitación.

  • El precio medio (ADR) no impulsa ingresos, incluso tiende a tensar la demanda: Subir precios promedio no aumenta los ingresos y puede mermar la demanda/ocupación. La estrategia óptima sería focalizarse más en elevar la ocupación que en elevar tarifas.

  • Supply (oferta) apenas se relaciona con ocupación e ingreso: Ampliar o reducir la oferta por sí sola no garantiza mayores ingresos ni mejor ocupación. Lo crítico es llenar esas plazas, no solo crearlas.

Esto nos llevó a generar las siguiente implicaciones prácticas resaltando lo que realmente es importante para el turísmo en la ZMM:

  • Priorizar campañas de captación de clientes (promociones, paquetes) para elevar la ocupación, que es lo que realmente mueve los ingresos.

  • Revisar la política de precios: en lugar de subir tarifas, explorar precios dinámicos que maximicen la tasa de ocupación.

  • Optimizar el uso de la oferta: en lugar de crecer el parque de alojamientos, centrar esfuerzos en mejorar la rotación y la conversión de reservas.

Comportamiento de Usuarios

Este análisis explora el comportamiento de los asistentes al festival Pal Norte según su procedencia, condición de primerizo o reincidente y duración de la estancia. Estudiaremos cómo cada grupo distribuye su presupuesto entre alojamiento y restaurantes a través de estadísticas descriptivas y visualizaciones comparativas. Con estos insights, se podrán afinar ofertas y estrategias de comunicación adaptadas a las preferencias detectadas.

Presupuestos

Análisis enfocado en turistas

Análisis Exploratorio Espacial de los Datos

Análisis de Airbnb cercanos

La exploración espacial de datos (ESDA) aplicada al comportamiento de las reseñas de hospedaje en Airbnb permite revelar patrones geográficos y dinámicas de concentración que de otra forma pasarían desapercibidos. En este estudio nos centramos en el estado de Nuevo León, donde cada reseña de un alojamiento está georreferenciada con coordenadas precisas. El objetivo principal es identificar zonas de alta actividad, posibles vacíos de oferta y diferencias en la percepción de los huéspedes según la ubicación.

Para ello, el primer paso consiste en generar dos visualizaciones complementarias:

Mapa de marcadores puntuales: cada reseña se representa como un marcador en el mapa, lo que permite observar de manera directa la dispersión y la densidad espacial de los comentarios a nivel de colonia o municipio. Esta visión granular facilita la detección de núcleos de hospedaje muy activos o, por el contrario, áreas con escasa presencia de reseñas.

Al hacer zoom en el mapa interactivo en donde se encuentra la mayor concentración de reseñas, la ubicación que prefieren los turistas nos habla de una elección fuera de las zonas residenciales o industriales, sino que se tiene un enfoque urbano. Esto quiere decir que no sólo se busca tener cercanía con eventos puntuales como lo puede ser “Pa’l Norte”, sino que también es importante el aspecto cultural más atractivo de la ciudad de Monterrey.

Después pasamos al mapa de calor (heatmap): a partir de la misma información geográfica, se construye un mapa de densidad que resalta las áreas con mayor concentración de reseñas. El gradiente de colores ilustra visualmente los “puntos calientes” —aquellos lugares donde la actividad de los huéspedes es más intensa—, y ayuda a contrastar las zonas de alta demanda con los espacios menos frecuentados.

Manteniendo un enfoque en la zona con mayor concentración de reseñas (sureste de Guadalupe) es posible observar cómo la fuerte presencia de reseñas en el centro de la ciudad tienen un enfoque turístico motivados por eventos específicos, pero la distribución por debajo del río Santa Catarina (división marcada por la separación de marcadores por avenida Constitución y el Parque Fundidora) tiene un mayor enfoque cultural, histórico y convencional. Esa región conocida como Zona Tec tiene atractivos distintos a los vistos en el centro de la ciudad ya que cuenta con Parques, Pabellones, alamedad y Bibliotecas, pero que aún representan una cantidad importante para el turismo de la zona.

Restaurantes Auto Distance

Al momento de analizar la base de datos de restaurantes nos dimos cuenta que esta tiene una distribución normal. Encontramos que la mayor cantidad de restaurantes se encuntra en un rango de 6-10 minutos. Esto nos lleva a concluir que existe una amplia variedad de restaruatnes a un rango bastante cerca del parque fundidora. Un factor importante que tiene un impacto en esto es el hecho de que el Parque Fundidora cuenta con accesos automobilistos importantes a las principales avenidas como lo es constitución, revolución, garza sada y conección directa a barrio antiguo.

Entre todos los establecimientos que se vende comida en un rango de 0 a 30 minutos del parque fundidora el principal tipo de establecimientos son: - Restaurantes - Cafeterías - Tinedas de conveniencia

Esto nos indica que el tipo de negocios que están al rededor son negocios de comida donde la persona pasa un espacio considerado de tiempo y costos más elevados.

AL momento de filtrar y quitar los establecimietnos que no tienen que ver con lugares de comida encontramos que la valoración promedio de los establecimietnos de comida es: 4.03

Restaurantes Walking Distance

En esta gráfica podemos encontrar que hay una cantidad baja de restaurantes en un rando maninado de 20 minutos o menos. Esto nos indica que la mayor cantidad de restaurantes están lejos dle parque fundidora y los asistentes tienen que caminar grandes distancias para tener una mayor cantidad de opciones. Esto se debe a la demografía de la zona. Aunque el parque fundidora sea una atracción turística, la mayoría de los lugares alrededor de esta son zonas industriales y las opciones de movilidad de forma peatonal son bastante limitadas. Esto representa una buena área de oportunidad para el cluster para poder ahcer una transofrmaicón de toda la zona a un estilo parecido a los proyectos de distrito tec y/o centrito valle en donde existe todo un distrito con todas las necesidades que una persona pueda tener.

Entre todos los establecimientos que se vende comida en un rango de 0 a 30 minutos del parque fundidora el principal tipo de establecimientos son: - Cafes (Por gran margen cuando se ocnsidera cafe y bakery como el mismo tipo de establacimientos.) - Restaurantes - Tinedas de conveniencia

Esto nos indica que la mayoría de los lugares alrededor de fundidora son panaderias o cafes en donde la opción de comida es limitada y los platillos no son muy complejos

AL momento de filtrar y quitar los establecimietnos que no tienen que ver con lugares de comida encontramos que la valoración promedio de los establecimietnos de comida es: 4.21

Análisis Geo Espacial - Restaurantes Automobile Distance

En este mapa podemos ver todos puntos de comida que se encuenrar a una distancia caminando del parque fundiddora. Podemos ver que aqui se encuentre una amplia cantidad de restaurante en un rango aceptable de tiempo de fundidora.

En este mapa de ccalor podemos ver que existen diferentes zonas con una alta concentración de restaurantes de buena calidad. Estos se encuentran en: - Barrio Antiguo - Zona de Cintermex - Calles principales cerca del parque (Revolución, Chapultepec y Garza Sada)

Analisis Geo Espacial - Restaurantes Walking Distance

En este gráfico podemos ver claramente que a comparación de los resaurantes a una distancia de automibiles la cantidad de restaurantes en un rango cerca del parque fundidra es bastante limitada. Podemos ver que la mayoría de los puntos se encuentran en la parte norte del rio santa catarina. Esto nos indica que toma mucho tiempo para las personas pasar el rio santa catarina y es dificil llegar a restauratnes del otro lado del rio. aunque la distancia en km sea la misma, el llegar a un restaurante caminando del lado del rio santa catarina donde se encuentra el parque fundidora es significativamente más facil y rápido que cruzar el rio.

  • Podemo ver que los principales hotspots de establecimientos con buena concentración de restaurantes y cantidad de opciones se encuntran en:
  • Barrio Antiguo
  • Zona Cintermex
  • Madero

Predicción de variables de importancia

Relación entre presupuesto de alojamiento vs reincidencia

## 
##  Pearson's Chi-squared test
## 
## data:  tab
## X-squared = 2.2246, df = 3, p-value = 0.5271
## [1] 0.1710871

Entre primeraVez y presupuesto de alojamiento, el valor de p = 0.5271 supera el umbral de 0.05, por lo que no hay evidencia estadística para rechazar la hipótesis de independencia. Además, el Cramer’s V = 0.171 indica una asociación débil si existiese, pero dado el p-valor alto podemos concluir que el hecho de ser turista primerizo o reincidente no influye significativamente en la clasificación del presupuesto de alojamiento.

Relación entre gasto en turismo vs reincidencia

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tab
## X-squared = 4.1567, df = 1, p-value = 0.04147
## [1] 0.2619894

En el caso de primeraVez versus gastoTurismo, se obtuvo p = 0.04147, lo que está por debajo de 0.05 y señala una asociación estadísticamente significativa entre la condición de visitante y su gasto en actividades turísticas. El Cramer’s V = 0.262 sugiere una relación de intensidad moderada-débil, es decir, aunque existe una diferencia real en cómo primíparos y reincidentes distribuyen su gasto en turismo, no es una asociación muy fuerte.

## 
##  Pearson's Chi-squared test
## 
## data:  tab
## X-squared = 6.164, df = 2, p-value = 0.04587
## [1] 0.284789

Para primeraVez contra DiasAsistencia, el p = 0.04587 también cae por debajo de 0.05, indicando dependencia entre ser primerizo o reincidente y el número de días de asistencia. Con un Cramer’s V = 0.285, la fuerza de la relación es moderada, lo que corrobora que los reincidentes tienden a asistir durante más días que los visitantes primerizos.

En conjunto, los resultados muestran que el perfil de primera visita o de retorno no condiciona el presupuesto de alojamiento, pero sí influye de manera significativa tanto en el gasto en actividades turísticas como en la duración de la estancia. Esto implica que, aunque el alojamiento lo eligen de forma similar, los turistas que regresan no solo extienden su presencia en el evento, sino que también destinan un mayor porcentaje de su presupuesto a experiencias turísticas.

Análisis de Sentimiento de la experiencia del Cliente

El análisis de sentimiento de las reseñas de hospedaje en Airbnb para el área de Nuevo León busca transformar opiniones cualitativas en indicadores cuantificables de satisfacción y percepción de los huéspedes. Mediante técnicas de procesamiento de lenguaje natural identificaremos las emociones predominantes asociadas a cada comentario. Este enfoque permite no solo medir el pulso general de la experiencia de los visitantes, sino también detectar áreas específicas de mejora en servicios, infraestructura o atención al cliente, aportando insumos valiosos para optimizar la oferta turística de la región.

La visualización mediante nubes de palabras de las reseñas mejor y peor valoradas permite identificar de un vistazo los términos que describen con mayor fuerza las experiencias positivas y las negativas de los huéspedes. Por un lado, la nube de las mejores reseñas mostrará en mayor tamaño las palabras que reflejan aspectos de alto valor. Por otro, la nube de las peores reseñas destacará términos asociados a insatisfacción que podría puntualizar aspectos que son importantes para los huéspedes y que no están siendo cumplidos de la mejor manera. Al contrastar ambos conjuntos, podemos descubrir con rapidez qué factores generan deleite y cuáles provocan molestias, lo que orienta de manera directa las acciones de mejora continua en el servicio de hospedaje.

Por el contrario, en las nubes de las mejores reseñas predominan términos que apuntan a calidad de servicio y confort:

  • “excelente”, “agradable” y “seguro” muestran una valoración muy positiva de la experiencia global.
  • “limpieza” es un concepto central en un sentido de tener espacios bien cuidados.
  • “anfitrión”, “atento” y “amable” ponen de relieve la importancia de un buen trato por parte del anfitrión.
  • Palabras como “casa”, “familia” o “servicios” refuerzan la sensación de un ambiente acogedor y bien equipado, mientras que “ubicación” indica que la localización fue un factor valorado positivamente.

En las nubes de palabras de las peores reseñas destacan, sobre todo, términos asociados a problemas de higiene y mantenimiento:

  • “baño”, “suciedad”, “basura”, “excrementos” señalan fallas en la limpieza, especialmente en los sanitarios.
  • “habitación”, “lugar” y “casa” aparecen de forma genérica, pero acompañados de calificativos negativos como “horrible”, “desagradable” o “mal”, reflejando insatisfacción con el estado general del alojamiento.
  • Palabras como “ni siquiera”, “solo” o “incluso” sugieren que los huéspedes percibieron carencias básicas que esperaban encontrarse cubiertas.

Percepción de reseñas

El análisis de sentimiento de las reseñas de hospedaje en Nuevo León se fundamenta en asignar cada palabra a una emoción usando el lexicón NRC y luego contar cuántas palabras de cada tipo aparecen. Con ello obtenemos un perfil emocional de la experiencia de los huéspedes: identificamos si predominan sentimientos positivos o negativos y en qué proporción. Esta métrica cuantitativa permite comprender de manera precisa la percepción general y focalizar mejoras en los aspectos que generan las emociones más frecuentes.

En este punto dividimos el análisis para tener en cuanta la percepción de las mejores reseñas en contraste con las peores.

Valoraciones positivas

Con la gráfica que está a continuación se puede concluir que lo que más valoran las personas al tener una buena experiencia es la confianza que se les transmite a lo largo de todo el proceso. Aspectos clave como una clara comunicación con el anfitrión, transparencia de costos y anuncios que publicitan los lugares como realmente son pueden potenciar este sentimiento y convertirse en factores relevantes al momento de potenciar el turismo en Nuevo León. Además los siguientes sentimientos de alegría y positivismo se pueden relacionar más con las experiencias que tienen los huéspedes cerca de su alojamiento, por lo que contar con atracciones cerca del Airbnb puede impactar directamente con la percepción que tienen los clientes sobre su experiencia en general.

Valoraciones negativas

Con la gráfica de emociones negativas, se observa que el sentimiento genérico de negatividad, junto con disgusto y miedo, concentran la mayor parte de las palabras asociadas a malas experiencias. Esto sugiere que los viajeros se enfrentan sobre todo a problemas de higiene deficiente y a una mala percepción de seguridad en el alojamiento. A su vez, el alto nivel de ira indica una posible frustración motivada por incumplimientos de lo prometido en el anuncio. Para atenuar estos factores negativos y mejorar la percepción del destino, es clave implementar protocolos estrictos de limpieza y mantenimiento, así como reforzar la sensación de seguridad con cerraduras de calidad, sistemas de iluminación exterior y rondines de supervisión. Además, una comunicación transparente desde la reserva minimizará la ira de los huéspedes al no encontrar sorpresas desagradables a su llegada. De este modo, se reducirán los disgustos e inseguridades que hoy predominan en las reseñas negativas y se elevará la satisfacción global de los visitantes.

A partir del análisis de sentimiento realizado y del ESDA, se generaron las siguientes propuestas que buscan impulsar el turismo en Nuevo León.

  • Creación de protocolos sugeridos: Poner al alcance de los dueños de alojamientos un sistema de protocolos y medidas de seguridad que se considerarían lo ideal para los huéspedes. Si bien no se cuenta con una autoridad directa para ejercer los protocolos, serían sugerencias que al momento de seguirlas los alojamientos podrían potenciar su atractivo para los nuevos turistas.

  • Certificaciones para alojamientos dentro de la ciudad: Impartir talleres de amabilidad y atención donde los anfitriones pueden profesionalizar sus procesos y sumar un distintivo que los posicione mejor dentro del mercado. Dentro de los mismos se suman módulos específicos de comunicación clara y de políticas de costos/cancelación transparentes. Se podría considerar una certificación por niveles, con webinars y material descargable, y los anfitriones formados obtienen un badge visible en sus anuncios.

  • Incentivos fiscales y subvenciones orientados a emociones clave: Se podrían ofrecer cierto tiempo de créditos o deducciones para alojamientos que demuestren altos puntajes de confianza y alegría en encuestas post-estancia, y que mantengan cero reportes de disgusto e incidentes de inseguridad. Quizá posibles acuerdos con tiendas de conveniencia o establecimientos que se benefician del turismo logren permitir recompensar a los anfitriones que tienen un alojamiento considerado como una opción muy agradable por los huéspedes que atrae.

Hallazgos

  • Hallazgo 1: Concentración en cadenas gastronómicas: Los recorridos muestran que los asistentes prefieren opciones comerciales ampliamente conocidas, dejando fuera restaurantes locales. Esto representa una oportunidad de integración para negocios regionales.
  • Hallazgo 2: ⁠existe una cantidad limitada de movilidad para peatones alrededor de la zona del parque fundidora, el hecho de que sea una zona industrial limita la oferta gastronómica en la zona.
  • Hallazgo 3: Relación entre primera vez en el festival y días de asistencia: Se encontró una relación estadísticamente significativa entre si es la primera vez que una persona asiste al festival y el número de días que permanece, así como con su nivel de gasto en turismo. No obstante, el impacto de estas variables es bajo.
  • Hallazgo 4: Gasto promedio por tipo de turista: Los visitantes internacionales presentan un gasto promedio superior en hospedaje y gastronomía, lo que representa una oportunidad para crear ofertas dirigidas a este segmento.
  • Hallazgo 5: De Airbnb tener un acercamiento con los anfitriones para asegurar una buena experiencia es fundamental y que tener más eventos como Pal Norte distribuidos a lo largo del año puede regular la demanda y considerarse un ingreso constante en lugar de estacional
  • Hallazgo 6: Gasto estable por duración del evento: Se observó que el gasto total no varía significativamente entre quienes asisten uno, dos o tres días al evento, lo que indica que el impacto económico proviene más del volumen de asistentes que de la duración de su estancia.
  • Hallazgo 7: Zonas de alta concentración identificadas por mapas de calor: Las visualizaciones espaciales permitieron detectar zonas de alta afluencia y tránsito peatonal, útiles para la planeación de servicios como transporte, señalización y seguridad.

Conclusión

El análisis integral de datos relacionados con la experiencia de los asistentes al festival Pa’l Norte permitió identificar patrones clave en el comportamiento turístico, las preferencias de consumo y las dinámicas de movilidad en la zona de Parque Fundidora. A través del cruce entre encuestas, datos de Airbnb y mapas geoespaciales, se logró una visión más completa del impacto que este tipo de eventos genera en la ciudad.

Entre los principales hallazgos destacan la concentración de consumo en cadenas gastronómicas, la limitada infraestructura peatonal en una zona industrial, y la importancia de la primera experiencia del asistente en su nivel de gasto y permanencia. Asimismo, se evidenció que los turistas internacionales gastan más que los nacionales, y que la duración de la estancia no representa una diferencia significativa en el gasto total, por lo que el volumen de visitantes es el factor crítico para maximizar el impacto económico.

Finalmente, se concluye que mejorar la experiencia de hospedaje a través de colaboraciones con anfitriones de Airbnb, diversificar la oferta gastronómica local, y considerar la organización de eventos similares en distintas fechas del año puede contribuir a una derrama económica más equilibrada, continua y sostenible para Monterrey como destino turístico.