Introducción

En las últimas décadas, la sostenibilidad ha evolucionado de ser una preocupación secundaria a convertirse en uno de los principales desafíos a nivel global. La Organización de las Naciones Unidas ha reiterado en múltiples ocasiones la necesidad de adoptar modelos de desarrollo más responsables, especialmente debido a la firma de los Objetivos de Desarrollo Sostenible en el año 2015. El turismo, considerado uno de los sectores económicos más cruciales a nivel mundial, ha experimentado transformaciones significativas. De acuerdo con la ONU Turismo, en 2022, más del 70% de los viajeros internacionales manifestó su disposición a modificar sus hábitos con el fin de reducir su huella ecológica y cada año, un número creciente de destinos promueve certificaciones “verdes” y programas de turismo responsable.

En Europa, el interés por la sostenibilidad se ha manifestado tanto en las políticas públicas como en el comportamiento de los viajeros. El Pacto Verde Europeo, que fue presentado en el año 2019, ha colocado la transición ecológica como un elemento central en la recuperación posterior a la pandemia, promoviendo iniciativas destinadas a mitigar el impacto del turismo en las ciudades y en los espacios naturales. Además, encuestas recientes de Eurostat y de la Comisión Europea indican que más del 50% de los europeos consideran la sostenibilidad un factor determinante al seleccionar un destino.

En este trabajo, se utilizan herramientas como Google Trends, que permiten la visualización en tiempo real de las tendencias de búsqueda de conceptos clave. Esto ayuda a entender las fluctuaciones en la popularidad del término “turismo sostenible” y su equivalente en inglés, “sustainable tourism”, en distintas regiones y períodos de tiempo. Este tipo de análisis facilita la identificación de patrones estacionales, picos de interés vinculados a eventos específicos o campañas institucionales, así como variaciones culturales en la percepción y adopción del turismo sostenible.

Con el siguiente código se importan dos conjuntos de datos:

  1. timeline: Contiene datos de la tendencia (popularidad) del término “turismo sostenible” en español y en inglés. Hay una fila por semana.

  2. gtrends: Contiene datos de la tendencia del término “sustainable tourism” en todo el mundo en un determinado mes para cada país.

library(readxl)
timeline <- read_excel("timeline.xlsx")
gtrends <- readRDS("gtrends_geo.rds")

Evolución de tendencias en Google

library(dplyr)
library(tidyr)
library(ggplot2)

df <- timeline |> 
  pivot_longer(2:3, names_to = "term", values_to = "trend")

ext <- df |> 
  group_by(term) |> 
  filter(trend == max(trend) | trend == min(trend))

ggplot(df, aes(week, trend, col = term)) +
  geom_line() +
  geom_point(data = ext, aes(x = week, y = trend), color = "red", size = 3) +
  geom_text(data = ext, aes(label = trend), vjust = -0.8, size = 4, color = "red") +
  scale_color_manual(values = c(
    "en_sustainable_tourism" = "green",
    "es_turismo_sostenible" = "yellow"
  )) +
  theme_bw()

El gráfico muestra la evolución desde el año 2020 hasta 2024 sobre el interés de búsqueda para “en_sustainable_tourism” (verde, inglés) y “es_turismo_sostenible” (amarillo, español). El eje Y indica la tendencia relativa, siendo 100 el punto de mayor popularidad.

Mínimos al inicio de 2020 (Español 6, Inglés 24):

Los valores mínimos de ambos coinciden con el inicio de la pandemia de COVID-19, cuando hubo un paro casi total del sector turístico a nivel mundial. Los temas relacionados con turismo, ya sea sostenible o no, tuvieron un descenso general en búsquedas, debido a que las fronteras estaban cerradas y la prioridad global era la salud. En marzo del 2020, ONU TURISMO reportó una caída histórica en los viajes internacionales, lo que se refleja en el menor interés por cualquier tema turístico.

Máximo en español (40, 2022):

El interés por el “turismo sostenible” en español alcanzó su punto más alto en 2022. Esto puede estar relacionado con la recuperación gradual del turismo tras la pandemia y el impulso de políticas de sostenibilidad por gobiernos y organismos internacionales.

Máximo en inglés (100, cerca de 2023):

Este máximo en inglés puede estar vinculado a eventos globales famosos. Por ejemplo, a finales de 2021 e inicios del 2022, se celebraron conferencias importantes como la COP 26 (Glasgow, noviembre 2021), donde el turismo sostenible fue uno de los temas de discusión principal. Organizaciones como la UNWTO y destinos turísticos internacionales publicaron numerosos informes y campañas en inglés sobre la importancia del turismo sostenible en la recuperación económica post-pandemia.

Tendencias:

El gráfico muestra que tanto en inglés como en español hay subidas periódicas, probablemente debido a las temporadas altas de turismo (verano/ vacaciones) o eventos internacionales.

Distribución de tendencias de Google

timeline |> 
  pivot_longer(cols = 2:3, names_to = "term", values_to = "trend") |> 
  ggplot(aes(x = trend, fill = term)) +
  geom_density(alpha = 0.4, linewidth = 1, color = "black") +
  geom_rug(alpha = 0.2) +
  scale_fill_manual(values = c("green", "yellow")) +
  labs(fill = "Término de búsqueda")

El gráfico por comentar compara la distribución de la tendencia (trend) recogida de los datos de Google representada en el eje X, la cuál va de 0 a 100, con los siguientes dos términos de búsqueda: Turismo sostenible (en español) y sustainable tourism (en inglés). El objetivo de este gráfico es poder interpretar en qué idioma es más buscado y en consecuencia más popular el turismo sostenible. El gráfico contiene datos de la tendencia del término “turismo sostenible” en español e inglés y cuenta con una fila por semana.

En primer lugar, definiremos qué representa cada eje del gráfico de densidad:

En relación con el análisis de las distribuciones, el gráfico muestra dos variables distintas:

1.Término: en_sustainable_tourism representado con el color verde. Hace referencia al turismo sostenible en inglés. Con respecto a la forma de la curva, es una distribución más dispersa representada de manera más aplanada y ancha que la del otro término y es bimodal, ya que cuenta con dos picos principales que se encuentran aproximadamente alrededor de 50 y 80, siendo la moda relacionada con el pico principal de 55. Además, su altura máxima es considerablemente menor ( 0,02 aproximadamente) que la del término en amarillo (alrededor de 0,065). La interpretación que se puede extraer de los datos observados es que la búsqueda en inglés tiene valores mucho más elevados ( entre 50 y 90) que la búsqueda en español. Así mismo, esta tendencia está más distribuida en un amplio rango de tiempo.

2.Término: es_turismo_sostenible indicado con la curva de densidad de color amarillo. La forma de la curva representa una distribución muy concentrada con una moda en el valor 25 del eje “trend” muy marcada y alta, por lo que se trata de una curva leptocúrtica. Todo ello indica que la mayoría de los valores de tendencia para la búsqueda del turismo sostenible se encuentran en un rango bajo entre 20 y 40. Por lo tanto, presenta unos valores de búsqueda más bajos que el término sustainable tourism pero más consistentes en el rango mencionado anteriormente, por lo que cuando se busca se concentra en valores bajos de tendencia con ningún caso de popularidad alta.

En conclusión, el término “sustainable tourism” tiene una popularidad superior a la del término “turismo sostenible”. La variable en inglés se concentra entre 50-75, mientras que la variable en español se sitúa entre 20-35 principalmente. Es más, el término en inglés presenta mayor variabilidad y una distribución más extendida mientras que “turismo sostenible” tiene menos variabilidad y no suele alcanzar valores altos. Como resultado, la gráfica propone que los dos términos corresponden a patrones de interés muy distintos, lo que sugiere principalmente diferencias de mercado y mayor penetración global del término en inglés.

Las actualizaciones realizadas sobre el chunk original han sido las siguientes: En primer lugar, le hemos añadido contornos al gráfico para conseguir una mayor claridad con el objetivo de facilitar la interpretación cuando las densidades de ambos términos se solapan. Hemos conseguido mejorarlo añadiendo este código: geom_density(alpha = 0.4, linewidth = 1, color = “black”). En segundo lugar, hemos decidido incorporar un rug plot, el cuál confirmó la separación entre ambos conjuntos ya que las marcas relacionadas con el turismo sostenible están juntas y más a la izquierda (20-35) mientras que las marcas de sustainable tourism están a la derecha, muchas incluso entre 70 y 100. La elaboración del rug plot ha sido posible gracias al siguiente código: geom_rug(alpha = 0.2). Por último, queríamos cambiarle el color y decidimos asignarle a uno de los términos el color verde y a otro el amarillo a través de la incorporación del siguiente código: scale_fill_manual(values = c(“green”, “yellow”)).

timeline |> 
  ggplot(aes(x = es_turismo_sostenible)) +
  geom_histogram(
    bins = 12,
    fill = "yellow",
    col = "white",
    alpha = 0.8
  ) +
  geom_density(
    aes(y = after_stat(count)),
    linewidth = 1.2,
    color = "blue",
    alpha = 0.4
  ) +
  geom_freqpoly(
    aes(y = after_stat(count)),
    bins = 12,
    linewidth = 1.2
  )

El gráfico superior muestra un histograma sobre las búsquedas de turismo sostenible con datos de Google durante las semanas comprendidas entre 2019 y el año 2024, es decir, a lo largo de los últimos 5 años.

Un histograma muestra cuántas veces el count ubicado en el eje vertical tiene una observación dentro de ciertos rangos o “bins” que corresponden a las barras del eje horizontal.

La distribución es relativamente simétrica, aunque ligeramente sesgada a la derecha, señal de que las semanas de alta popularidad son menos frecuentes, se puede considerar como un histograma con forma de campana. Esto significa que hay más semanas con valores altos que con valores muy bajos, aunque los valores altos no dominan dentro de la distribución. La moda es representada por la barra más alta que se encuentra en valores de 20 a 25 aproximadamente, por lo que la mayoría de las semanas presentan esos valores de popularidad. De igual forma, la media o la mediana se encuentra situada en algún punto entre 20 y 30. Todo ello indica que la búsqueda del término mantiene una popularidad estable y moderada la mayor parte del tiempo.

En cuánto al rango de valores, la tendencia “es_turismo_sostenible” recoge unos valores que van desde cerca de 5 hasta pasados los 40. Así mismo, la mayoría de observaciones se concentran en un rango de 15 a 35. Por lo tanto, los valores de tendencia más comunes se ubican entre 20 y 25, mientras que los valores de tendencia altos situados por encima de 35 y bajos con un valor inferior a 10 son poco comunes. Solo en semanas muy concretas como puede ser la Navidad la popularidad cae a niveles entre 6 y 12, por lo que las caídas fuertes son ocasionales y asociadas a fechas específicas. Sin embargo, desde 2022 en adelante se muestran picos más altos pero no son la norma.

Finalmente, el histograma indica que la popularidad semanal del término turismo sostenible en español cuenta con las siguientes características: Se concentra principalmente en niveles medios (20-35), suele bajar de 15 solo en fechas festivas y ocasionalmente supera 35, sobre todo en los años comprendidos entre 2022-2024. En conjunto, podríamos decir que se trata de una tendencia estable, con ligeros picos y algunas caídas estacionales.

Las mejoras introducidas en el chunk original se han podido efectuar a través de los siguientes códigos: geom_density( aes(y = after_stat(count)), linewidth = 1.2, color = “blue”, alpha = 0.4) utilizado para incluir en el gráfico una curva de densidad la cual permite entender la forma real de la distribución más allá de la información que nos dan a simple vista los bins. Igualmente, hemos decidido añadirle una gráfica poligonal al chunk ya que aporta información complementaria y mejora la interpretación visual de la distribución. Hemos podido incorporar la gráfica poligonal a través del código descrito a continuación: geom_freqpoly( aes(y = after_stat(count)),bins = 12,linewidth = 1.2 ). Por otra parte, queríamos que las barras se viesen ligeramente transparentes, dándole un aspecto más agradable a la vista por lo que decidimos añadirle el código alpha=0,8 para conseguirlo. Por último, decidimos cambiarle el color a amarillo para que fuese el mismo de la gráfica anterior para que el trabajo cuente con unos colores homogéneos para facilitar la interpretación global del mismo.

timeline |> 
  ggplot(aes(x = en_sustainable_tourism)) +
  geom_histogram(
    bins = 12,
    fill = "green",
    col = "white",
    alpha = 0.8
  ) +
  geom_density(
    aes(y = after_stat(count)),
    color = "blue",
    linewidth = 1.2,
    alpha = 0.4
  ) +
  geom_freqpoly(
    aes(y = after_stat(count)),
    bins = 12,
    linewidth = 1.2,
    color = "black"
  )

El histograma por analizar muestra cómo se distribuye la popularidad semanal del término “sustainable tourism” entre 2019 y 2024.

En el histograma, las barras más altas representan el mayor número de semanas y se concentran entre aproximadamente 50 y 75 puntos de popularidad. Este hecho también se aprecia en el pico central de la curva de densidad y el pico más elevado de la línea poligonal, que alcanza sus máximos en ese intervalo. Gracias a ello podemos interpretar que la búsqueda de “sustainale tourism” en inglés es más alta que “turismo sostenible” en español. Este hecho también se aprecia en el pico central de la curva de densidad y el pico más elevado de la línea poligonal, que alcanza sus máximos en ese intervalo.

Por una parte, el histograma exhibe que los valores por debajo de 40 son escasos y aparecen sobre todo en épocas concretas como la pandemia y fechas festivas. Por otra parte, existe un número considerable de semanas con valores altos comprendidas entre el valor 80 y 100. Comparándolo con el término en español, este histograma presenta una mayor cantidad de valores altos, la mayoría de ellos entre 80 y 95 y varios picos cercanos al máximo absoluto de 100. Esto se podría interpretar de forma que el interés del término en inglés ha tenido picos fuertes y recurrentes, sobre todo desde 2021-2024, lo que sugiere que es una temática cada vez más relevante a nivel global.

Es importante destacar que la distribución se encuentra claramente sesgada hacia la izquierda, lo que significa que los valores bajos son poco frecuentes y los valores altos son más comunes. Por consiguiente, la tendencia de búsqueda del término no solo es alta, sino que tiende a mantenerse en valores elevados durante largos periodos.

En definitiva, se mantienen constantemente alto a lo largo de los años, concentrado principalmente entre 50 y 75. A su vez, muestra una alta frecuencia de valores altos entre 80 y 100 a partir de 2021 y los valores bajos son poco frecuentes. Por tal razón, la distribución evidencia que el término tiene una presencia global muy fuerte y creciente, mucho más estable y elevada que el término en español.

Las optimizaciones efectuadas en el código original han sido las mismas que las utilizadas en el histograma de “turismo sostenible” anterior pero cambiando el término a “sustainable tourism”: El código de la curva de densidad geom_density( aes(y = after_stat(count)),color = “blue”,linewidth = 1.2,alpha = 0.4) muestra un patrón más aplanado que en el español, lo que indica una mayor variabilidad de las búsquedas. La función poligonal representada a través del código geom_freqpoly(aes(y = after_stat(count)), bins = 12,linewidth = 1.2,color = “black”) enseña con nitidez las zonas de 50- 70 y 75-90 donde se acumulan numerosos valores. De igual manera, se ha introducido el código alpha = 0.8 para darle más suavidad al histograma. Para terminar, decidimos cambiarle el color y ponérselo verde al igual que el gráfico de densidad para que hubiese una similitud entre los tres gráficos relacionados con las tendencias de ambos términos.

timeline |> 
  pivot_longer(cols = 2:3, names_to = "term", values_to = "trend") |> 
  ggplot(aes(x = term, y = trend)) +
  geom_boxplot()

El boxplot permite observar con claridad cómo se distribuyen los valores asociados a cada término. En el caso del término en inglés, en_sustainable_tourism, la mediana se sitúa alrededor de 60, lo que indica que la mitad de los valores de la tendencia se encuentran por encima y la otra mitad por debajo de ese nivel. La caja del diagrama, que representa el rango intercuartílico, se extiende aproximadamente desde 50 hasta 78, lo que revela que el 50% central de las observaciones se mueve dentro de un intervalo relativamente amplio. Los bigotes alcanzan valores que van desde alrededor de 25 hasta 100, mostrando que la serie presenta una variabilidad considerable y que los niveles de interés fluctúan de forma notable. En conjunto, la amplitud del rango y el tamaño de la caja sugieren una distribución con alta dispersión.

Por el contrario, el comportamiento del término en español, es_turismo_sostenible, es mucho más estable y concentrado. Su mediana se ubica aproximadamente entre 25 y 27, es decir, muy por debajo de la correspondiente al término en inglés. La caja del diagrama es mucho más estrecha y abarca un intervalo aproximado entre 20 y 30, lo que muestra que la mayor parte de los valores se agrupa en un rango pequeño y muy consistente. Los bigotes apenas se extienden desde valores cercanos a 15 hasta unos 40, lo que confirma la baja dispersión de esta serie. Además, aparece un valor atípico claramente separado por debajo del bigote inferior, alrededor de 10, lo que refleja la presencia de una observación excepcionalmente baja.

Cuando se comparan ambos términos, se observa una diferencia marcada tanto en los niveles de tendencia como en la variabilidad de sus distribuciones. El término en inglés presenta valores consistentemente más altos y una oscilación mucho mayor, mientras que el término en español permanece en todo momento en un rango bajo y estrecho, con un comportamiento muy homogéneo. En síntesis, la tendencia asociada a “sustainable tourism” es claramente más elevada y variable que la de “turismo sostenible”, que se mantiene estable y concentrada en niveles considerablemente más bajos.

library(summarytools)
st_options(use.x11 = FALSE)
timeline |> 
  descr(var = es_turismo_sostenible)

Descriptive Statistics
timeline$es_turismo_sostenible
N: 262

es_turismo_sostenible
Mean 24.49
Std.Dev 6.62
Min 6.00
Q1 21.00
Median 24.00
Q3 29.00
Max 40.00
MAD 5.93
IQR 8.00
CV 0.27
Skewness -0.29
SE.Skewness 0.15
Kurtosis 0.14
N.Valid 262.00
Pct.Valid 100.00
library(summarytools)
st_options(use.x11 = FALSE)
timeline |> 
  descr(var = en_sustainable_tourism)

Descriptive Statistics
timeline$en_sustainable_tourism
N: 262

en_sustainable_tourism
Mean 63.51
Std.Dev 16.57
Min 24.00
Q1 52.00
Median 61.50
Q3 78.00
Max 100.00
MAD 18.53
IQR 26.00
CV 0.26
Skewness -0.09
SE.Skewness 0.15
Kurtosis -0.78
N.Valid 262.00
Pct.Valid 100.00

Las estadísticas descriptivas del término en español muestran una tendencia claramente baja y estable. La media y la mediana prácticamente coinciden, situándose ambas alrededor de 24, lo que indica que el centro de la distribución está firmemente concentrado en ese nivel y que no existen sesgos significativos hacia valores más altos o más bajos. El rango total, que se extiende únicamente de 6 a 40, confirma que los valores rara vez se alejan demasiado del promedio. Del mismo modo, la baja dispersión reflejada tanto en el rango intercuartílico como en la desviación estándar muestra que la serie apenas fluctúa a lo largo del tiempo. La forma de la distribución, con valores de asimetría y curtosis cercanos a cero, sugiere que los datos siguen un patrón aproximadamente simétrico y ligeramente acampanado, lo que se corresponde con el perfil uniforme observado en el histograma. En conjunto, este comportamiento describe una tendencia de búsqueda muy concentrada, estable y consistentemente baja para es_turismo_sostenible.

Por el contrario, el término en inglés presenta un comportamiento claramente distinto. Tanto la media, situada alrededor de 63.5, como la mediana, cercana a 61.5, son considerablemente más altas que las del término en español, lo que confirma que el nivel de interés general en sustainable tourism es muy superior. En este caso, la dispersión es mucho mayor: la desviación estándar supera los 16 puntos y el rango intercuartílico se amplía a 26, lo que refleja una distribución caracterizada por oscilaciones pronunciadas y una variabilidad notable en la serie temporal. A pesar de estas fluctuaciones, la forma general de la distribución sigue siendo casi simétrica, como indica su valor de asimetría cercano a cero. Sin embargo, la curtosis negativa sugiere una distribución algo más plana de lo que cabría esperar en una normal, lo que coincide con la presencia de picos amplios y múltiples niveles de concentración que se observan en el gráfico de densidad.

Al comparar ambas tendencias, se hace evidente que el interés en inglés supera ampliamente al español, con un nivel promedio de búsqueda aproximadamente dos veces y media mayor. Esta diferencia no solo muestra mayor visibilidad y popularidad en la esfera angloparlante, sino que también puede reflejar un mayor desarrollo conceptual, una presencia más fuerte en la literatura académica o un uso más extendido del término en contextos institucionales y mediáticos. Además, mientras la tendencia en español se mantiene extraordinariamente estable y predecible, la tendencia en inglés muestra una mayor volatilidad, caracterizada por picos y caídas abruptas que probablemente responden a factores coyunturales, estacionales o incluso a un mayor ruido dentro del volumen de búsqueda. En suma, ambas distribuciones representan comportamientos claramente diferenciados tanto en nivel como en variabilidad, y juntas proporcionan una comprensión sólida sobre cómo evoluciona el interés por estos conceptos en cada idioma.

Conclusiones

Este análisis deja bastante claro que el concepto de “turismo sostenible” no se busca ni se entiende igual según el idioma. La diferencia es grande: “sustainable tourism” en inglés tiene un interés promedio unas 2.5 veces mayor y una variabilidad mucho más alta que su equivalente en español, lo que muestra que el tema está mucho más desarrollado y en movimiento en el mundo angloparlante. En cambio, las búsquedas en español se mantienen bajas y bastante estables, lo que refleja una presencia mucho más limitada del concepto. A nivel geográfico, tanto el mapa como la regresión muestran que el interés relativo no tiene nada que ver con el PIB: son países pequeños o en desarrollo (sobre todo en África y Oceanía) los que muestran los valores más altos, mientras que las economías ricas aparecen con niveles bajos o moderados. Esto sugiere que, en estas regiones emergentes, el turismo sostenible puede ser un tema especialmente estratégico para su posicionamiento. Trabajar en equipo fue bastante fluido y las distintas visualizaciones que construimos nos ayudaron a confirmar estas tendencias de forma más sólida. En resumen, aunque el debate global se mueve sobre todo en inglés, el interés más intenso surge justamente en lugares donde el turismo sostenible podría tener un impacto clave en su desarrollo y conservación.