df <- fread("/Users/antoniodiaz/Desktop/MODULO2/turismo_mexico_2019_2023.csv")
# Ver datos
print(df)
## Año Visitantes_internacionales Turistas_internacionales
## <int> <int> <int>
## 1: 1995 8233000 2516000
## 2: 1996 8692270 2219270
## 3: 1997 8635667 2297667
## 4: 1998 8961106 2172396
## 5: 1999 9019718 1771718
## 6: 2000 105673370 20641370
## 7: 2001 100718403 19810459
## 8: 2002 100153185 19666677
## 9: 2003 92329842 18665384
## 10: 2004 99249706 20617748
## 11: 2005 103146067 21914917
## 12: 2006 97700995 21352605
## 13: 2007 93582018 21605754
## 14: 2008 92947651 22930584
## 15: 2009 88044044 22346260
## 16: 2010 81953293 23289749
## 17: 2011 75731791 23403263
## 18: 2012 76748672 23402545
## 19: 2013 78100172 24150514
## 20: 2014 81042075 29345610
## 21: 2015 87128633 32093324
## 22: 2016 94853116 35079365
## 23: 2017 99349286 39290943
## 24: 2018 96497026 41312720
## 25: 2019 97406037 45024453
## 26: 2020 51128042 24283536
## 27: 2021 55301421 31860392
## 28: 2022 65994498 38325550
## 29: 2023 74817746 41949428
## Año Visitantes_internacionales Turistas_internacionales
## Excursionistas_internacionales
## <int>
## 1: 5717000
## 2: 6473000
## 3: 6338000
## 4: 6788710
## 5: 7248000
## 6: 85032000
## 7: 80907944
## 8: 80486508
## 9: 73664458
## 10: 78631958
## 11: 81231150
## 12: 76348390
## 13: 71976264
## 14: 70017066
## 15: 65697784
## 16: 58663544
## 17: 52328528
## 18: 53346127
## 19: 53949658
## 20: 51696465
## 21: 55035309
## 22: 59773751
## 23: 60058343
## 24: 55184306
## 25: 52381584
## 26: 26844506
## 27: 23441029
## 28: 27668948
## 29: 32868318
## Excursionistas_internacionales
# Quitamos la columna Año
df_cluster <- df[, -c("Año")]
# Escalamos los datos
df_scaled <- scale(df_cluster)
fviz_nbclust(df_scaled, kmeans, method = "wss")
set.seed(123) # semilla para reproducibilidad
km <- kmeans(df_scaled, centers = 3, nstart = 25)
# Añadir columna de cluster al dataset original
df$Cluster <- km$cluster
# Mostrar resultados
print(df)
## Año Visitantes_internacionales Turistas_internacionales
## <int> <int> <int>
## 1: 1995 8233000 2516000
## 2: 1996 8692270 2219270
## 3: 1997 8635667 2297667
## 4: 1998 8961106 2172396
## 5: 1999 9019718 1771718
## 6: 2000 105673370 20641370
## 7: 2001 100718403 19810459
## 8: 2002 100153185 19666677
## 9: 2003 92329842 18665384
## 10: 2004 99249706 20617748
## 11: 2005 103146067 21914917
## 12: 2006 97700995 21352605
## 13: 2007 93582018 21605754
## 14: 2008 92947651 22930584
## 15: 2009 88044044 22346260
## 16: 2010 81953293 23289749
## 17: 2011 75731791 23403263
## 18: 2012 76748672 23402545
## 19: 2013 78100172 24150514
## 20: 2014 81042075 29345610
## 21: 2015 87128633 32093324
## 22: 2016 94853116 35079365
## 23: 2017 99349286 39290943
## 24: 2018 96497026 41312720
## 25: 2019 97406037 45024453
## 26: 2020 51128042 24283536
## 27: 2021 55301421 31860392
## 28: 2022 65994498 38325550
## 29: 2023 74817746 41949428
## Año Visitantes_internacionales Turistas_internacionales
## Excursionistas_internacionales Cluster
## <int> <int>
## 1: 5717000 1
## 2: 6473000 1
## 3: 6338000 1
## 4: 6788710 1
## 5: 7248000 1
## 6: 85032000 2
## 7: 80907944 2
## 8: 80486508 2
## 9: 73664458 2
## 10: 78631958 2
## 11: 81231150 2
## 12: 76348390 2
## 13: 71976264 2
## 14: 70017066 2
## 15: 65697784 2
## 16: 58663544 2
## 17: 52328528 2
## 18: 53346127 2
## 19: 53949658 2
## 20: 51696465 3
## 21: 55035309 3
## 22: 59773751 3
## 23: 60058343 3
## 24: 55184306 3
## 25: 52381584 3
## 26: 26844506 3
## 27: 23441029 3
## 28: 27668948 3
## 29: 32868318 3
## Excursionistas_internacionales Cluster
# Revisar tamaño de cada cluster
table(df$Cluster)
##
## 1 2 3
## 5 14 10
# Revisar centroides de cada cluster
km$centers
## Visitantes_internacionales Turistas_internacionales
## 1 -1.9675265 -1.7061757
## 2 0.5554222 -0.1232594
## 3 0.2061722 1.0256510
## Excursionistas_internacionales
## 1 -1.6760597
## 2 0.7581984
## 3 -0.2234480
fviz_cluster(km,
data = df_scaled,
geom = "point",
ellipse.type = "convex",
ggtheme = theme_minimal(),
main = "Clusters de Turismo Internacional en México (1995–2023)")
El análisis de clusterización de los años 1995–2023 en el turismo internacional de México permitió identificar tres clusters:
Cluster 1: Años de crisis turística (como 2009 y 2020), que fueron por caídas fuertes en visitantes y excursionistas.
Cluster 2: Años donde vinieron muchos visitantes de paso (excursionistas), pero menos turistas que se quedaran varios días.
Cluster 3: Años buenos, donde llegaron muchos turistas internacionales que se quedaban varios días, época de auge turístico.
Estos resultados muestran cómo el turismo en México ha atravesado épocas de caída, recuperación y crecimiento sostenido, reflejando el impacto de factores externos (crisis económicas, pandemia) y el fortalecimiento de México como destino internacional.