1 Introducción

En el marco de los estudios de ciencia de datos aplicados a la geografía y la agronomía, la exploración de información climática espacial constituye una herramienta fundamental para comprender la distribución potencial de cultivos estratégicos. La caña de azúcar, por su relevancia económica y social en regiones tropicales, requiere condiciones específicas de temperatura y precipitación que pueden ser evaluadas mediante el uso de bases de datos globales como WorldClim y técnicas de análisis espacial en R. Este ejercicio busca integrar metodologías de aptitud climática y métricas de similaridad para identificar áreas con alto potencial productivo, contrastando criterios normativos con aproximaciones empíricas, y ofreciendo una visión comparativa que aporte a la planificación agrícola y a la toma de decisiones en contextos académicos y profesionales.

2 Mapas de aptitud - Rangos optimos

La metodología empleada para determinar la aptitud climática del cultivo de caña de azúcar se fundamentó en el uso de datos globales de temperatura y precipitación provenientes de la base WorldClim, procesados mediante el software R y sus librerías geoespaciales. Se calcularon las medias anuales de temperatura y las sumas anuales de precipitación a partir de las capas mensuales, estableciendo rangos óptimos de 22.5°C a 28°C y de 1500 mm a 3500 mm, según referencias agronómicas. Posteriormente, se aplicaron operaciones lógicas sobre los raster para identificar las áreas que cumplen simultáneamente ambos criterios, generando un mapa binario de aptitud. La visualización se realizó con una escala categórica que distingue las zonas aptas y no aptas, permitiendo evidenciar la concentración de condiciones favorables en regiones tropicales y subtropicales, coherentes con la distribución geográfica tradicional del cultivo.

## CARGUE DE LIBRERIAS E INFORMACIÓN

library(raster)
library(terra)
library(tmap)
library(ggplot2)
library(dplyr)
library(rnaturalearth)
library(geodata)
library(tidyr)
library(plotly)

# Descargar datos globales
tavg <- worldclim_global(var="tavg", res=10, path=tempdir())
prec <- worldclim_global(var="prec", res=10, path=tempdir())

# Calcular medias y sumas
tavg_ann <- mean(tavg)  # °C
prec_ann <- sum(prec)   # mm

# Definir aptitud climática
aptitud <- (tavg_ann >= 22.5 & tavg_ann <= 28) &
           (prec_ann >= 1500 & prec_ann <= 3500)

# Graficar mapa global
tmap_mode("view")
tm_shape(aptitud) +
  tm_raster(style="cat", palette=c("red","green"),
            labels=c("No apto","Apto"),
            title="Aptitud climática caña de azúcar") +
  tm_basemap("OpenStreetMap") +
  tm_layout(legend.outside=TRUE)

El análisis de aptitud climática evidencia la distribución espacial de las condiciones óptimas para el cultivo de caña de azúcar a nivel global. De acuerdo con los rangos de temperatura y precipitación establecidos, las áreas con mayor potencial se concentran principalmente en las regiones tropicales y subtropicales, donde la combinación de calor constante y humedad favorece el desarrollo fisiológico del cultivo. En el mapa se observa que países de América Latina, África central, el sur y sureste asiático, así como zonas del norte de Australia, presentan condiciones aptas, mientras que las regiones templadas y frías carecen de los parámetros requeridos. Este resultado confirma la estrecha relación entre la distribución geográfica de la caña y los factores climáticos que determinan su productividad y sostenibilidad agrícola.

3 Países con áreas de alto potencial para la producción de caña de azucar

La elección de Brasil, India y Colombia como países representativos de alto potencial para la producción de caña de azúcar responde a criterios climáticos, históricos y productivos ampliamente documentados. En primer lugar, estas naciones se ubican en zonas tropicales y subtropicales que cumplen con los rangos óptimos de temperatura (22.5–28°C) y precipitación anual (1500–3500 mm), condiciones que favorecen el crecimiento y rendimiento del cultivo. En segundo lugar, Brasil y la India concentran más del 60% de la producción mundial de caña, lo que confirma la pertinencia de sus condiciones agroclimáticas y su consolidación como líderes en el mercado internacional. Por su parte, Colombia, aunque con menor participación relativa, presenta una tradición productiva en el Valle del Cauca y otras regiones, donde la caña constituye un eje fundamental de la economía agrícola y de la industria azucarera. Así, la selección de estos países permite ilustrar tanto la validez de los criterios técnicos de aptitud climática como su correspondencia con la realidad productiva global.

# 1. Descargar shape global
world <- geodata::world(path=tempdir())

# 2. Seleccionar países con alto potencial
# Ejemplo: Brasil, India y Colombia
sel <- world[world$NAME_0 %in% c("Brazil","India","Colombia"), ]

# 3. Recortar el mapa de aptitud a esos países
aptitud_sel <- crop(aptitud, sel)
aptitud_sel <- mask(aptitud_sel, sel)

# 4. Graficar con escala de colores adecuada
tm_shape(sel) + tm_borders() +
tm_shape(aptitud_sel) +
  tm_raster(style="cat",
            palette=c("red","green"),
            labels=c("No apto","Apto"),
            title="Aptitud climática caña de azúcar")

El mapa de salida evidencia las áreas climáticamente aptas dentro de Brasil, Colombia e India, países seleccionados por su reconocida producción de caña de azúcar y por presentar condiciones ambientales dentro de los rangos óptimos definidos para el cultivo. Las zonas en color verde corresponden a regiones donde la temperatura media y la precipitación anual favorecen el desarrollo del cultivo, mientras que las áreas en rojo reflejan limitaciones climáticas. Este resultado permite visualizar la heterogeneidad interna de cada país y confirma que, aunque ambos poseen amplias zonas aptas, la distribución espacial de la aptitud está condicionada por factores locales como altitud, régimen de lluvias y variabilidad térmica.

4 Zonas del Valle del Cauca - Series de tiempo de temperatura y precipitación

La selección de tres puntos dentro del Valle del Cauca para la extracción de series de temperatura y precipitación se realizó con el propósito de representar la variabilidad climática interna de la región, caracterizada por su diversidad altitudinal y microclimática. Los sitios elegidos corresponden a áreas con distinta influencia geográfica —una cercana al valle central, otra en zona de piedemonte y una tercera hacia el sector costero—, lo que permite capturar diferencias en los patrones térmicos y pluviométricos. Esta estrategia garantiza una aproximación más completa al comportamiento climático regional y facilita la comparación de las condiciones locales frente a los rangos óptimos definidos para el cultivo de caña de azúcar.

# 1. Definir coordenadas de 2–3 puntos en el Valle del Cauca
# (ejemplo tomado de Google Maps: Cali y alrededores)
pts <- data.frame(
  lon = c(-76.53, -76.29, -76.49),
  lat = c(3.42, 3.53, 3.58)
)
pts <- vect(pts, geom=c("lon","lat"), crs="EPSG:4326")

# 2. Descargar datos climáticos mensuales
tmin <- worldclim_global(var="tmin", res=10, path=tempdir())
tmax <- worldclim_global(var="tmax", res=10, path=tempdir())
prec <- worldclim_global(var="prec", res=10, path=tempdir())

# 3. Calcular temperatura media mensual a partir de min y max
tmean <- (tmin + tmax) / 2  # dividir entre 10 para °C reales

# 4. Extraer series de tiempo para los puntos
tmean_vals <- terra::extract(tmean, pts)
prec_vals  <- terra::extract(prec, pts)

# 5. Graficar series de tiempo
# Temperatura
df_temp <- data.frame(
  Mes = 1:12,
  Cali = as.numeric(t(tmean_vals[1,-1])),
  Palmira = as.numeric(t(tmean_vals[2,-1])),
  Yumbo = as.numeric(t(tmean_vals[3,-1]))
)
df_temp_long <- tidyr::pivot_longer(df_temp, -Mes, names_to="Ciudad", values_to="Temperatura")

g1=ggplot(df_temp_long, aes(x=Mes, y=Temperatura, color=Ciudad)) +
  geom_line(size=1.2) +
  geom_point(size=2) +
  scale_color_manual(values=c("black","red","green")) +
  labs(title="Serie mensual de temperatura media (°C)",
       x="Mes", y="°C") +
  theme_minimal(base_size=14)
  theme(legend.position="top",
        plot.title=element_text(face="bold", hjust=0.5))

## <theme> List of 2
##  $ legend.position: chr "top"
##  $ plot.title     : <ggplot2::element_text>
##   ..@ family       : NULL
##   ..@ face         : chr "bold"
##   ..@ italic       : chr NA
##   ..@ fontweight   : num NA
##   ..@ fontwidth    : num NA
##   ..@ colour       : NULL
##   ..@ size         : NULL
##   ..@ hjust        : num 0.5
##   ..@ vjust        : NULL
##   ..@ angle        : NULL
##   ..@ lineheight   : NULL
##   ..@ margin       : NULL
##   ..@ debug        : NULL
##   ..@ inherit.blank: logi FALSE
##  @ complete: logi FALSE
##  @ validate: logi TRUE

ggplotly(g1)

# Convertir los datos de precipitación a formato largo
df_prec <- data.frame(
  Mes = 1:12,
  Cali = as.numeric(t(prec_vals[1,-1])),
  Palmira = as.numeric(t(prec_vals[2,-1])),
  Yumbo = as.numeric(t(prec_vals[3,-1]))
)

df_prec_long <- tidyr::pivot_longer(df_prec, -Mes, names_to="Ciudad", values_to="Precipitación")

# Gráfico con ggplot2
g2=ggplot(df_prec_long, aes(x=Mes, y=Precipitación, color=Ciudad)) +
  geom_line(size=1.2) +
  geom_point(size=2) +
  scale_color_manual(values=c("blue","darkgreen","orange")) +
  labs(title="Serie mensual de precipitación (mm)",
       x="Mes", y="Precipitación (mm)") +
  theme_minimal(base_size=14) +
  theme(
    legend.position = c(1, 1),        
    legend.justification = c("right","top"), 
    legend.title = element_text(face="bold"),
    plot.title = element_text(face="bold", hjust=0.5)
  )
ggplotly(g2)

En la serie de temperatura, se observa una estabilidad térmica a lo largo del año, con valores promedio entre 20°C y 23.5°C. Yumbo presenta las temperaturas más altas, seguido de Palmira y Cali, lo que refleja diferencias altitudinales y microclimáticas dentro del valle. Este rango térmico se encuentra dentro de los límites óptimos para el desarrollo del cultivo, favoreciendo una alta eficiencia fotosintética y crecimiento continuo.

Por su parte, la serie de precipitación muestra un patrón bimodal típico de la región andina, con picos lluviosos en abril y octubre y una disminución marcada hacia mitad de año. Cali registra los mayores volúmenes de lluvia, mientras Palmira y Yumbo presentan valores ligeramente inferiores pero similares en tendencia. Este comportamiento confirma la existencia de una distribución estacional de humedad que garantiza disponibilidad hídrica suficiente para el cultivo durante la mayor parte del año.

5 Mapa de similaridad a nivel Global

La elaboración del mapa de similaridad climática se fundamentó en la aplicación de una métrica de distancia euclidiana entre las condiciones promedio de temperatura y precipitación de los puntos seleccionados en el Valle del Cauca y los valores correspondientes a cada celda del modelo climático global. Para ello, se emplearon los datos mensuales de temperatura mínima, máxima y precipitación del conjunto WorldClim, procesados en R mediante las librerías terra y geodata. Se calculó la temperatura media anual y la precipitación acumulada para cada celda, y posteriormente se estimó la distancia euclidiana respecto al vector climático de referencia de cada sitio local. El resultado fue un mapa continuo que expresa el grado de similitud entre los climas del Valle del Cauca y los del resto del mundo, donde los valores más bajos indican mayor semejanza. Esta metodología permite identificar regiones con condiciones ambientales comparables, ampliando el análisis más allá de los rangos estrictos de aptitud y ofreciendo una perspectiva empírica sobre la distribución potencial del cultivo de caña de azúcar.

# 1. Usar los puntos del Valle del Cauca definidos en el paso 3
# (ejemplo: pts ya creado con vect())

# 2. Extraer valores climáticos de referencia en cada punto
tmin <- worldclim_global(var="tmin", res=10, path=tempdir())
tmax <- worldclim_global(var="tmax", res=10, path=tempdir())
prec <- worldclim_global(var="prec", res=10, path=tempdir())

# Calcular temperatura media mensual
tmean <- (tmin + tmax) / 2

# Extraer valores para los puntos
tmean_vals <- terra::extract(tmean, pts)
prec_vals  <- terra::extract(prec, pts)

# Calcular clima promedio de cada punto (ejemplo: primer punto)
ref_temp <- mean(as.numeric(tmean_vals[1,-1]))
ref_prec <- sum(as.numeric(prec_vals[1,-1]))

# 3. Calcular mapas globales de referencia
tmean_ann <- mean(tmean)       # °C
prec_ann  <- sum(prec)         # mm

# 4. Distancia euclidiana entre cada celda y el punto de referencia
sim_map <- sqrt((tmean_ann - ref_temp)^2 + (prec_ann - ref_prec)^2)

# 5. Graficar mapa de similaridad
tm_shape(sim_map) +
  tm_raster(style="cont", palette="-viridis", alpha=0.8,
            title="Similaridad climática (distancia euclidiana)") +
  tm_graticules() +
  tm_layout(legend.outside=TRUE, frame=FALSE)

Los tonos amarillos representan áreas con menor distancia, es decir, regiones con climas más parecidos al del Valle del Cauca, mientras que los tonos verdes y azulados indican zonas con menor similitud. Este resultado permite identificar regiones tropicales y subtropicales (como partes de América del Sur, África central y el sudeste asiático) que comparten características térmicas y pluviométricas similares, lo que sugiere un potencial comparable para el cultivo de caña de azúcar. En contraste, las zonas templadas y frías muestran mayores distancias, reflejando condiciones menos favorables para este tipo de cultivo.

6 Conclusiones

La comparación entre el mapa de aptitud climática y el mapa de similaridad global evidencia dos perspectivas complementarias sobre la distribución potencial del cultivo de caña de azúcar. El mapa de aptitud, basado en rangos óptimos de temperatura y precipitación, delimita las zonas que cumplen estrictamente las condiciones ideales para el desarrollo del cultivo, concentrándose en regiones tropicales y subtropicales. En contraste, el mapa de similaridad, construido mediante la distancia euclidiana respecto al clima del Valle del Cauca, ofrece una visión empírica que identifica áreas con condiciones comparables, incluso fuera de los rangos exactos. Ambos enfoques coinciden en destacar América del Sur, África central y el sur de Asia como regiones de alto potencial, aunque la similaridad amplía el espectro hacia zonas con climas cercanos, como Centroamérica y Oceanía.

En conjunto, los resultados demuestran que la integración de criterios técnicos y métricas de similitud permite una evaluación más robusta y flexible del potencial agrícola global, útil tanto para la planificación territorial como para la investigación aplicada en agroclimatología.

Ejercicio 2