La geoestadística es una rama de la estadística que permite analizar y modelar fenómenos que varían en el espacio. Las variables que dependen de la ubicación geográfica se denominan variables regionalizadas y exhiben una propiedad fundamental: las observaciones más cercanas entre sí tienden a ser más parecidas que las distantes, propiedad conocida como autocorrelación espacial.
Este informe analiza la temperatura y la humedad relativa registradas mediante sensores portátiles en 534 árboles de aguacate georeferenciados en una finca del departamento del Cauca, Colombia, durante el 1 de octubre de 2020. A través de herramientas geoestadísticas se busca cuantificar la estructura de dependencia espacial de estas variables, ajustar modelos teóricos de semivariograma y generar superficies de predicción continua mediante kriging ordinario, con potencial aplicación en la gestión agronómica de precisión.
El análisis tiene como propósito aplicar la metodología geoestadística completa sobre datos de sensores agroclimáticos, abarcando:
El dataset original contiene 20271 registros y 21 variables, correspondientes a mediciones tomadas en distintas fechas entre 2019 y 2020 en la finca de aguacate. Las variables incluyen coordenadas geográficas (latitud y longitud), identificador del árbol, fecha/hora de captura y variables climáticas como temperatura, humedad relativa, velocidad del viento, presión barométrica y altitud, entre otras.
Para garantizar homogeneidad temporal en el análisis espacial —condición necesaria para que la variabilidad observada refleje estructura espacial y no variación temporal—, se filtraron únicamente las mediciones del 1 de octubre de 2020, resultando en 534 registros listos para el análisis geoestadístico.
| id_arbol | Latitude | Longitude | Temperature | Relative_Humidity |
|---|---|---|---|---|
| 1 | 2.39355 | -76.71124 | 23.9 | 85.2 |
| 2 | 2.39357 | -76.71120 | 23.5 | 84.0 |
| 3 | 2.39354 | -76.71113 | 24.5 | 79.6 |
| 4 | 2.39350 | -76.71119 | 25.9 | 77.6 |
| 5 | 2.39349 | -76.71122 | 26.0 | 76.5 |
| 6 | 2.39344 | -76.71126 | 24.5 | 77.7 |
| 7 | 2.39331 | -76.71128 | 25.5 | 76.5 |
| 8 | 2.39338 | -76.71122 | 25.7 | 77.7 |
Para el análisis geoestadístico se seleccionaron la temperatura como variable principal y la humedad relativa como variable complementaria, dado que ambas son indicadores directos de las condiciones microclimáticas que afectan el desarrollo y la sanidad del cultivo de aguacate.
| Variable | Mínimo | Q1 | Mediana | Media | Q3 | Máximo |
|---|---|---|---|---|---|---|
| Temperatura (°C) | 22.2 | 24.50 | 25.80 | 25.83 | 27.17 | 29.7 |
| Humedad Relativa (%) | 59.5 | 67.32 | 71.25 | 71.17 | 75.30 | 91.6 |
La temperatura registró valores entre 22.2 °C y 29.7 °C, con una media de 25.83 °C y distribución ligeramente asimétrica hacia valores altos, lo que sugiere la presencia de zonas con condiciones térmicas más cálidas dentro de la finca. La humedad relativa osciló entre 59.5% y 91.6%, con media de 71.2%, mostrando mayor dispersión que la temperatura, lo que indica variabilidad microclimática relevante para el cultivo.
Los mapas revelan que ninguna de las dos variables presenta una distribución aleatoria en el espacio. En el caso de la temperatura, se aprecian núcleos de valores elevados (≥ 27 °C) hacia los sectores sur y sureste del área de estudio, con descenso gradual hacia el norte. La humedad relativa muestra el patrón complementario esperado: las zonas con mayor temperatura tienden a registrar menor humedad. Esta estructura espacial en ambas variables es un indicativo preliminar de autocorrelación espacial positiva, condición necesaria para la aplicación de kriging.
Antes de construir el semivariograma es indispensable verificar si las variables exhiben una tendencia determinística en función de las coordenadas. La presencia de tendencia global viola el supuesto de estacionariedad intrínseca del kriging ordinario y requeriría su remoción previa.
Los suavizadores LOESS no evidencian tendencias lineales pronunciadas en ninguna dirección para ninguna de las dos variables: las bandas de confianza son amplias y las curvas oscilan alrededor de valores centrales sin gradientes sistemáticos claros. Este resultado indica que la variabilidad espacial observada no responde a un componente determinístico global (tendencia), sino a una estructura de autocorrelación espacial local. Se valida así el uso de kriging ordinario —que asume media constante desconocida— sin necesidad de aplicar kriging universal con remoción de tendencia.
| Variable | Min | Mediana | Media | Max |
|---|---|---|---|---|
| Temperatura | 1.7e-05 | 0.000641 | 0.000683 | 0.001959 |
| Humedad Relativa | 1.7e-05 | 0.000641 | 0.000683 | 0.001959 |
Los cuatro paneles del geodata confirman lo observado en los mapas: existe variabilidad espacial en ambas variables relacionada con la posición de los árboles en la finca. Las distancias entre puntos van desde 1.7^{-5} hasta 0.001959 grados decimales (equivalente a metros dentro del predio), con una mediana de 6.41^{-4}. Esta densidad de muestreo es suficiente para capturar la estructura de dependencia espacial a escala de finca y construir un semivariograma robusto.
El semivariograma experimental estima, para cada bin de distancia \(h\), la semivarianza \(\hat{\gamma}(h) = \frac{1}{2N(h)} \sum_{i=1}^{N(h)} [Z(s_i) - Z(s_i + h)]^2\), donde \(N(h)\) es el número de pares de puntos separados por la distancia \(h\).
Para evaluar si la estructura observada en el semivariograma es estadísticamente distinguible de la aleatoriedad espacial, se generaron 99 semivariogramas bajo permutación aleatoria de los valores de cada variable sobre las mismas coordenadas. La banda resultante representa el rango de comportamiento esperado si no existiera dependencia espacial.
En ambas variables, el semivariograma observado supera consistentemente el límite superior de la banda de envoltura aleatoria en las distancias cortas e intermedias, lo que permite rechazar la hipótesis de aleatoriedad espacial y confirmar la existencia de autocorrelación espacial significativa. En el caso de la temperatura, la semivarianza crece desde valores cercanos a 1.6 hasta estabilizarse alrededor de 3.4 entre los 0.0008 y 0.0015 grados decimales, sugiriendo un rango de influencia de aproximadamente 100–150 metros. Para la humedad relativa, el comportamiento es más irregular con mayor dispersión, pero igualmente superior a la envoltura aleatoria.
Se ajustaron tres modelos paramétricos de semivariograma mediante mínimos cuadrados ponderados por número de pares (WLS–npairs), que otorga mayor peso a los bins con más pares de puntos, mejorando la robustez del ajuste.
| Modelo | SSE | Nugget | Sill | Rango | Seleccionado |
|---|---|---|---|---|---|
| Exponencial | 2406.1 | 1.6070 | 1.7674 | 0.000277 | ✔ |
| Gaussiano | 4597.5 | 1.5747 | 1.6018 | 0.000226 | |
| Esférico | 4121.3 | 1.7543 | 1.7543 | 0.000949 |
| Modelo | SSE | Nugget | Sill | Rango | Seleccionado |
|---|---|---|---|---|---|
| Exponencial | 404380 | 9.1186 | 27.3558 | 0.000455 | ✔ |
| Gaussiano | 453406 | 18.2372 | 18.2372 | 0.000710 | |
| Esférico | 1123566 | 5.7709 | 23.7831 | 0.000498 |
Temperatura: El modelo Exponencial presenta el mejor ajuste (SSE = 2406.1), superando al gaussiano (SSE = 4597.5) y al esférico (SSE = 4121.3). Sus parámetros indican: nugget = 1.607 (variabilidad no explicada a escala inferior al muestreo, equivalente al 47.6% de la varianza total), sill = 1.7674 (varianza estructural atribuible a la dependencia espacial) y rango práctico = 8.19^{-4} grados (~91 m), distancia a partir de la cual la correlación espacial se vuelve despreciable.
Humedad Relativa: El modelo Exponencial también resultó el más adecuado (SSE = 404,380). El nugget (9.1186) representa el 25% de la varianza total, con un rango práctico de ~154 m, ligeramente diferente al de la temperatura, lo que indica que estas dos variables climáticas operan a escalas de dependencia espacial distintas dentro de la finca.
Las superficies de kriging permiten visualizar el comportamiento térmico e hídrico continuo de la finca. La temperatura predicha varía entre 23.4 °C y 28.5 °C, con los valores más elevados concentrados en el sector sur-sureste. La humedad relativa predicha oscila entre 61.6% y 81.2%, con el patrón espacial inverso al de la temperatura. Los mapas de varianza muestran mayor incertidumbre en los bordes del área de estudio, donde la densidad de puntos de muestreo es menor, lo que es coherente con el comportamiento teórico del estimador kriging.
| Variable | Error Medio (Sesgo) | MAE | RMSE |
|---|---|---|---|
| Temperatura (°C) | -0.00188 | 0.9457 | 1.1668 |
| Humedad Relativa (%) | 0.00611 | 2.4128 | 3.1829 |
Temperatura: El sesgo es prácticamente nulo (-0.00188 °C), lo que confirma que el modelo exponencial no genera predicciones sistemáticamente sobre- ni subestimadas. El MAE de 0.9457 °C indica que, en promedio, la predicción se desvía menos de 1 °C del valor observado, error aceptable dado el rango total de 7.5 °C de la variable. El RMSE de 1.1668 °C es similar al MAE, lo que indica ausencia de errores extremos atípicos. El gráfico observado vs. predicho muestra buena alineación con la diagonal.
Humedad Relativa: El sesgo es igualmente bajo (0.00611%). Sin embargo, el MAE de 2.4128% y el RMSE de 3.1829% son mayores que los de temperatura en términos relativos, lo que refleja la mayor variabilidad intrínseca de la humedad relativa (rango de 32.1 pp) y la estructura espacial menos regular de esta variable. No obstante, el modelo mantiene buena capacidad predictiva sin sesgo sistemático.
| Variable | Mejor modelo | SSE | Nugget | Sill | Rango (°dec.) | Rango (m aprox.) | MAE | RMSE |
|---|---|---|---|---|---|---|---|---|
| Temperatura (°C) | Exponencial | 2406.1 | 1.6070 | 1.7674 | 0.000277 | 91 | 0.9457 | 1.1668 |
| Humedad Relativa (%) | Exponencial | 404,380 | 9.1186 | 27.3558 | 0.000455 | 154 | 2.4128 | 3.1829 |
La temperatura presenta una estructura espacial más regular y predecible que la humedad relativa, con un SSE de ajuste considerablemente menor y errores de predicción más bajos. Ambas variables son modeladas adecuadamente por el modelo exponencial, lo que indica que la dependencia espacial decrece de forma gradual y continua con la distancia, sin un rango de influencia abrupto como el modelo esférico. El rango práctico de la temperatura (~91 m) define la escala de gestión espacial relevante para decisiones de manejo agronómico dentro de la finca.
A partir del análisis geoestadístico aplicado a 534 puntos de muestreo en la finca de aguacate del Cauca durante el 01/10/2020, se destacan los siguientes hallazgos:
Sobre la estructura espacial: Tanto la temperatura como la humedad relativa presentan autocorrelación espacial estadísticamente significativa, evidenciada por semivariogramas experimentales que superan consistentemente la envoltura de aleatoriedad en 99 permutaciones. Ninguna variable presenta tendencia determinística global significativa, lo que valida el supuesto de estacionariedad del kriging ordinario.
Sobre el modelo seleccionado: El modelo exponencial resultó el mejor ajuste para ambas variables, con SSE de 2406.1 para temperatura y 404,380 para humedad relativa. Este modelo implica una disminución suave y asintótica de la correlación con la distancia, con rangos prácticos de ~91 m y ~154 m respectivamente, definiendo la escala espacial de influencia de cada variable.
Sobre la capacidad predictiva: La validación cruzada leave-one-out confirma el buen desempeño del kriging: sesgo ≈ 0 en ambos casos, MAE de 0.95 °C para temperatura y 2.41% para humedad relativa, sin presencia de errores extremos sistemáticos.
Sobre la aplicación agronómica: Las superficies de predicción generadas permiten identificar zonas diferenciadas dentro de la finca por condiciones térmicas e hídricas, con gradientes espaciales continuos útiles para decisiones de manejo de precisión como programación de riego localizado, identificación de zonas de estrés hídrico o térmico, y optimización del monitoreo de sensores.