Exploración de datos

Este informe presenta un análisis geoestadístico de la temperatura registrada en una finca de cultivo de aguacate ubicada en el sector de La Chorrera, cerca de Timbío y Popayán (Cauca, Colombia). El objetivo principal es explorar la variabilidad espacial de la temperatura mediante herramientas de análisis exploratorio, ajuste de modelos de semivariograma y técnicas de interpolación como el Kriging. La zona donde se encuentra la finca se caracteriza por su relieve ondulado, una altitud promedio favorable para el cultivo de aguacate y una red hidrográfica densa que influye en las condiciones microclimáticas del área.

Según se observa en el siguiente mapa interactivo, la finca está situada en una región rural con acceso por vías terciarias, al suroeste del centro poblado de La Chorrera y al suroeste de Tunurco. Además, se encuentra relativamente cerca de la cabecera municipal de Totoró y de la ciudad de Popayán, capital del departamento, lo cual facilita la logística de transporte y comercialización del producto.

Esta ubicación es estratégica desde el punto de vista agroclimático, ya que la región presenta una temperatura media moderada, buena disponibilidad hídrica y condiciones de altitud y pendiente aptas para el cultivo de aguacate tipo Hass, que requiere climas templados y suelos bien drenados. Se analizó una muestra georreferenciada con 532 puntos de medición de temperatura tomados el día 1 de octubre de 2020 a las 10:11:12 a. m. (hora local). Las mediciones oscilan entre 22 °C y 30 °C.

Para hacer una primera exploración de la variable temperatura del data set, medida en los árboles de la finca, el gráfico superior izquierdo (Distribución espacial por valor) representa la ubicación geográfica de los puntos de muestreo codificados por color según el valor de temperatura registrado. Se observa una distribución continua y densa de puntos, sin vacíos notables. Los colores permiten visualizar patrones espaciales, indicando posibles gradientes térmicos que justificarían la aplicación de técnicas de interpolación. El segundo gráfico de Temperatura vs. coordenada Y, muestra cómo varía la temperatura en función de la coordenada norte-sur (Y). Aunque se percibe cierta dispersión, no se identifican agrupamientos extremos ni valores atípicos evidentes, lo que indica una variabilidad razonable dentro del rango esperado, por el contrario el gráfico de Temperatura vs. coordenada X, similar al anterior, permite visualizar la variación de la temperatura con respecto a la coordenada este-oeste (X). Se observa un comportamiento disperso con cierta tendencia a agruparse hacia valores intermedios de temperatura, pero sin anomalías. El Histograma con densidad que muestra la distribución de la temperatura en toda la finca, muestra una ligera asimetría hacia la derecha (sesgo positivo leve), con la mayoría de valores concentrados entre los 24 °C y 28 °C. La superposición de la curva de densidad permite observar que la variable podría aproximarse a una distribución normal, lo cual es relevante para la aplicación de métodos geoestadísticos como el kriging.

Geoestadística

Posteriormente se procedió a realizar una regresión lineal para evaluar la relación entre la temperatura y la ubicación espacial (longitud y latitud). El modelo fue significativo (p-value < 0.001), y aunque el R² ajustado fue bajo (0.079), los coeficientes indican una ligera disminución de la temperatura hacia el este y hacia el norte. Esto justifica la remoción de la tendencia antes de aplicar métodos geoestadísticos como el kriging.

Los residuos del modelo, mostrados en el segundo conjunto de gráficos, tienen una distribución centrada en cero y sin patrones espaciales evidentes, lo cual valida su uso para el modelado del componente estocástico (variograma).

## 
## Call:
## lm(formula = Temperature ~ Longitude + Latitude, data = datos_filtrados)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.0761 -1.1765 -0.0286  1.1375  4.1201 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -59583.4    19009.2  -3.134 0.001817 ** 
## Longitude     -799.3      244.1  -3.274 0.001130 ** 
## Latitude      -712.4      213.0  -3.345 0.000882 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.7 on 531 degrees of freedom
## Multiple R-squared:  0.08257,    Adjusted R-squared:  0.07911 
## F-statistic: 23.89 on 2 and 531 DF,  p-value: 1.157e-10

Semivariograma

En el análisis geoestadístico realizado sobre la temperatura en una finca de aguacate, se ajustaron tres modelos teóricos de semivariograma: esférico, exponencial y gaussiano. El ajuste se hizo sobre el semivariograma empírico calculado a partir de los residuales del modelo de regresión entre temperatura y coordenadas espaciales. Este enfoque permite capturar únicamente la estructura espacial que no es explicada por la tendencia geográfica.

Los resultados de ajuste indican que el modelo exponencial fue el que presentó el menor valor de pérdida (loss value = 0.4907), lo cual sugiere que se ajusta mejor a la estructura espacial observada en los datos. El modelo esférico tuvo un valor de pérdida ligeramente mayor (0.6404), mientras que el modelo gaussiano fue el menos adecuado con una pérdida de 0.8737. Estas diferencias se reflejan visualmente en la gráfica de comparación de los modelos, donde el modelo exponencial sigue con mayor precisión la forma del semivariograma empírico.

## variog: computing omnidirectional variogram
## variofit: covariance model used is spherical 
## variofit: weights used: equal 
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
##               sigmasq phi   tausq  kappa
## initial.value "1.76"  "0"   "1.76" "0.5"
## status        "est"   "est" "est"  "fix"
## loss value: 0.640425532080549
## variofit: covariance model used is exponential 
## variofit: weights used: equal 
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
##               sigmasq phi   tausq  kappa
## initial.value "2.63"  "0"   "1.76" "0.5"
## status        "est"   "est" "est"  "fix"
## loss value: 0.490747569323824
## variofit: covariance model used is gaussian 
## variofit: weights used: equal 
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
##               sigmasq phi   tausq  kappa
## initial.value "1.76"  "0"   "1.76" "0.5"
## status        "est"   "est" "est"  "fix"
## loss value: 0.873709747311368

Predicción Espacial (Kriging)

En cuanto a las predicciones por kriging, se generaron mapas interpolados de temperatura con cada uno de los tres modelos. A simple vista, los mapas muestran patrones similares, pero con diferencias en suavidad y precisión local. La predicción gaussiana presenta mayores oscilaciones, mientras que el modelo esférico y el exponencial tienden a generar superficies más suaves y coherentes con la variabilidad observada en campo.

## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood

Al analizar los mapas de desviación estándar (errores de predicción), se observa que el modelo gaussiano ofrece los errores más bajos en promedio (media ≈ 1.44), seguido del modelo esférico (media ≈ 1.50) y del modelo exponencial (media ≈ 1.51). Sin embargo, las diferencias son pequeñas, aunque el modelo exponencial tuvo el mejor ajuste al semivariograma, el modelo gaussiano podría ser preferible si se prioriza minimizar la incertidumbre de predicción.

En conjunto, el modelo exponencial ofrece un buen equilibrio entre calidad de ajuste y estabilidad en las predicciones, lo que lo convirtió en la opción elegida para representar la estructura espacial de la temperatura en esta finca. No obstante, si se busca reducir al máximo los errores de predicción puntuales, el modelo gaussiano también es una alternativa válida. La decisión final dependerá de la prioridad entre ajuste global del modelo y precisión local.

## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood

## Resumen de errores estándar:
## Exponencial:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.405   1.416   1.427   1.512   1.576   1.966
## 
## Esférico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.399   1.407   1.419   1.500   1.558   1.907
## 
## Gaussiano:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.295   1.301   1.320   1.441   1.568   1.817

Validación cruzada

En la fase final del análisis geoestadístico, se realizó una validación cruzada del modelo exponencial ajustado para evaluar su capacidad predictiva sobre la variable temperatura. La técnica empleada fue una validación cruzada completa (“leave-one-out”), la cual implica utilizar cada punto como observación de validación mientras el resto se emplea para entrenar el modelo. El resultado arrojó un error medio absoluto (MAE) de aproximadamente 1°C, lo que sugiere que el modelo tiene un buen desempeño en la predicción espacial de temperaturas dentro de la finca. Este resultado se representa gráficamente en el mapa mostrado, donde se visualiza la distribución interpolada de la temperatura sobre el terreno usando el método de Kriging con el modelo exponencial. Los colores en el mapa permiten identificar las zonas más cálidas (tonos rojizos) y frías (tonos azulados), facilitando la interpretación espacial de la variabilidad térmica.

## xvalid: number of data locations       = 534
## xvalid: number of validation locations = 534
## xvalid: performing cross-validation at location ... 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 
## xvalid: end of cross-validation
## [1] 1.000681
## El modelo presenta un error medio de predicción de 1 grados.