Introducción

Las variables ambientales presentan con frecuencia una distribución espacial heterogénea, en la que observaciones cercanas tienden a compartir características similares debido a procesos físicos, biológicos o climáticos que actúan sobre el territorio. Esta dependencia espacial constituye uno de los principales fundamentos de la geoestadística, disciplina que proporciona herramientas para analizar, modelar e interpolar fenómenos distribuidos geográficamente.

Dentro del ámbito agrícola, la comprensión de la variabilidad espacial de variables climáticas resulta de gran importancia para el monitoreo de cultivos, la evaluación de condiciones ambientales y la toma de decisiones orientadas a optimizar la producción. Variables como la temperatura, la humedad relativa, la velocidad del viento y la altitud pueden presentar patrones espaciales que influyen directamente sobre el desarrollo fisiológico de las plantas y sobre la productividad de los sistemas agrícolas.

En este trabajo se analizó un conjunto de datos correspondiente a árboles de aguacate georreferenciados ubicados en una finca del departamento del Cauca, Colombia. Para cada árbol se registraron coordenadas geográficas y diferentes variables ambientales medidas mediante sensores de campo. Siguiendo las orientaciones de la actividad, el análisis se concentró en las observaciones registradas durante el periodo correspondiente al 1 de octubre de 2020, obteniéndose un total de 534 registros espaciales.

El objetivo principal fue evaluar la estructura espacial de la variable temperatura mediante técnicas geoestadísticas, determinando la existencia de autocorrelación espacial y construyendo un modelo capaz de representar la variabilidad térmica dentro del área de estudio. Para ello se desarrolló un proceso que incluyó análisis exploratorio de datos, representación espacial de las observaciones, construcción del semivariograma experimental, ajuste de modelos teóricos y generación de superficies continuas de predicción mediante Kriging ordinario.

Finalmente, se realizó una evaluación de la calidad del modelo mediante procedimientos de validación cruzada, con el propósito de cuantificar la capacidad predictiva de la metodología empleada y verificar la consistencia de las estimaciones espaciales obtenidas.

Metodología

Preparación y selección de los datos

Se utilizó una base de datos correspondiente a mediciones ambientales realizadas sobre árboles de aguacate georreferenciados en una finca ubicada en el departamento del Cauca, Colombia. Cada registro contenía información espacial (latitud y longitud) junto con variables climáticas y ambientales obtenidas mediante sensores de campo.

De acuerdo con las instrucciones de la actividad, se seleccionaron únicamente las observaciones correspondientes al periodo del 1 de octubre de 2020. Después del proceso de filtrado se obtuvo un conjunto de 534 registros, los cuales fueron utilizados para el análisis geoestadístico. La variable de interés seleccionada fue la temperatura, debido a su relevancia ambiental y a su potencial comportamiento espacial dentro del área de estudio.

Análisis exploratorio de datos

Inicialmente se realizó una exploración descriptiva de la variable temperatura mediante el cálculo de estadísticas resumen, incluyendo valores mínimos, máximos, media, mediana y cuartiles. Adicionalmente, se construyeron histogramas y diagramas de caja con el fin de evaluar la distribución de los datos, identificar posibles valores atípicos y verificar la consistencia de las observaciones antes de aplicar técnicas geoestadísticas.

Construcción del objeto espacial

Las coordenadas geográficas de longitud y latitud fueron utilizadas para construir un objeto espacial empleando el sistema de referencia WGS84. Posteriormente se realizó una representación cartográfica de los árboles dentro del área de estudio con el propósito de examinar la distribución espacial de las observaciones y verificar la cobertura del muestreo.

Asimismo, se elaboró una representación espacial de la variable temperatura para identificar visualmente posibles patrones espaciales, agrupamientos o tendencias preliminares que justificaran la aplicación de herramientas geoestadísticas.

Análisis de autocorrelación espacial

La dependencia espacial de la temperatura fue evaluada mediante la construcción del semivariograma experimental. Este procedimiento permitió cuantificar la relación entre la similitud de los valores observados y la distancia que separa las observaciones.

Posteriormente se exploraron diferentes modelos teóricos de semivariograma, incluyendo modelos exponencial, gaussiano y esférico. La selección del modelo final se realizó considerando la capacidad de cada función para representar adecuadamente la estructura observada en el semivariograma experimental.

Interpolación espacial mediante Kriging

Una vez seleccionado el modelo teórico de semivariograma, se generó una malla regular de predicción que cubrió la totalidad del área de estudio. Sobre esta malla se aplicó el método de Kriging ordinario con el fin de estimar valores de temperatura en ubicaciones donde no existían mediciones directas.

El procedimiento permitió construir una superficie continua de temperatura y una superficie asociada de varianza de predicción, proporcionando información tanto de los valores estimados como de la incertidumbre espacial de dichas estimaciones.

Validación del modelo

Finalmente, se realizó una validación cruzada utilizando el procedimiento leave-one-out. En este método, cada observación fue retirada temporalmente del conjunto de datos y posteriormente estimada utilizando las observaciones restantes.

La calidad predictiva del modelo fue evaluada mediante el análisis de los residuales y el cálculo de métricas de error, incluyendo el Error Absoluto Medio (MAE) y la Raíz del Error Cuadrático Medio (RMSE). Estas métricas permitieron cuantificar la precisión de las predicciones obtenidas mediante el modelo geoestadístico seleccionado.

PASO 1: cargar datos y filtrar el periodo.

# Configuración general del documento
knitr::opts_chunk$set(
  echo = TRUE,
  message = FALSE,
  warning = FALSE
)

# Librerías principales
library(readxl)
library(dplyr)
library(ggplot2)
library(sp)
library(gstat)
library(automap)

library(readxl)

datos <- read_excel("Datos_Completos_Aguacate.xlsx")

dim(datos)

## [1] 20271    21

names(datos)

##  [1] "id_arbol"                       "Latitude"                      
##  [3] "Longitude"                      "FORMATTED_DATE_TIME"           
##  [5] "Psychro_Wet_Bulb_Temperature"   "Station_Pressure"              
##  [7] "Relative_Humidity"              "Crosswind"                     
##  [9] "Temperature"                    "Barometric_Pressure"           
## [11] "Headwind"                       "Direction_True"                
## [13] "Direction_Mag"                  "Wind_Speed"                    
## [15] "Heat_Stress_Index"              "Altitude"                      
## [17] "Dew_Point"                      "Density_Altitude"              
## [19] "Wind_Chill"                     "Estado_Fenologico_Predominante"
## [21] "Frutos_Afectados"

library(dplyr)

# Revisar algunos valores de fecha
head(datos$FORMATTED_DATE_TIME)

## [1] "21/08/2019  9:22:57 a, m," "21/08/2019  9:27:13 a, m,"
## [3] "21/08/2019  9:36:36 a, m," "21/08/2019  9:38:02 a, m,"
## [5] "21/08/2019  9:39:38 a, m," "21/08/2019  9:42:02 a, m,"

# Filtrar registros del 01/10/2020
datos_20201001 <- datos %>%
  filter(grepl("01/10/2020", FORMATTED_DATE_TIME))

# Verificar cantidad de registros
dim(datos_20201001)

## [1] 534  21

PASO 2. Análisis Exploratorio de la Temperatura

summary(datos_20201001$Temperature)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   22.20   24.50   25.80   25.83   27.18   29.70

hist(
  datos_20201001$Temperature,
  main = "Distribución de la Temperatura",
  xlab = "Temperatura (°C)",
  col = "lightblue",
  border = "white"
)

boxplot(
  datos_20201001$Temperature,
  main = "Boxplot de Temperatura",
  ylab = "Temperatura (°C)",
  col = "orange"
)

Exploración descriptiva de la variable temperatura

Como primera etapa del análisis geoestadístico se realizó una exploración descriptiva de la variable temperatura correspondiente a las observaciones registradas el 01 de octubre de 2020. Después de filtrar la base de datos para esta fecha, se obtuvo un conjunto de 534 registros georreferenciados distribuidos dentro del área de estudio.

Los estadísticos descriptivos evidencian una temperatura mínima de 22,20 °C y una máxima de 29,70 °C, con una media de 25,83 °C y una mediana de 25,80 °C. La cercanía entre la media y la mediana sugiere una distribución relativamente equilibrada, sin indicios de sesgos pronunciados hacia valores extremos.

El histograma muestra una concentración importante de observaciones entre 24 °C y 27 °C, con una forma aproximadamente unimodal. Aunque la distribución no corresponde estrictamente a una normal, presenta un comportamiento suficientemente regular para continuar con los procedimientos geoestadísticos posteriores.

Por su parte, el diagrama de caja evidencia una dispersión moderada de los datos y no muestra valores atípicos significativos. La ausencia de observaciones extremas resulta favorable para la construcción del semivariograma experimental, dado que disminuye la posibilidad de que algunos registros ejerzan una influencia desproporcionada sobre la estimación de la estructura de dependencia espacial.

En conjunto, estos resultados indican que la variable temperatura presenta una variabilidad consistente y una distribución adecuada para continuar con el análisis espacial, particularmente con la evaluación de la autocorrelación espacial y la posterior aplicación de técnicas de interpolación mediante Kriging.

PASO 3. Crear el objeto espacial y visualizar la distribución de los árboles

library(sp)

# Crear objeto espacial
coordinates(datos_20201001) <- ~Longitude + Latitude

# Definir sistema de coordenadas geográficas
proj4string(datos_20201001) <- CRS("+proj=longlat +datum=WGS84")

# Visualizar distribución espacial
plot(
  datos_20201001,
  pch = 16,
  col = "darkgreen",
  main = "Distribución espacial de los árboles de aguacate"
)

Construcción del objeto espacial y distribución de las observaciones

Una vez seleccionado el conjunto de datos correspondiente al 01 de octubre de 2020, se construyó un objeto espacial utilizando las coordenadas geográficas de longitud y latitud asociadas a cada árbol de aguacate. Para ello se empleó el sistema de referencia geográfica WGS84, permitiendo representar espacialmente las observaciones dentro del área de estudio.

La visualización espacial evidencia la presencia de 534 árboles distribuidos a lo largo de la finca. Se observa una cobertura espacial relativamente uniforme, sin vacíos importantes ni concentraciones excesivas de observaciones en zonas específicas. Esta característica resulta favorable para la aplicación de técnicas geoestadísticas, dado que permite evaluar la dependencia espacial de la variable de interés a diferentes escalas de distancia.

La distribución observada sugiere que el muestreo realizado proporciona una representación adecuada de la variabilidad espacial existente dentro de la finca. En consecuencia, se dispone de una base sólida para continuar con la exploración de patrones espaciales y la posterior construcción de modelos de interpolación mediante Kriging.

PASO 4. Evaluar tendencia espacial de la temperatura

spplot(
  datos_20201001,
  "Temperature",
  main = "Distribución espacial de la temperatura",
  col.regions = terrain.colors(100)
)

Exploración espacial de la variable temperatura

Con el propósito de identificar posibles patrones espaciales en la variable temperatura, se realizó una representación cartográfica de las observaciones georreferenciadas. Cada árbol fue clasificado de acuerdo con el valor de temperatura registrado durante el periodo de estudio.

La distribución espacial evidencia que la temperatura no se comporta de manera completamente aleatoria dentro de la finca. Se observan agrupamientos de valores similares y zonas donde predominan determinados rangos térmicos. En particular, pueden identificarse franjas espaciales en las que las temperaturas altas y bajas tienden a concentrarse, sugiriendo la existencia de dependencia espacial entre observaciones cercanas.

Este comportamiento constituye un indicio preliminar de autocorrelación espacial positiva, ya que los árboles próximos entre sí parecen compartir condiciones térmicas semejantes. Aunque esta observación visual no permite cuantificar formalmente la dependencia espacial, sí proporciona evidencia inicial de que la temperatura podría presentar una estructura espacial susceptible de ser modelada mediante herramientas geoestadísticas.

Los resultados obtenidos justifican la construcción del semivariograma experimental, el cual permitirá evaluar cuantitativamente la relación entre la similitud de las observaciones y la distancia que las separa.

PASO 5. Construcción del semivariograma experimental

library(gstat)

semivar_temp <- variogram(
  Temperature ~ 1,
  datos_20201001
)

plot(
  semivar_temp,
  main = "Semivariograma experimental de la temperatura"
)

head(semivar_temp)

##     np        dist    gamma dir.hor dir.ver   id
## 1  358 0.004612890 1.290726       0       0 var1
## 2 1981 0.008157427 1.522408       0       0 var1
## 3 3186 0.013574004 2.144479       0       0 var1
## 4 4194 0.019029923 2.499531       0       0 var1
## 5 5058 0.024475580 2.758437       0       0 var1
## 6 5736 0.029888297 2.792619       0       0 var1

Semivariograma experimental

Con el fin de evaluar la existencia de dependencia espacial en la variable temperatura, se construyó el semivariograma experimental utilizando las observaciones georreferenciadas correspondientes al periodo de estudio.

El semivariograma obtenido presenta un incremento progresivo de la semivarianza a medida que aumenta la distancia entre las observaciones. Este comportamiento indica que los árboles cercanos tienden a registrar valores de temperatura más similares que aquellos ubicados a mayores distancias, evidenciando la presencia de autocorrelación espacial positiva.

Adicionalmente, se observa una tendencia hacia la estabilización de la semivarianza para distancias mayores, sugiriendo la existencia de un umbral a partir del cual la similitud espacial disminuye significativamente. Este patrón es consistente con el comportamiento esperado en variables ambientales que presentan continuidad espacial dentro del área de estudio.

Los resultados obtenidos permiten concluir que la temperatura presenta una estructura espacial claramente definida, por lo que resulta apropiado ajustar un modelo teórico de semivariograma y posteriormente realizar procesos de interpolación espacial mediante Kriging.

PASO 6. Ajustar modelos teóricos

modelo_exp <- fit.variogram(
  semivar_temp,
  vgm(model = "Exp")
)

modelo_sph <- fit.variogram(
  semivar_temp,
  vgm(model = "Sph")
)

modelo_gau <- fit.variogram(
  semivar_temp,
  vgm(model = "Gau")
)

plot(
  semivar_temp,
  modelo_exp,
  main = "Comparación de modelos teóricos"
)

plot(
  semivar_temp,
  modelo_sph,
  add = TRUE,
  col = "blue"
)

plot(
  semivar_temp,
  modelo_gau,
  add = TRUE,
  col = "red"
)

##   model     psill      range
## 1   Gau 0.7218469 -0.2148592

modelo_exp

##   model psill      range
## 1   Exp     0 0.02625255

modelo_sph

##   model    psill      range
## 1   Sph 2.805465 0.02168725

modelo_gau

##   model     psill      range
## 1   Gau 0.7218469 -0.2148592

modelo_sph <- fit.variogram(
  semivar_temp,
  model = vgm(
    psill = 2.8,
    model = "Sph",
    range = 0.022,
    nugget = 0
  )
)

plot(
  semivar_temp,
  modelo_sph,
  main = "Ajuste del modelo esférico"
)

modelo_sph

##   model     psill      range
## 1   Nug 0.7528862 0.00000000
## 2   Sph 2.1499219 0.03079433

Ajuste del modelo teórico del semivariograma

Una vez obtenido el semivariograma experimental, se procedió a evaluar diferentes funciones teóricas comúnmente utilizadas en geoestadística para representar la estructura de dependencia espacial. Se exploraron modelos de tipo exponencial, gaussiano y esférico.

Durante el proceso de ajuste se observó que los modelos exponencial y gaussiano presentaron dificultades de convergencia y parámetros no consistentes con la estructura observada en los datos. Particularmente, el modelo gaussiano produjo estimaciones inválidas del parámetro de alcance, mientras que el modelo exponencial mostró un ajuste deficiente sobre la forma del semivariograma experimental.

Por el contrario, el modelo esférico logró representar adecuadamente el incremento inicial de la semivarianza y su posterior estabilización. Este comportamiento coincide con la forma observada en el semivariograma experimental, donde la dependencia espacial disminuye progresivamente hasta alcanzar una meseta relativamente estable.

En consecuencia, el modelo esférico fue seleccionado como la función teórica más apropiada para describir la estructura espacial de la temperatura dentro del área de estudio y servir como base para el proceso de interpolación espacial mediante Kriging.

Selección y ajuste del modelo teórico

El modelo esférico fue seleccionado como la función teórica que mejor representa la estructura de dependencia espacial observada en el semivariograma experimental. La curva ajustada reproduce adecuadamente el incremento inicial de la semivarianza y la posterior estabilización observada en los datos.

Los parámetros estimados indican la presencia de un efecto nugget de 0,753, lo que sugiere la existencia de un componente de variabilidad local o error de medición que no puede ser explicada completamente por la estructura espacial. Adicionalmente, el alcance estimado fue de aproximadamente 0,031 unidades de distancia, indicando que la dependencia espacial de la temperatura se mantiene hasta dicho valor y disminuye significativamente para distancias superiores.

La forma del modelo ajustado confirma la existencia de autocorrelación espacial positiva dentro de la finca, evidenciando que los árboles cercanos presentan condiciones térmicas más similares que aquellos ubicados a mayores distancias. Este resultado valida la utilización de técnicas de interpolación geoestadística para estimar la distribución espacial de la temperatura en áreas no muestreadas.

PASO 7. Construcción de la malla para Kriging

grd <- expand.grid(
  Longitude = seq(
    min(coordinates(datos_20201001)[,1]),
    max(coordinates(datos_20201001)[,1]),
    length.out = 100
  ),
  Latitude = seq(
    min(coordinates(datos_20201001)[,2]),
    max(coordinates(datos_20201001)[,2]),
    length.out = 100
  )
)

coordinates(grd) <- ~Longitude + Latitude
gridded(grd) <- TRUE

proj4string(grd) <- CRS(proj4string(datos_20201001))

cat("Malla de prediccion creada con 10.000 celdas (100 x 100)")

## Malla de prediccion creada con 10.000 celdas (100 x 100)

# Se ejecuta el Kriging ordinario
kriging_temp <- krige(
  Temperature ~ 1,
  datos_20201001,
  grd,
  model = modelo_sph
)

## [using ordinary kriging]

# Resumen compacto de resultados
resumen_kriging <- data.frame(
  Estadistico = c(
    "Minimo",
    "Primer cuartil",
    "Mediana",
    "Media",
    "Tercer cuartil",
    "Maximo"
  ),
  Temperatura_predicha = c(
    min(kriging_temp$var1.pred),
    quantile(kriging_temp$var1.pred, 0.25),
    median(kriging_temp$var1.pred),
    mean(kriging_temp$var1.pred),
    quantile(kriging_temp$var1.pred, 0.75),
    max(kriging_temp$var1.pred)
  ),
  Varianza_prediccion = c(
    min(kriging_temp$var1.var),
    quantile(kriging_temp$var1.var, 0.25),
    median(kriging_temp$var1.var),
    mean(kriging_temp$var1.var),
    quantile(kriging_temp$var1.var, 0.75),
    max(kriging_temp$var1.var)
  )
)

knitr::kable(
  resumen_kriging,
  digits = 3,
  caption = "Resumen de predicciones obtenidas mediante Kriging ordinario"
)

Resumen de predicciones obtenidas mediante Kriging ordinario
Estadistico	Temperatura_predicha	Varianza_prediccion
Minimo	22.831	1.069
Primer cuartil	25.096	1.214
Mediana	25.875	1.285
Media	25.863	1.764
Tercer cuartil	26.493	2.543
Maximo	28.952	2.959

Interpolación espacial mediante Kriging ordinario

Una vez ajustado el modelo esférico, se procedió a construir una malla regular de predicción con una resolución de 100 × 100 celdas, cubriendo la totalidad del área de estudio. Esta malla permitió generar estimaciones continuas de temperatura en ubicaciones donde no se realizaron mediciones directas.

Posteriormente se aplicó el método de Kriging ordinario utilizando como base el modelo de semivariograma previamente seleccionado. Esta técnica aprovecha la estructura de dependencia espacial identificada en los datos para estimar valores en puntos no muestreados, asignando mayor peso a las observaciones cercanas y menor influencia a aquellas más distantes.

Los resultados obtenidos muestran que las temperaturas predichas oscilan entre 22,83 °C y 28,95 °C, con una temperatura promedio estimada de 25,86 °C. Estos valores son consistentes con los estadísticos descriptivos observados inicialmente en la muestra original, lo que constituye una primera evidencia de coherencia del modelo de interpolación.

Adicionalmente, el procedimiento generó una superficie de varianza de predicción asociada a cada estimación espacial. Los valores de varianza obtenidos fluctuaron entre 1,07 y 2,96, reflejando diferencias en el nivel de incertidumbre de las predicciones según la ubicación espacial. Este resultado es esperado en procesos geoestadísticos, ya que la precisión de la estimación depende de la densidad y distribución de las observaciones cercanas a cada punto de predicción.

La obtención de estas superficies de predicción e incertidumbre constituye la base para la construcción de los mapas espaciales de temperatura y para la posterior interpretación de los patrones térmicos presentes en la finca.

Paso 8: mapa de temperatura interpolada mediante Kriging

spplot(
  kriging_temp["var1.pred"],
  main = "Temperatura interpolada mediante Kriging ordinario",
  col.regions = terrain.colors(100)
)

Distribución espacial de la temperatura mediante Kriging

La aplicación del método de Kriging ordinario permitió generar una superficie continua de temperatura para toda el área de estudio a partir de las observaciones registradas en los árboles de aguacate. El mapa resultante evidencia una marcada heterogeneidad espacial en la distribución térmica de la finca.

Las temperaturas más bajas se concentran en zonas representadas por tonalidades verdes, con valores cercanos a 22 °C–24 °C, mientras que las temperaturas más elevadas se localizan en sectores específicos identificados mediante tonalidades claras, alcanzando valores próximos a 29 °C. Entre ambos extremos se observan áreas de transición con temperaturas intermedias que oscilan aproximadamente entre 25 °C y 27 °C.

Un aspecto relevante es la presencia de patrones espaciales continuos que forman franjas diagonales de temperatura similar a lo largo del área de estudio. Este comportamiento indica que la variación térmica no ocurre de manera aleatoria, sino que responde a una estructura espacial definida, consistente con los resultados obtenidos previamente en el análisis del semivariograma.

La superficie interpolada confirma la existencia de dependencia espacial en la variable temperatura y permite identificar sectores con condiciones térmicas diferenciadas dentro de la finca. Este tipo de información resulta útil para comprender la variabilidad microclimática presente en el cultivo y constituye una herramienta valiosa para apoyar procesos de monitoreo y toma de decisiones en sistemas agrícolas.

PASO 9. Mapa de incertidumbre del Kriging

spplot(
  kriging_temp["var1.var"],
  main = "Varianza de predicción del Kriging",
  col.regions = heat.colors(100)
)

Evaluación de la incertidumbre de la predicción

Además de la superficie interpolada de temperatura, el método de Kriging ordinario permitió estimar la varianza asociada a cada predicción espacial. Esta superficie representa el nivel de incertidumbre del modelo en cada ubicación del área de estudio.

Los resultados muestran que la menor incertidumbre se concentra en la zona central de la finca, donde la densidad de observaciones es mayor y las estimaciones se encuentran respaldadas por un número más amplio de datos vecinos. En estas áreas el modelo dispone de suficiente información espacial para generar predicciones más precisas.

Por el contrario, las mayores varianzas de predicción se localizan en los límites del área de estudio. Este comportamiento es consistente con los fundamentos teóricos del Kriging, ya que en los bordes existen menos observaciones circundantes disponibles para estimar los valores de la variable, incrementando así la incertidumbre asociada a la interpolación.

La distribución espacial de la varianza sugiere que el modelo presenta un desempeño adecuado dentro de la mayor parte de la finca y que las predicciones realizadas en las zonas centrales son más confiables que aquellas obtenidas en sectores periféricos. En términos generales, la magnitud de la incertidumbre observada es coherente con la configuración espacial del muestreo y respalda la validez de la superficie interpolada obtenida para la variable temperatura.

PASO 10. Validación cruzada del modelo

cv <- krige.cv(
  Temperature ~ 1,
  datos_20201001,
  model = modelo_sph
)

summary(cv$residual)

##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -3.63735 -0.65387  0.00373 -0.00552  0.72408  2.71175

MAE <- mean(abs(cv$residual))
RMSE <- sqrt(mean(cv$residual^2))

MAE

## [1] 0.866403

RMSE

## [1] 1.095197

Validación cruzada del modelo geoestadístico

Con el propósito de evaluar el desempeño predictivo del modelo seleccionado, se realizó una validación cruzada mediante el procedimiento leave-one-out, en el cual cada observación es retirada temporalmente y posteriormente estimada utilizando la información proporcionada por las restantes observaciones.

Los resultados muestran un error absoluto medio (MAE) de 0,866 °C y una raíz del error cuadrático medio (RMSE) de 1,095 °C. Estos valores indican que las predicciones obtenidas mediante Kriging presentan diferencias relativamente pequeñas respecto a las observaciones reales, lo que evidencia una capacidad predictiva adecuada del modelo ajustado.

Por otra parte, el promedio de los residuales fue de -0,0055 °C, valor muy cercano a cero. Este resultado sugiere que el modelo no presenta tendencias sistemáticas de sobreestimación o subestimación de la temperatura, constituyendo un indicador favorable de ausencia de sesgo en las predicciones.

En conjunto, los resultados de la validación cruzada respaldan la capacidad del modelo geoestadístico para representar la estructura espacial de la temperatura dentro de la finca y generan confianza sobre la calidad de las superficies interpoladas obtenidas mediante Kriging ordinario.

Conclusiones

El análisis exploratorio de la temperatura permitió identificar una distribución relativamente equilibrada de los datos, con valores comprendidos entre 22,20 °C y 29,70 °C y ausencia de valores atípicos significativos. Estas características favorecieron la aplicación de técnicas geoestadísticas al garantizar una variabilidad consistente de la variable de estudio.
La exploración espacial de las observaciones evidenció la presencia de agrupamientos de temperaturas similares dentro de la finca. Esta estructura fue posteriormente confirmada mediante el semivariograma experimental, el cual mostró un incremento progresivo de la semivarianza con la distancia y una clara tendencia hacia la estabilización, indicando la existencia de autocorrelación espacial positiva.
Entre los modelos evaluados para representar la dependencia espacial, el modelo esférico presentó el mejor comportamiento y logró describir adecuadamente la estructura observada en el semivariograma experimental. Los parámetros estimados permitieron caracterizar el alcance de la dependencia espacial y cuantificar la variabilidad explicada por el proceso espacial.
La interpolación mediante Kriging ordinario permitió generar una superficie continua de temperatura para toda el área de estudio. Los resultados evidenciaron una distribución espacial heterogénea, con zonas claramente diferenciadas de temperaturas bajas, medias y altas, organizadas en patrones espaciales continuos que reflejan la variabilidad climática existente dentro de la finca.
La validación cruzada mostró un desempeño satisfactorio del modelo geoestadístico, obteniéndose un MAE de 0,866 °C y un RMSE de 1,095 °C. Adicionalmente, el error medio fue cercano a cero, indicando ausencia de sesgos importantes en las predicciones. Estos resultados respaldan la capacidad del modelo para representar adecuadamente la variabilidad espacial de la temperatura y confirman la utilidad del Kriging como herramienta para la estimación de variables ambientales en zonas agrícolas.

Informe3_Aguacate_SantiagoGomez

Santiago Gomez

2026-05-30