1 Contexto de Datos

El presente informe tiene como objetivo realizar una interpolación espacial de una variable ambiental mediante técnicas geoestadísticas, siguiendo el flujo metodológico estándar: análisis exploratorio de datos, evaluación de autocorrelación espacial, ajuste de semivariograma teórico y predicción mediante Kriging Ordinario.

Los datos provienen de un conjunto de mediciones ambientales registradas en una finca, en los que cada registro corresponde a la ubicación georreferenciada de un árbol junto con variables como temperatura, humedad relativa, velocidad del viento y altitud. Para este análisis se utiliza únicamente el primer período de medición, correspondiente a la fecha 01 de octubre de 2020, lo que garantiza que todas las observaciones sean temporalmente homogéneas y comparables entre sí.

El conjunto de datos filtrado contiene 534 registros. Cada registro incluye la ubicación geográfica del árbol (latitud y longitud) y las variables ambientales medidas: temperatura, humedad relativa, velocidad del viento y altitud.

La variable de partida para el análisis es Temperatura, dado que presenta una estructura de autocorrelación espacial definida que permite su modelamiento geoestadístico.


2 Análisis Exploratorio de Datos (EDA)

El análisis exploratorio permite caracterizar la distribución estadística de la variable seleccionada, identificar valores atípicos y detectar posibles tendencias espaciales antes de proceder con el modelamiento geoestadístico.

2.1 Estadísticos Descriptivos

Estadísticos descriptivos – Temperatura (°C)
Estadístico Valor
N 534.0000
Media 25.8290
Mediana 25.8000
Desv. Est. 1.7711
Mínimo 22.2000
Máximo 29.7000
Q1 (25%) 24.5000
Q3 (75%) 27.1750
IQR 2.6750
Asimetría 0.1614
Curtosis 2.3129

2.2 Distribución de la Variable

Los siguientes gráficos permiten evaluar la forma de la distribución de la variable seleccionada: el histograma con curva de densidad muestra la distribución empírica, mientras que el boxplot facilita la identificación visual de valores atípicos.

Distribución de la variable seleccionada.

Distribución de la variable seleccionada.

2.3 Detección de Valores Atípicos

El criterio IQR establece un límite inferior de 20.488 y un límite superior de 31.187. No se identificaron valores atípicos en el conjunto de datos.

2.4 Evaluación de Normalidad

La geoestadística basada en Kriging no requiere estrictamente normalidad, pero distribuciones muy asimétricas pueden afectar la calidad del ajuste del semivariograma. Se aplican dos pruebas formales de normalidad.

Pruebas de normalidad – Temperatura (°C)
Prueba Estadístico p.valor Conclusión
A Anderson-Darling 1.6781 0.0002618 Rechaza normalidad (α=0.05)
W Shapiro-Wilk 0.9835 9.451e-06 Rechaza normalidad (α=0.05)
Gráfico Q-Q Normal para evaluación de la distribución de la variable.

Gráfico Q-Q Normal para evaluación de la distribución de la variable.

2.5 Distribución Espacial y Tendencias

El mapa de burbujas superpone el valor de la variable sobre la ubicación geográfica de cada punto de muestreo, permitiendo identificar visualmente si existe alguna tendencia o gradiente espacial en los datos.

Mapa de burbujas: distribución espacial de la variable seleccionada.

Mapa de burbujas: distribución espacial de la variable seleccionada.

2.6 Interpretación

La temperatura registra una media de 25.83 °C y una mediana de 25.80 °C, valores prácticamente idénticos que sugieren una distribución aproximadamente simétrica. La desviación estándar de 1.77 °C indica una dispersión moderada dentro del rango observado (22.2 °C – 29.7 °C).

El coeficiente de asimetría es de 0.16, cercano a cero, y la curtosis de 2.31 indica una distribución ligeramente platicúrtica. No se detectaron valores atípicos bajo el criterio IQR. Sin embargo, las pruebas formales de normalidad (Anderson-Darling: A = 1.678, p < 0.001; Shapiro-Wilk: W = 0.984, p < 0.001) rechazan la hipótesis de normalidad al nivel α = 0.05, lo que es esperable en muestras de tamaño 534. Esta desviación de la normalidad es leve y no compromete el análisis geoestadístico, dado que el Kriging Ordinario no exige normalidad estricta.

El mapa de burbujas permite apreciar una variación espacial de la temperatura a lo largo del área de la finca, con una ligera tendencia a valores más elevados hacia ciertos sectores, lo que motiva la búsqueda de estructura en el semivariograma.


3 Creación del Objeto Espacial

Para el análisis geoestadístico es necesario convertir el conjunto de datos tabulares en un objeto espacial, asignando el sistema de referencia de coordenadas (CRS) correspondiente. Dado que las coordenadas están expresadas en latitud y longitud geográfica, se utiliza el sistema WGS84 (EPSG:4326).

3.1 Mapa de Distribución Espacial de los Puntos de Muestreo

Distribución espacial de los puntos de muestreo dentro de la finca.

Distribución espacial de los puntos de muestreo dentro de la finca.

El mapa confirma la distribución de los 534 puntos de muestreo en el área de la finca. La variación cromática permite una primera inspección visual de la distribución espacial de la variable analizada.


4 Análisis de Autocorrelación Espacial

El semivariograma experimental es la herramienta central del análisis geoestadístico. Mide cómo varía la semivarianza entre pares de puntos en función de la distancia que los separa. Una estructura clara y creciente en el semivariograma indica la presencia de autocorrelación espacial, condición necesaria para aplicar Kriging.

4.1 Semivariograma Experimental

Semivariograma experimental de la variable seleccionada.

Semivariograma experimental de la variable seleccionada.

4.2 Interpretación de los Parámetros del Semivariograma

Los tres parámetros estructurales del semivariograma permiten caracterizar la naturaleza de la dependencia espacial:

  • Nugget: Representa la variabilidad a distancias menores que el intervalo mínimo de muestreo, incluyendo el error de medición y la variabilidad a microescala. Se estima como el valor de semivarianza en la intersección con el eje Y (distancia = 0).

  • Sill: Es el valor de semivarianza en el que el semivariograma se estabiliza, equivalente a la varianza total de la variable. La diferencia entre el sill y el nugget se denomina varianza estructural.

  • Range: Es la distancia a la cual el semivariograma alcanza el sill. Más allá del alcance, las observaciones dejan de estar espacialmente correlacionadas.

El semivariograma experimental de la temperatura exhibe una estructura espacial definida y creciente con la distancia, lo que confirma la existencia de dependencia espacial en la variable. Se observa un nugget cercano a cero, lo que sugiere una variabilidad a microescala negligible y una alta continuidad espacial. La semivarianza aumenta progresivamente hasta estabilizarse en una meseta (sill) aproximada de 3.1, equivalente a la varianza total de la variable.

Este punto de estabilización se alcanza a una distancia de aproximadamente 10 a 15 metros (range), más allá de la cual los pares de puntos dejan de estar espacialmente correlacionados. La relación Nugget/Sill cercana a cero indica que la mayor parte de la variabilidad es de origen espacial estructurado, lo que constituye una condición favorable para la interpolación por Kriging.


5 Ajuste de Modelos Teóricos de Semivariograma

Con el semivariograma experimental calculado, se procede al ajuste de tres modelos teóricos estándar: esférico, exponencial y gaussiano. Estos modelos matemáticos permiten una descripción continua de la estructura espacial, requisito indispensable para la interpolación por Kriging.

5.1 Parámetros de los Modelos Ajustados

Parámetros ajustados de los modelos de semivariograma
Modelo Nugget Sill Alcance (m) SSE
Esférico 0.3674 2.9300 27.6 2.289211
Exponencial 0.0000 3.0986 12.0 1.383167
Gaussiano 0.9788 2.9033 15.3 2.698052

5.2 Comparación Visual de Modelos

Comparación del ajuste de los tres modelos teóricos de semivariograma sobre el semivariograma experimental.

Comparación del ajuste de los tres modelos teóricos de semivariograma sobre el semivariograma experimental.

5.3 Interpretación

De los tres modelos teóricos evaluados, el modelo Exponencial presenta el mejor ajuste con un SSE de 1.383, notablemente inferior al Esférico (SSE = 2.289) y al Gaussiano (SSE = 2.698). El modelo Exponencial alcanza el sill de forma asintótica y su nugget estimado en cero refuerza la alta continuidad espacial observada en los datos.

La comparación visual confirma que este modelo sigue fielmente la trayectoria del semivariograma experimental en todos los intervalos de distancia, sin sobreajuste en las clases extremas. Por estas razones, el modelo Exponencial es seleccionado como el más adecuado para la interpolación.


6 Validación del Modelo

Antes de proceder con la interpolación, se realiza una validación cruzada de tipo leave-one-out: cada punto de observación es retirado temporalmente del conjunto de datos, se predice su valor usando los puntos restantes y se compara el valor predicho con el observado. Este proceso permite evaluar la capacidad predictiva del modelo ajustado.

Métricas de validación cruzada – Exponencial
Métrica Valor Referencia
Error Medio (ME) -0.01091 ≈ 0 (sin sesgo)
Error Cuadrático Medio (MSE) 1.02702 Menor es mejor
Raíz del Error Cuadrático Medio (RMSE) 1.01342 Menor es mejor
Error Estándar Medio (MSE_std) -0.00510 ≈ 0 (sin sesgo)
Razón de Desviación Cuadrática Media (MSDR) 0.95292 ≈ 1 (varianza correctamente estimada)
Diagnóstico de la validación cruzada.

Diagnóstico de la validación cruzada.

6.1 Interpretación

Los resultados de la validación cruzada leave-one-out indican un desempeño satisfactorio del modelo.

El Error Medio (ME = −0.011) es prácticamente cero, lo que evidencia la ausencia de sesgo sistemático en las predicciones. El RMSE de 1.013 °C representa el error típico de predicción, equivalente a menos del 4% del rango total de la variable, un valor aceptable para este tipo de datos ambientales. El Error Estándar Medio (−0.005) confirma la ausencia de sesgo en la escala estandarizada. Finalmente, la Razón de Desviación Cuadrática Media (MSDR = 0.953), muy cercana a 1, indica que las varianzas de predicción del Kriging están correctamente calibradas y son representativas del error real.

El gráfico de observados vs. predichos muestra una distribución cercana a la línea 1:1, y los residuos estandarizados siguen una distribución aproximadamente normal centrada en cero, sin patrones sistemáticos.


7 Interpolación Espacial mediante Kriging Ordinario

Con el modelo de semivariograma validado, se procede a la interpolación espacial. El Kriging Ordinario genera una superficie continua de predicción para toda el área de estudio, estimando el valor de la variable en cada celda de una grilla regular a partir de la combinación ponderada de los puntos de observación circundantes. Se construyó una grilla regular de 9.797 celdas con una resolución espacial de 1.8 m, cubriendo la totalidad del área de estudio.”


8 Resultados Cartográficos

Esta sección presenta los mapas finales del análisis geoestadístico. Los mapas integran los elementos cartográficos esenciales: título, escala, flecha de norte y leyenda.

8.1 Mapa de Predicción Espacial (Kriging)

Superficie de predicción generada mediante Kriging Ordinario.

Superficie de predicción generada mediante Kriging Ordinario.

8.2 Mapa de Incertidumbre (Varianza de Predicción)

La varianza de predicción del Kriging cuantifica la incertidumbre asociada a cada valor interpolado. Zonas con mayor densidad de puntos de muestreo presentan menor varianza, mientras que las áreas alejadas de observaciones muestran mayor incertidumbre.

Mapa de incertidumbre de la predicción: desviación estándar del Kriging Ordinario.

Mapa de incertidumbre de la predicción: desviación estándar del Kriging Ordinario.

8.3 Semivariograma con Modelo Ajustado

Semivariograma experimental con el modelo teórico ajustado seleccionado.

Semivariograma experimental con el modelo teórico ajustado seleccionado.


9 Interpretación de Resultados

El mapa de predicción espacial generado mediante Kriging Ordinario muestra una distribución continua de la temperatura en el área de la finca, con valores interpolados que oscilan entre 22.2 °C y 29.5 °C, consistentes con el rango observado en los datos originales. Se identifican sectores con temperaturas más elevadas concentrados en zonas específicas de la finca, mientras que otros sectores presentan valores más bajos, lo que sugiere la existencia de microclimas diferenciados dentro del área de estudio.

El mapa de incertidumbre (desviación estándar de la predicción) revela que los errores de estimación son menores en las zonas con mayor densidad de puntos de muestreo, donde el modelo cuenta con más información local para realizar la predicción. Las áreas periféricas o con menor cobertura de muestreo presentan mayor incertidumbre, lo cual es un comportamiento esperado y coherente con la naturaleza del Kriging Ordinario. En términos generales, la incertidumbre se mantiene en niveles aceptables a lo largo del dominio, lo que respalda la confiabilidad de la superficie interpolada.


10 Conclusiones

El análisis geoestadístico de la temperatura registrada en la finca el 1 de octubre de 2020 permitió caracterizar su estructura de variabilidad espacial y generar una superficie continua de predicción mediante Kriging Ordinario.

El análisis exploratorio evidenció una distribución de la temperatura aproximadamente simétrica, con media de 25.83 °C, ausencia de valores atípicos y una desviación leve de la normalidad que no compromete el análisis geoestadístico. El semivariograma experimental confirmó la existencia de autocorrelación espacial significativa, con un nugget cercano a cero, un sill de aproximadamente 3.1 y un alcance de 10 a 15 metros, indicando que la mayor parte de la variabilidad tiene origen espacial estructurado.

De los tres modelos teóricos evaluados, el modelo Exponencial presentó el mejor ajuste (SSE = 1.383), y su validación cruzada confirmó predicciones sin sesgo sistemático (ME = −0.011), con un RMSE de 1.013 °C y una varianza de predicción correctamente calibrada (MSDR = 0.953). Los mapas resultantes muestran una distribución espacial diferenciada de la temperatura dentro de la finca, con zonas de mayor incertidumbre en los bordes del área de estudio, coherentes con la menor densidad de puntos de muestreo en esas zonas.