El presente informe tiene como objetivo realizar una interpolación espacial de una variable ambiental mediante técnicas geoestadísticas, siguiendo el flujo metodológico estándar: análisis exploratorio de datos, evaluación de autocorrelación espacial, ajuste de semivariograma teórico y predicción mediante Kriging Ordinario.
Los datos provienen de un conjunto de mediciones ambientales registradas en una finca, en los que cada registro corresponde a la ubicación georreferenciada de un árbol junto con variables como temperatura, humedad relativa, velocidad del viento y altitud. Para este análisis se utiliza únicamente el primer período de medición, correspondiente a la fecha 01 de octubre de 2020, lo que garantiza que todas las observaciones sean temporalmente homogéneas y comparables entre sí.
El conjunto de datos filtrado contiene 534 registros. Cada registro incluye la ubicación geográfica del árbol (latitud y longitud) y las variables ambientales medidas: temperatura, humedad relativa, velocidad del viento y altitud.
La variable de partida para el análisis es Temperatura, dado que presenta una estructura de autocorrelación espacial definida que permite su modelamiento geoestadístico.
El análisis exploratorio permite caracterizar la distribución estadística de la variable seleccionada, identificar valores atípicos y detectar posibles tendencias espaciales antes de proceder con el modelamiento geoestadístico.
| Estadístico | Valor |
|---|---|
| N | 534.0000 |
| Media | 25.8290 |
| Mediana | 25.8000 |
| Desv. Est. | 1.7711 |
| Mínimo | 22.2000 |
| Máximo | 29.7000 |
| Q1 (25%) | 24.5000 |
| Q3 (75%) | 27.1750 |
| IQR | 2.6750 |
| Asimetría | 0.1614 |
| Curtosis | 2.3129 |
Los siguientes gráficos permiten evaluar la forma de la distribución de la variable seleccionada: el histograma con curva de densidad muestra la distribución empírica, mientras que el boxplot facilita la identificación visual de valores atípicos.
Distribución de la variable seleccionada.
El criterio IQR establece un límite inferior de 20.488 y un límite superior de 31.187. No se identificaron valores atípicos en el conjunto de datos.
La geoestadística basada en Kriging no requiere estrictamente normalidad, pero distribuciones muy asimétricas pueden afectar la calidad del ajuste del semivariograma. Se aplican dos pruebas formales de normalidad.
| Prueba | Estadístico | p.valor | Conclusión | |
|---|---|---|---|---|
| A | Anderson-Darling | 1.6781 | 0.0002618 | Rechaza normalidad (α=0.05) |
| W | Shapiro-Wilk | 0.9835 | 9.451e-06 | Rechaza normalidad (α=0.05) |
Gráfico Q-Q Normal para evaluación de la distribución de la variable.
El mapa de burbujas superpone el valor de la variable sobre la ubicación geográfica de cada punto de muestreo, permitiendo identificar visualmente si existe alguna tendencia o gradiente espacial en los datos.
Mapa de burbujas: distribución espacial de la variable seleccionada.
La temperatura registra una media de 25.83 °C y una mediana de 25.80 °C, valores prácticamente idénticos que sugieren una distribución aproximadamente simétrica. La desviación estándar de 1.77 °C indica una dispersión moderada dentro del rango observado (22.2 °C – 29.7 °C).
El coeficiente de asimetría es de 0.16, cercano a cero, y la curtosis de 2.31 indica una distribución ligeramente platicúrtica. No se detectaron valores atípicos bajo el criterio IQR. Sin embargo, las pruebas formales de normalidad (Anderson-Darling: A = 1.678, p < 0.001; Shapiro-Wilk: W = 0.984, p < 0.001) rechazan la hipótesis de normalidad al nivel α = 0.05, lo que es esperable en muestras de tamaño 534. Esta desviación de la normalidad es leve y no compromete el análisis geoestadístico, dado que el Kriging Ordinario no exige normalidad estricta.
El mapa de burbujas permite apreciar una variación espacial de la temperatura a lo largo del área de la finca, con una ligera tendencia a valores más elevados hacia ciertos sectores, lo que motiva la búsqueda de estructura en el semivariograma.
Para el análisis geoestadístico es necesario convertir el conjunto de datos tabulares en un objeto espacial, asignando el sistema de referencia de coordenadas (CRS) correspondiente. Dado que las coordenadas están expresadas en latitud y longitud geográfica, se utiliza el sistema WGS84 (EPSG:4326).
Distribución espacial de los puntos de muestreo dentro de la finca.
El mapa confirma la distribución de los 534 puntos de muestreo en el área de la finca. La variación cromática permite una primera inspección visual de la distribución espacial de la variable analizada.
El semivariograma experimental es la herramienta central del análisis geoestadístico. Mide cómo varía la semivarianza entre pares de puntos en función de la distancia que los separa. Una estructura clara y creciente en el semivariograma indica la presencia de autocorrelación espacial, condición necesaria para aplicar Kriging.
Semivariograma experimental de la variable seleccionada.
Los tres parámetros estructurales del semivariograma permiten caracterizar la naturaleza de la dependencia espacial:
Nugget: Representa la variabilidad a distancias menores que el intervalo mínimo de muestreo, incluyendo el error de medición y la variabilidad a microescala. Se estima como el valor de semivarianza en la intersección con el eje Y (distancia = 0).
Sill: Es el valor de semivarianza en el que el semivariograma se estabiliza, equivalente a la varianza total de la variable. La diferencia entre el sill y el nugget se denomina varianza estructural.
Range: Es la distancia a la cual el semivariograma alcanza el sill. Más allá del alcance, las observaciones dejan de estar espacialmente correlacionadas.
El semivariograma experimental de la temperatura exhibe una estructura espacial definida y creciente con la distancia, lo que confirma la existencia de dependencia espacial en la variable. Se observa un nugget cercano a cero, lo que sugiere una variabilidad a microescala negligible y una alta continuidad espacial. La semivarianza aumenta progresivamente hasta estabilizarse en una meseta (sill) aproximada de 3.1, equivalente a la varianza total de la variable.
Este punto de estabilización se alcanza a una distancia de aproximadamente 10 a 15 metros (range), más allá de la cual los pares de puntos dejan de estar espacialmente correlacionados. La relación Nugget/Sill cercana a cero indica que la mayor parte de la variabilidad es de origen espacial estructurado, lo que constituye una condición favorable para la interpolación por Kriging.
Con el semivariograma experimental calculado, se procede al ajuste de tres modelos teóricos estándar: esférico, exponencial y gaussiano. Estos modelos matemáticos permiten una descripción continua de la estructura espacial, requisito indispensable para la interpolación por Kriging.
| Modelo | Nugget | Sill | Alcance (m) | SSE |
|---|---|---|---|---|
| Esférico | 0.3674 | 2.9300 | 27.6 | 2.289211 |
| Exponencial | 0.0000 | 3.0986 | 12.0 | 1.383167 |
| Gaussiano | 0.9788 | 2.9033 | 15.3 | 2.698052 |
Comparación del ajuste de los tres modelos teóricos de semivariograma sobre el semivariograma experimental.
De los tres modelos teóricos evaluados, el modelo Exponencial presenta el mejor ajuste con un SSE de 1.383, notablemente inferior al Esférico (SSE = 2.289) y al Gaussiano (SSE = 2.698). El modelo Exponencial alcanza el sill de forma asintótica y su nugget estimado en cero refuerza la alta continuidad espacial observada en los datos.
La comparación visual confirma que este modelo sigue fielmente la trayectoria del semivariograma experimental en todos los intervalos de distancia, sin sobreajuste en las clases extremas. Por estas razones, el modelo Exponencial es seleccionado como el más adecuado para la interpolación.
Antes de proceder con la interpolación, se realiza una validación cruzada de tipo leave-one-out: cada punto de observación es retirado temporalmente del conjunto de datos, se predice su valor usando los puntos restantes y se compara el valor predicho con el observado. Este proceso permite evaluar la capacidad predictiva del modelo ajustado.
| Métrica | Valor | Referencia |
|---|---|---|
| Error Medio (ME) | -0.01091 | ≈ 0 (sin sesgo) |
| Error Cuadrático Medio (MSE) | 1.02702 | Menor es mejor |
| Raíz del Error Cuadrático Medio (RMSE) | 1.01342 | Menor es mejor |
| Error Estándar Medio (MSE_std) | -0.00510 | ≈ 0 (sin sesgo) |
| Razón de Desviación Cuadrática Media (MSDR) | 0.95292 | ≈ 1 (varianza correctamente estimada) |
Diagnóstico de la validación cruzada.
Los resultados de la validación cruzada leave-one-out indican un desempeño satisfactorio del modelo.
El Error Medio (ME = −0.011) es prácticamente cero, lo que evidencia la ausencia de sesgo sistemático en las predicciones. El RMSE de 1.013 °C representa el error típico de predicción, equivalente a menos del 4% del rango total de la variable, un valor aceptable para este tipo de datos ambientales. El Error Estándar Medio (−0.005) confirma la ausencia de sesgo en la escala estandarizada. Finalmente, la Razón de Desviación Cuadrática Media (MSDR = 0.953), muy cercana a 1, indica que las varianzas de predicción del Kriging están correctamente calibradas y son representativas del error real.
El gráfico de observados vs. predichos muestra una distribución cercana a la línea 1:1, y los residuos estandarizados siguen una distribución aproximadamente normal centrada en cero, sin patrones sistemáticos.
Con el modelo de semivariograma validado, se procede a la interpolación espacial. El Kriging Ordinario genera una superficie continua de predicción para toda el área de estudio, estimando el valor de la variable en cada celda de una grilla regular a partir de la combinación ponderada de los puntos de observación circundantes. Se construyó una grilla regular de 9.797 celdas con una resolución espacial de 1.8 m, cubriendo la totalidad del área de estudio.”
Esta sección presenta los mapas finales del análisis geoestadístico. Los mapas integran los elementos cartográficos esenciales: título, escala, flecha de norte y leyenda.
Superficie de predicción generada mediante Kriging Ordinario.
La varianza de predicción del Kriging cuantifica la incertidumbre asociada a cada valor interpolado. Zonas con mayor densidad de puntos de muestreo presentan menor varianza, mientras que las áreas alejadas de observaciones muestran mayor incertidumbre.
Mapa de incertidumbre de la predicción: desviación estándar del Kriging Ordinario.
Semivariograma experimental con el modelo teórico ajustado seleccionado.
El mapa de predicción espacial generado mediante Kriging Ordinario muestra una distribución continua de la temperatura en el área de la finca, con valores interpolados que oscilan entre 22.2 °C y 29.5 °C, consistentes con el rango observado en los datos originales. Se identifican sectores con temperaturas más elevadas concentrados en zonas específicas de la finca, mientras que otros sectores presentan valores más bajos, lo que sugiere la existencia de microclimas diferenciados dentro del área de estudio.
El mapa de incertidumbre (desviación estándar de la predicción) revela que los errores de estimación son menores en las zonas con mayor densidad de puntos de muestreo, donde el modelo cuenta con más información local para realizar la predicción. Las áreas periféricas o con menor cobertura de muestreo presentan mayor incertidumbre, lo cual es un comportamiento esperado y coherente con la naturaleza del Kriging Ordinario. En términos generales, la incertidumbre se mantiene en niveles aceptables a lo largo del dominio, lo que respalda la confiabilidad de la superficie interpolada.
El análisis geoestadístico de la temperatura registrada en la finca el 1 de octubre de 2020 permitió caracterizar su estructura de variabilidad espacial y generar una superficie continua de predicción mediante Kriging Ordinario.
El análisis exploratorio evidenció una distribución de la temperatura aproximadamente simétrica, con media de 25.83 °C, ausencia de valores atípicos y una desviación leve de la normalidad que no compromete el análisis geoestadístico. El semivariograma experimental confirmó la existencia de autocorrelación espacial significativa, con un nugget cercano a cero, un sill de aproximadamente 3.1 y un alcance de 10 a 15 metros, indicando que la mayor parte de la variabilidad tiene origen espacial estructurado.
De los tres modelos teóricos evaluados, el modelo Exponencial presentó el mejor ajuste (SSE = 1.383), y su validación cruzada confirmó predicciones sin sesgo sistemático (ME = −0.011), con un RMSE de 1.013 °C y una varianza de predicción correctamente calibrada (MSDR = 0.953). Los mapas resultantes muestran una distribución espacial diferenciada de la temperatura dentro de la finca, con zonas de mayor incertidumbre en los bordes del área de estudio, coherentes con la menor densidad de puntos de muestreo en esas zonas.