Tratamiento de Datos Espaciales
2502386 — Andrés Julián Escobar Cardona
2502875 — Maria
Camila Pomeo García
Este taller aborda la evaluación comparativa de métodos de interpolación geoestadística aplicados a las variables mo, zn y cu del conjunto simulated_spatial_data.gpkg. Para cada variable se analizan las estructuras de dependencia espacial mediante semivariogramas experimentales y direccionales, con el fin de determinar si los procesos presentan comportamiento isotrópico o anisotrópico. Con base en esta caracterización, se ajustan y comparan modelos de kriging ordinario, kriging simple, kriging universal y, cuando resulte pertinente, co-kriging.
La selección del modelo más adecuado se fundamenta en métricas de validación cruzada (incluyendo ME, RMSE, MSD, MAE y R²) y en la coherencia entre la estructura espacial estimada y el modelo teórico ajustado. En el caso específico de cu, se evalúa además la correlación espacial conjunta con otras variables para identificar una potencial covariable en co-kriging, priorizando aquella que presente mayor autocorrelación cruzada y una estructura variográfica compatible. Este enfoque permite determinar el método de predicción espacial más robusto y consistente para cada variable analizada.
## mo
## Min. :10.00
## 1st Qu.:14.75
## Median :19.50
## Mean :19.50
## 3rd Qu.:24.25
## Max. :29.00
## zn
## Min. :5409
## 1st Qu.:5418
## Median :5425
## Mean :5425
## 3rd Qu.:5433
## Max. :5441
## cu
## Min. :1091
## 1st Qu.:1096
## Median :1101
## Mean :1101
## 3rd Qu.:1106
## Max. :1111
La materia orgánica (mo) varía entre 10 y 29 unidades, con una distribución centrada alrededor de 19.5, lo que sugiere valores relativamente homogéneos y ausencia de valores extremos. El zinc (zn) muestra un intervalo estrecho entre 5409 y 5441, con media y mediana coincidentes (5425), indicando una dispersión baja y un comportamiento casi simétrico. Por su parte, el cobre (cu) oscila entre 1091 y 1111, con valores centrales coincidentes (1101), reflejando también una distribución estable y sin sesgos evidentes.
## ph mo zn cu k pb fe
## ph 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## mo 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## zn 0.9981133 0.9981133 1.0000000 0.9991130 0.9989616 0.9981133 0.9981133
## cu 0.9998135 0.9998135 0.9991130 1.0000000 0.9999940 0.9998135 0.9998135
## k 0.9998742 0.9998742 0.9989616 0.9999940 1.0000000 0.9998742 0.9998742
## pb 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## fe 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## mn 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## cea 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## ca 1.0000000 1.0000000 0.9981133 0.9998135 0.9998742 1.0000000 1.0000000
## mn cea ca
## ph 1.0000000 1.0000000 1.0000000
## mo 1.0000000 1.0000000 1.0000000
## zn 0.9981133 0.9981133 0.9981133
## cu 0.9998135 0.9998135 0.9998135
## k 0.9998742 0.9998742 0.9998742
## pb 1.0000000 1.0000000 1.0000000
## fe 1.0000000 1.0000000 1.0000000
## mn 1.0000000 1.0000000 1.0000000
## cea 1.0000000 1.0000000 1.0000000
## ca 1.0000000 1.0000000 1.0000000
## ph -> Mejor variable secundaria: mo (r = 1, sill cruzado = 15.4)
## mo -> Mejor variable secundaria: ph (r = 1, sill cruzado = 15.4)
## zn -> Mejor variable secundaria: cu (r = 0.999, sill cruzado = 30.486)
## cu -> Mejor variable secundaria: k (r = 1, sill cruzado = 21.664)
## k -> Mejor variable secundaria: cu (r = 1, sill cruzado = 21.664)
## pb -> Mejor variable secundaria: ph (r = 1, sill cruzado = 154)
## fe -> Mejor variable secundaria: ph (r = 1, sill cruzado = 77)
## mn -> Mejor variable secundaria: ph (r = 1, sill cruzado = 30.8)
## cea -> Mejor variable secundaria: ph (r = 1, sill cruzado = 1.54)
## ca -> Mejor variable secundaria: ph (r = 1, sill cruzado = 154)
La elección de variables secundarias se basó en maximizar la correlación y minimizar el sill cruzado. Para Zn, la mejor opción fue Cu, con una correlación muy alta (r ≈ 0.999) y un sill cruzado de 30.486. En el caso de Mo, la variable secundaria óptima fue pH, dada su correlación perfecta (r = 1) y un sill cruzado bajo (15.4). Finalmente, para Cu, la mejor alternativa resultó ser K, también con correlación casi perfecta (r = 1) y un sill cruzado de 21.664. Estas combinaciones aseguran la mayor coherencia espacial entre las variables primarias y secundarias seleccionadas.
## [using ordinary kriging]
## [using simple kriging]
## [using universal kriging]
## [using ordinary kriging]
## [using ordinary kriging]
## [using simple kriging]
## [using universal kriging]
## [using ordinary kriging]
## [using ordinary kriging]
## [using simple kriging]
## [using universal kriging]
## [using ordinary kriging]
| Variable | Modelo | Exp | ME | RMSE | MSD | MAE | R2 |
|---|---|---|---|---|---|---|---|
| MO | Kriging Ordinario (OK) | Exp | 0.0553 | 2.5659 | 0.8621 | 1.7726 | 0.8020 |
| MO | Kriging Simple (SK) | Exp | 0.0567 | 2.5521 | 0.8587 | 1.7613 | 0.8041 |
| MO | Kriging Universal (UK) | Exp | 0.2230 | 2.4100 | 0.7229 | 1.6331 | 0.8253 |
| MO | OK Anisotrópico | Exp | 0.1581 | 2.5864 | 1.0419 | 1.7433 | 0.7988 |
| MO | Co-Kriging (ph) | Exp | -0.0001 | 0.1277 | 0.0288 | 0.0926 | 0.9995 |
| ZN | Kriging Ordinario (OK) | Exp | 0.1350 | 3.8157 | 0.8135 | 2.6668 | 0.8301 |
| ZN | Kriging Simple (SK) | Exp | 0.1439 | 3.8068 | 0.8131 | 2.6590 | 0.8309 |
| ZN | Kriging Universal (UK) | Exp | 0.3389 | 3.6159 | 0.7008 | 2.4283 | 0.8474 |
| ZN | OK Anisotrópico | Exp | 0.2926 | 3.8578 | 0.9910 | 2.6359 | 0.8263 |
| ZN | Co-Kriging (cu) | Exp | -0.0004 | 0.4123 | 0.3354 | 0.3658 | 0.9980 |
| CU | Kriging Ordinario (OK) | Exp | 0.0656 | 2.5592 | 0.8476 | 1.7751 | 0.8109 |
| CU | Kriging Simple (SK) | Exp | 0.0689 | 2.5478 | 0.8452 | 1.7657 | 0.8126 |
| CU | Kriging Universal (UK) | Exp | 0.2241 | 2.4103 | 0.7162 | 1.6286 | 0.8323 |
| CU | OK Anisotrópico | Exp | 0.1692 | 2.5811 | 1.0268 | 1.7485 | 0.8076 |
| CU | Co-Kriging (k) | Exp | 0.0001 | 0.0759 | 0.0112 | 0.0541 | 0.9998 |
El análisis de la materia orgánica muestra que el Co-Kriging con pH como variable secundaria es el modelo superior. Los valores de RMSE (0.1277) y R² (0.9995) indican una predicción casi perfecta, mientras que el ME (-0.0001) prácticamente nulo confirma ausencia de sesgo sistemático. La métrica MSD (0.0288) y el MAE (0.0926) reflejan errores extremadamente homogéneos y dispersión mínima, lo que sugiere que la correlación espacial entre MO y pH captura de manera eficaz la variabilidad multiescalar.
Los modelos univariados isotrópicos (OK, SK, UK) presentan RMSE de 2.41–2.57 y R² entre 0.80–0.83, lo que evidencia que la variabilidad espacial de MO no se puede explicar completamente sin la información de la covariable. El OK Anisotrópico, a pesar de considerar una relación direccional en el semivariograma, solo mejora marginalmente algunas métricas (MSD y MAE) frente al OK estándar, indicando que la anisotropía en este caso es débil o irrelevante. Esto sugiere que la estructura espacial de MO es relativamente isotrópica y que la incorporación de covariables es más determinante que la modelación direccional.
Para Zinc, el Co-Kriging con Cobre (CU) como variable secundaria supera ampliamente a los modelos univariados. La combinación logra un RMSE de 0.4123 y un R² de 0.9980, mostrando que las relaciones espaciales entre Zn y Cu son fuertemente lineales y estables en el espacio, capturando la variabilidad local que los modelos univariados no logran. El ME (-0.0004) indica ausencia de sesgo, mientras que la MSD (0.3354) confirma que las desviaciones estandarizadas de la predicción están correctamente calibradas.
Los modelos isotrópicos OK, SK y UK tienen RMSE entre 3.61 y 3.86, y R² de 0.83–0.85, lo que evidencia una predicción más dispersa. El OK Anisotrópico muestra solo mejoras menores, lo que sugiere que aunque existe anisotropía direccional en la estructura espacial de Zinc, su efecto es insuficiente frente a la inclusión de una covariable relevante. Esto refleja un comportamiento típico en variables químicas fuertemente correlacionadas, donde la modelación multivariada supera ampliamente a la univariada.
Para Cobre, el Co-Kriging con Potasio (K) como variable secundaria proporciona la mayor exactitud. RMSE de 0.0759, R² 0.9998 y ME 0.0001 muestran predicciones prácticamente perfectas y ausencia de sesgo. La MSD (0.0112) indica que los errores estandarizados están muy cercanos al valor esperado (1), y el MAE (0.0541) confirma baja dispersión absoluta de los residuos.
Los modelos isotrópicos univariados (OK, SK, UK) presentan RMSE de 2.41–2.56 y R² de 0.81–0.83, reflejando limitaciones en capturar la estructura espacial compleja de CU. El modelo OK Anisotrópico logra mejoras parciales en la MSD, pero no en RMSE o R², lo que indica que la anisotropía solo ajusta parcialmente la orientación espacial del semivariograma, mientras que la inclusión de la covariable es crítica para precisión. Esto demuestra que CU tiene un patrón espacial multivariado fuerte, donde la dependencia con K es más significativa que la anisotropía.
En todos los casos, el Co-Kriging se impone como el modelo más robusto, ya que combina la información de la variable objetivo con la covariable más correlacionada, capturando la estructura espacial multiescalar y reduciendo significativamente error y sesgo. Los modelos isotrópicos univariados funcionan adecuadamente para tendencias generales, pero su R² menor y RMSE más alto evidencian incapacidad para modelar la heterogeneidad local. La anisotropía, aunque técnicamente relevante para ajustar semivariogramas direccionales, solo aporta mejoras marginales en MSD y MAE y no reemplaza la ventaja de incorporar covariables, mostrando que en este conjunto de datos, la dependencia multivariada es más crítica que la orientación espacial de la variabilidad.