El primer paso consiste en crear una variable regionalizada. En el gráfico generado, se pueden identificar las temperaturas más bajas de la zona representadas en azul, mientras que las temperaturas más altas se muestran en rojo. Los tonos amarillo y verde corresponden a las temperaturas intermedias, las cuales predominan en mayor proporción en la zona.
Realizamos un análisis para determinar si existe una tendencia o si los
datos son estacionarios. Para esto, construimos el semivariograma, el
cual nos permite evaluar si existe una correlación espacial
significativa. Al observar el comportamiento del semivariograma en
relación a la variable temperatura, podemos inferir que podría haber una
correlación significativa, ya que los puntos se encuentran fuera de la
banda establecida. Sin embargo, esta correlación no parece ser muy
fuerte, ya que en algún punto la línea tiende a estabilizarse dentro de
las bandas.
## variog: computing omnidirectional variogram
## variog.env: generating 99 simulations by permutating data values
## variog.env: computing the empirical variogram for the 99 simulations
## variog.env: computing the envelops
Los puntos negros representan el variograma observado. Las bandas en el gráfico nos ayudan a determinar si el semivariograma tiene correlación o no. Si los puntos del semivariograma se encuentran dentro de las bandas, esto indica que no hay correlación espacial significativa. En cambio, si los puntos están fuera de las bandas, podríamos inferir que existe una correlación espacial entre los datos.No obstante, se lleva a cabo un análisis para determinar qué modelo podría ajustarse al comportamiento observado en la variable anteriormente mencionada.
Se realizó el ajuste de los modelos exponencial, gaussiano y esférico con el fin de determinar cuál de ellos se ajusta mejor. El resultado se muestra en la siguiente gráfica obtenida:
## variofit: covariance model used is exponential
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "3.33" "0" "0" "0.5"
## status "est" "est" "est" "fix"
## loss value: 4528.97278196411
## variofit: covariance model used is gaussian
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "3.11" "0" "0" "0.5"
## status "est" "est" "est" "fix"
## loss value: 7968.69126797459
## variofit: covariance model used is spherical
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "3.11" "0" "0" "0.5"
## status "est" "est" "fix" "fix"
## loss value: 7478.80863719403
Según la representación gráfica, parece que el modelo que mejor se ajusta al semivariograma observado es el modelo exponencial. No obstante, para confirmar esta suposición, se comparó el Error Cuadrático Medio (MSE) de cada uno de los modelos, obteniendo los siguientes resultados:
## [1] "MSE modelo Exponencial = 4118.52750895414"
## [1] "MSE modelo Gausiano = 7821.59366681799"
## [1] "MSE modelo Esferico = 7478.05412990454"
Este análisis nos permite concluir que, efectivamente, el modelo exponencial es el que mejor describe el comportamiento del semivariograma observado. Esto se respalda con un valor de Error Cuadrático Medio (MSE) de 4,118 , que es el más bajo en comparación con los otros modelos evaluados.
## variofit: model parameters estimated by WLS (weighted least squares):
## covariance model is: exponential
## parameter estimates:
## tausq sigmasq phi
## 0.0283 3.1732 0.0001
## Practical Range with cor=0.05 for asymptotic range: 0.0004056548
##
## variofit: minimised weighted sum of squares = 4118.528
## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
## Loading required package: sp
## Loading required package: lattice
Conclusión: Las áreas resaltadas en color rojo representan las zonas donde se observan las temperaturas más altas durante el análisis exploratorio.