La idea central es aplicar técnicas de geoestadística para examinar las variables climáticas de la finca de aguacate y entender su distribución y variabilidad en el espacio geográfico. El resultado de este trabajo se documentará utilizando R Markdown , lo que garantiza una presentación reproducible y organizada del análisis, incluyendo la metodología, los resultados y las visualizaciones correspondientes.
# Localizacion de de la finca
# Finca ubicada en el departamento del Cauca, municipio Timbio, corregimiento la chorrera
leaflet() %>% addTiles() %>% addCircleMarkers(lng = geo_datos$Longitude,
lat = geo_datos$Latitude,radius = 0.2,color = "orange")La finca está estratégicamente ubicada en el departamento del Cauca , Colombia, una región conocida por su potencial agrícola. Específicamente, el sitio de estudio se localiza en el corregimiento La Chorrera , cuya cabecera principal es el municipio de Timbío.
El municipio de Timbío se ubica en el centro del departamento del Cauca. Esta ubicación geográfica es clave, ya que las condiciones topográficas y climáticas de esta zona central del departamento influirán directamente en la variabilidad espacial de las variables ambientales que serán examinadas.
## as.geodata: 9011 replicated data locations found.
## Consider using jitterDupCoords() for jittering replicated locations.
## WARNING: there are data at coincident or very closed locations, some of the geoR's functions may not work.
## Use function dup.coords() to locate duplicated coordinates.
## Consider using jitterDupCoords() for jittering replicated locations
La representación espacial de la temperatura en la finca, utilizando las coordenadas geográficas (X, Y) y simbolizando diferentes rangos con triángulos, cruces y cuadros , revela patrones cruciales sobre la naturaleza de los datos.
La gráfica demuestra que la temperatura no exhibe una distribución aleatoria o independiente dentro de la finca. Por el contrario, se observa una clara autocorrelación espacial positiva : los puntos cercanos tienden a tener valores de temperatura similares.
El patrón es característicamente lineal y continuo , lo que sugiere un gradiente espacial bien definido. Este gradiente puede ser atribuible a factores ambientales sistemáticos, como cambios en la elevación, la exposición solar (orientación de la ladera) o la proximidad a cuerpos de agua o cortavientos.
El gráfico superior derecho, que representa la Temperatura en función de la coordenada Y (Latitud) , proporciona una perspectiva valiosa sobre la distribución vertical (Norte-Sur) de la variable.
Interpretación de la Agrupación (Tendencia a la Media) La observación clave es que, a medida que se recorre la latitud (eje Y) de la finca, la temperatura muestra una tendencia de agrupación a un rango de temperatura media en lugar de dispersarse uniformemente o seguir un gradiente lineal estricto en el eje Y.
El gráfico inferior izquierdo, que muestra la Temperatura en función de la coordenada X (Longitud) , es crucial para confirmar la estructura de los datos espaciales y la presencia de autocorrelación.
Observación del Patrón de Agrupación (Eje X) A diferencia del eje Y (latitud), donde la agrupación se limitaba a un rango medio, el análisis en función de la Longitud (eje X) revela un patrón de agrupación mucho más definido y sistemático .
Tendencia espacial: Este patrón más claro en el eje X indica que existe una tendencia direccional donde la temperatura varía de forma más predecible o con una menor dispersión dentro de franjas específicas de longitud. En otras palabras, la Longitud (X) parece estar más estrechamente relacionada con la variabilidad de la temperatura que la Latitud (Y).
Refuerzo de la Dependencia Espacial: El hecho de que la temperatura no se distribuye aleatoriamente y muestre una agrupación tan clara en el eje X refuerza contundentemente la idea de que existe una fuerte dependencia espacial (autocorrelación). Las temperaturas en puntos cercanos a lo largo de este eje son más similares entre sí que las temperaturas en puntos distantes.
El histograma es fundamental para comprender la distribución de frecuencias de la temperatura en toda la finca, independientemente de la ubicación geográfica.
##Interpretación de la Distribución
Rango Central y Homogeneidad: El histograma confirma una distribución relativamente homogénea de la temperatura, con la mayoría de los valores concentrados alrededor de la media . Los valores promedio, que oscilan prominentemente entre 25 °C y 27 °C , establecen el rango térmico más frecuente y representativo de la finca.
Variabilidad Moderada: La forma de la distribución (probablemente unimodal y aproximadamente simétrica) indica que la variabilidad es moderada . Esto significa que, aunque la temperatura cambia espacialmente (como lo muestran los gráficos X vs. Temp y Y vs. Temp), la dispersión total de los valores de temperatura en toda el área de estudio no es extrema.
Este análisis exploratorio de la distribución de frecuencias es clave, ya que una distribución que se acerca a la normalidad es una de las suposiciones que mejor se ajustan a muchos modelos geoestadísticos (aunque el Kriging no lo requiere estrictamente, mejora la estimación).
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000000 0.001595 0.096820 0.063836 0.106668 0.109962
## variog: computing omnidirectional variogram
## variog: co-locatted data found, adding one bin at the origin
## variog.env: generating 99 simulations by permutating data values
## variog.env: computing the empirical variogram for the 99 simulations
## variog.env: computing the envelops
El variograma mide la disimilitud (o variación de la diferencia) entre pares de puntos muestrales como una función de la distancia (\(h\)) que los separan. Formalmente, un valor bajo del variograma (\(\gamma(h)\)) indica una alta similitud (autocorrelación positiva), y un valor alto indica poca similitud o alta variabilidad.
La identificación de autocorrelación espacial positiva a corta distancia significa que, a medida que la distancia (\(h\)) entre los árboles disminuye, la diferencia cuadrática promedio en la temperatura también disminuye (es decir, los puntos se parecen más).
Los modelos teóricos para este caso son funciones matemáticas que cumplen ciertas propiedades de positividad definidas , garantizando que las variaciones de Kriging no sean negativas.
#El Criterio de Ajuste: Valor de Pérdida
El Loss Value (Valor de Pérdida), a menudo calculado a través de la Suma de Cuadrados de Errores Ponderados (WLS/WSS) o el Error Cuadrático Medio (MSE) , es la métrica utilizada para evaluar la bondad de ajuste del modelo teórico al variograma experimental.
Interpretación: Un Loss Value más bajo indica que la curva del modelo teórico (por ejemplo, esférico o exponencial) se ajusta más fielmente a los puntos del variograma experimental.
## variofit: covariance model used is exponential
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "12" "0" "0" "0.5"
## status "est" "est" "est" "fix"
## loss value: 149122326.499976
Loss value: 156.114
model_mco_gaus=variofit(variograma, ini=ini.vals, cov.model="gaussian", wei="npair", min="optim",nugget = 0)## variofit: covariance model used is gaussian
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "12" "0" "0" "0.5"
## status "est" "est" "est" "fix"
## loss value: 258524756.3622
Loss value: 258524
model_mco_spe=variofit(variograma, ini=ini.vals, cov.model="spheric",fix.nug=TRUE, wei="npair", min="optim")## variofit: covariance model used is spherical
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "10.22" "0" "0" "0.5"
## status "est" "est" "fix" "fix"
## loss value: 71333761.0292498
Loss value: 713.337
el proceso de ajuste de los modelos teóricos al variograma experimental ha concluido y el Modelo Exponencial ha arrojado el Loss Value más bajo (es decir, el mejor ajuste a los puntos experimentales), entonces esta es la elección adecuada para representar la estructura espacial de la temperatura.
# Graficar el variograma empírico
plot(variograma, main = "Ajuste de Modelos Teóricos de Variograma",
xlab = "Distancia", ylab = "Semivarianza")
# Añadir los tres modelos teóricos ajustados
lines(model_mco_exp, col = "yellow")
lines(model_mco_gaus, col = "blue")
lines(model_mco_spe, col = "red")
# Añadir la leyenda
legend("bottomright", # Posición de la leyenda (puede ser "topleft", "topright", etc.)
legend = c("Exponencial", "Gaussiano", "Esférico"), # Nombres que aparecerán
col = c("yellow", "blue", "red"), # Colores correspondientes
lty = 1, # Tipo de línea (1 = continua)
bty = "n", # Sin recuadro ("box type = none")
cex = 0.8) El Kriging es una familia de técnicas de interpolación geoestadística que se basa en el modelo de variograma ajustado para proporcionar la Mejor predicción Lineal Insensgada (BLUE) de una variable en ubicaciones no muestreadas.
el Kriging Universal es el método más apropiado para generar un mapa de temperatura que sea preciso, ya que incorpora y modela explícitamente la tendencia espacial que existe en la finca.
geodatos_grid=expand.grid( lon=seq(-76.71022,-76.7118,l=100),lat=seq(2.393634 ,2.392101 ,l=100))
plot(geodatos_grid)
points(geo_datos[,3:2],col="green")La referencia a la gráfica del grid es esencial, ya que visualiza el área de estudio completa y define el objetivo final del análisis geoestadístico: la interpolación a nivel de píxel.
##Grafica prediccion
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:raster':
##
## intersect, select, union
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(geoR)
# 1. Convertir geodata a data frame
df_geo_temp <- data.frame(
x = geo_temp$coords[,1],
y = geo_temp$coords[,2],
temp = geo_temp$data
)
# 2. Eliminar o promediar puntos duplicados (solución al error de singularidad)
df_geo_temp_clean <- df_geo_temp %>%
group_by(x, y) %>%
summarise(temp = mean(temp), .groups = "drop")
# 3. Volver a convertir a geodata
geo_temp_clean <- as.geodata(df_geo_temp_clean,
coords.col = c("x", "y"),
data.col = "temp")
# 4. Ejecutar Kriging sin errores
geodatos_ko <- krige.conv(
geo_temp_clean,
loc = geodatos_grid,
krige = krige.control(
nugget = 0,
trend.d = "cte",
trend.l = "cte",
cov.pars = c(sigmasq = 12.7080, phi = 0.0007)
)
)## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
# 5. Gráficos
image(geodatos_ko, main="Kriging Predict", xlab="East", ylab="North")
contour(geodatos_ko, main="Kriging Predict", add=TRUE, drawlabels=TRUE)El mapa generado a través de la predicción por Kriging Universal confirma de manera concluyente la hipótesis planteada en la fase exploratoria:
No Aleatoriedad: La distribución de la temperatura dentro de la finca no es aleatoria . Por el contrario, la superficie predicha muestra un patrón de variación organizado y continuo.
Patrón Definido: Esta estructura definida valida el uso de métodos geoestadísticos y demuestra que las temperaturas en la finca están regidas por una autocorrelación espacial significativa, la cual fue modelada con éxito por el modelo exponencial ajustado al variograma
image(geodatos_ko, main="Desviacion estandar predicha",val=sqrt(geodatos_ko$krige.var), xlab="East", ylab="North")
contour(geodatos_ko,main="Desviacion estandar predicha",val=sqrt(geodatos_ko$krige.var), add=TRUE, drawlabels=TRUE)La visualización de la Desviación Estándar de Kriging (\(\sigma_k\)) (raíz cuadrada de la Varianza de Kriging) es una métrica fundamental que acompaña el mapa de predicción, ya que cuantifica la incertidumbre de la estimación en cada punto del grid .
El patrón observado en el mapa es una manifestación directa de la geometría del muestreo y el Alcance del variograma :
Mayor Desviación Estándar (Zonas de Color Intenso): Estas áreas representan la mayor incertidumbre en el modelo. Esto se debe a que la predicción se basa en puntos de muestreo que están más allá del Alcance efectivo del variograma o que son escasos. Por lo tanto, el modelo debe extrapolar o inferir con menor soporte de la autocorrelación espacial, lo que se traduce en una varianza más alta y una menor confianza.
Menor Desviación Estándar (Zonas de Color Suave): Estas zonas son las más confiables . Se corresponde con la proximidad a los puntos de muestreo originales , donde la fuerte autocorrelación espacial a corta distancia permite que el Kriging asigne pesos muy altos a los vecinos inmediatos, minimizando la varianza de la predicción.
pred=cbind(geodatos_grid,geodatos_ko$predict)
temp_predict=rasterFromXYZ(cbind(geodatos_grid,geodatos_ko$predict))
levelplot(temp_predict,par.settings =BuRdTheme)La sección de Interpolación presenta el resultado final y visual del análisis geoestadístico: el Mapa de predicción de Temperatura , generado mediante Kriging Universal sobre el grid de la finca de aguacate
Este mapa de interpolación es el producto más valioso para la< toma de decisiones:
Permite a los administradores de la finca realizar una micromzonificación precisa de la temperatura.
Con base en las exigencias térmicas de la variedad de aguacate, se pueden identificar las zonas óptimas para la siembra y las zonas críticas que pueden requerir medidas de manejo térmico (riego, sombra o protección contra heladas).