Actividad 3. Predicción de temperatura
Introducción
El siguiente análisis se realiza sobre la información geográfica de diferentes arboles ubicados en una finca cercana a Popayán, en este caso diferentes sensores de medida ubicado en cada uno de los Arboles de aguacate contabilizan diferentes métricas como Temperatura, humedad Relativa, Altura, entre otros. En este documento se realizará una interpolación de los datos con el fin de encontrar la temperatura en cada uno de los puntos cercanos a los sitios de medición.
Análisis Exploratorio
Inicialmente se traera la información como dataframe, para despues ser filtrada para un dia en particular, en este caso el 10 de enero de 2020. una vez realizado esto se obtuvieron 534 datos y 22 variables, en este caso las variables de interes son las 2, 3 y 9 la cual representan las coordenadas y la temperatura. En el seiguiente mapa se puede apreciar la ubicación de los puntos de medición.
# Convertir la columna FORMATTED_DATE_TIME a Date
Data_Aguacate <- Data_Aguacate %>%
mutate(Fecha = as.Date(sub(" .*", "", FORMATTED_DATE_TIME), format = "%d/%m/%Y"))
# Filtrar las filas donde la fecha es igual a "2020-10-01"
Data_Aguacate <- Data_Aguacate %>%
filter(Fecha == as.Date("2020-10-01"))## Loading required package: leaflet
Análisis geoestadístico
Despues de obtener la data se realiza un análisis regional, en este caso se puede ver que las temperaturas se distribuyen de manera particular, al oste se aprecian temperaturas más altas, en la sección sur oriental se aprecian algunas franjas en que las temperaturas son muy bajas en color azul y rojas que indican un color más alto. También se aprecia que la mayoria de los datos se posicionan alrededor de los 26 C°.
Posteriormente se realizó un análisis de distancia entre los diferentes puntos encontrando un rango entre 0.0000171 y 0.001959, en este caso para realizar el variograma se tendra en cuenta un rango ubicado entre 0.0017 y 0.000099 con esto conseguimos estar en valores mayores a 0 y menores al tercer cuartil.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.712e-05 4.051e-04 6.408e-04 6.827e-04 9.178e-04 1.959e-03
## variog: computing omnidirectional variogram
## variog.env: generating 99 simulations by permutating data values
## variog.env: computing the empirical variogram for the 99 simulations
## variog.env: computing the envelops
Una vez realizado el variograma donde se ejemplifica la distancia entre los diferentes puntos y la semivarianza, es decir, como se comporta la varianza de la temperatural al variar las distancias entre los puntos. En este caso, se puede apreciar que las lineas representan dos tipos de variaciones que indican que no hay colinealidad, en este caso se puede apreciar que la grafica no se comporta de esta manera, por lo tanto se puede indentificar que la variable a analizar es no lineal.
Ene ste punto daremos valores iniciales donde puede estar ell “Still” o vallor donde se estabiliza la varianza, adicionalmente se evaluaran diferentes modelos para poder encontrar el que mas se puede acercar a la forma de la gráfica de variograma, y de esta manera poder realizar la interpolación más acertada.
Modelo Exponencial
Data_Aguacate_Exp =variofit(Variograma_Data_Aguacate, ini=ini.vals, cov.model="exponential", wei="npair", min="optim")## variofit: covariance model used is exponential
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "3" "0" "0" "0.5"
## status "est" "est" "est" "fix"
## loss value: 180131.38727273
## variofit: model parameters estimated by WLS (weighted least squares):
## covariance model is: exponential
## parameter estimates:
## tausq sigmasq phi
## 0.3570 3.0268 0.0002
## Practical Range with cor=0.05 for asymptotic range: 0.0004678063
##
## variofit: minimised weighted sum of squares = 6365.418
Modelo Gaussiano
Data_Aguacate_Gaus = variofit(Variograma_Data_Aguacate, ini=ini.vals, cov.model="gaussian", wei="npair", min="optim",nugget = 0)## variofit: covariance model used is gaussian
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "3" "0" "0" "0.5"
## status "est" "est" "est" "fix"
## loss value: 195607.032521682
## variofit: model parameters estimated by WLS (weighted least squares):
## covariance model is: gaussian
## parameter estimates:
## tausq sigmasq phi
## 1.2634 1.8802 0.0000
## Practical Range with cor=0.05 for asymptotic range: 0.0001159668
##
## variofit: minimised weighted sum of squares = 23559.08
Modelo Esférico
Data_Aguacate_sph = variofit(Variograma_Data_Aguacate, ini=ini.vals, cov.model="spheric", fix.nug=TRUE, wei="npair", min="optim")## variofit: covariance model used is spherical
## variofit: weights used: npairs
## variofit: minimisation function used: optim
## variofit: searching for best initial value ... selected values:
## sigmasq phi tausq kappa
## initial.value "3" "0" "0" "0.5"
## status "est" "est" "fix" "fix"
## loss value: 35258.0124811502
## variofit: model parameters estimated by WLS (weighted least squares):
## covariance model is: spherical
## fixed value for tausq = 0
## parameter estimates:
## sigmasq phi
## 3.2257 0.0003
## Practical Range with cor=0.05 for asymptotic range: 0.0002770914
##
## variofit: minimised weighted sum of squares = 13846.3
Al realizar las diferentes interpolaciones, se puede apreciar que el modelo con menor valor de minimo de suma de los cuadrados es el de la exponencial, con 6,365 lo que se ratifica en la siguiente gráfica en la linea azúl, esto seguido por el modelo esférico (Verde) con 13,846 y finalmente el Gaussiano (rojo) que es más alejado con respecto a los otros con 23,559.
Union de todas las graficas
Análisis Predictivo (Kriging)
Teniendo en cuenta lo anterior, y con el uso del modelo exponencial, inicialmente buscaremos los limites de la zona a estudiar, tanto en longitud como en latitud, encontrando los siguientes valores:
## [1] -76.711799 -76.710215 2.392101 2.393634
Con esta informacuón se contrulle la grilla donde se realizarán las respectivas predicciones usando interpolación exponencial, en este caso se harán 50 puntos verticales y 50 horizontales, como se aprecia en la siguiente imagen.
Data_Aguacate_Grid = expand.grid( lon=seq(-76.710215,-76.711799,l=50),lat=seq(2.392101 ,2.393634 ,l=50))
plot(Data_Aguacate_Grid)
points(Data_Aguacate_GR$coords,col="blue")Usando los datos de Sigma de exponencial que es 3.0268 y 0.0003 de phi, se obtiene la predicción de kriging.Obteniendo los siguientes resultados:
Data_Aguacate_KG = krige.conv(Data_Aguacate_GR, loc=Data_Aguacate_Grid,
krige= krige.control(nugget=0,trend.d="cte",
trend.l="cte",cov.pars=c(sigmasq=3.0268, phi=0.0003 )))## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
Conclusiones
- Se concluye que el proceso de variogramas es util para percibir y predecir las variaciones de los diferentes lugares basados en la distancia respecto a los puntos de medición reales, en datos que cambian espacialmente.
- Dentro del rango evaluado, exite una diagonal en la sección sur oriental que contiene los rangos más frios cercanos a los 23°C.
- El lugar más calinet se ubica al lado de la sección mpas fria, mas hacia el sur, e igualmente en la sección de la esquina sur occidental. *Basado en investigaciones externas se denota que la temperatura predilecta para plantar aguacate es entre 20 y 25 °C, por lo tanto se esperaria dentro de la plantación tener una mejor cosecha en las regiones centrales y del sur de la plantación, es decir las secciones blancas y azules, adicionalmente, sis e requiere encontrar otrta zona para sembrar cercana a evaluada,, la región noroccidental es apropiada.