#preparando librerias
library(spdep)
## Loading required package: sp
## Loading required package: spData
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
## Loading required package: sf
## Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
library(ape)
## Registered S3 method overwritten by 'ape':
## method from
## plot.mst spdep
library(sp)
library(MVA)
## Loading required package: HSAUR2
## Loading required package: tools
library(Hmisc)
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
## Loading required package: ggplot2
##
## Attaching package: 'Hmisc'
## The following object is masked from 'package:ape':
##
## zoom
## The following objects are masked from 'package:base':
##
## format.pval, units
library(normtest)
library(nortest)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:Hmisc':
##
## src, summarize
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(spatialreg)
## Loading required package: Matrix
## Registered S3 methods overwritten by 'spatialreg':
## method from
## residuals.stsls spdep
## deviance.stsls spdep
## coef.stsls spdep
## print.stsls spdep
## summary.stsls spdep
## print.summary.stsls spdep
## residuals.gmsar spdep
## deviance.gmsar spdep
## coef.gmsar spdep
## fitted.gmsar spdep
## print.gmsar spdep
## summary.gmsar spdep
## print.summary.gmsar spdep
## print.lagmess spdep
## summary.lagmess spdep
## print.summary.lagmess spdep
## residuals.lagmess spdep
## deviance.lagmess spdep
## coef.lagmess spdep
## fitted.lagmess spdep
## logLik.lagmess spdep
## fitted.SFResult spdep
## print.SFResult spdep
## fitted.ME_res spdep
## print.ME_res spdep
## print.lagImpact spdep
## plot.lagImpact spdep
## summary.lagImpact spdep
## HPDinterval.lagImpact spdep
## print.summary.lagImpact spdep
## print.sarlm spdep
## summary.sarlm spdep
## residuals.sarlm spdep
## deviance.sarlm spdep
## coef.sarlm spdep
## vcov.sarlm spdep
## fitted.sarlm spdep
## logLik.sarlm spdep
## anova.sarlm spdep
## predict.sarlm spdep
## print.summary.sarlm spdep
## print.sarlm.pred spdep
## as.data.frame.sarlm.pred spdep
## residuals.spautolm spdep
## deviance.spautolm spdep
## coef.spautolm spdep
## fitted.spautolm spdep
## print.spautolm spdep
## summary.spautolm spdep
## logLik.spautolm spdep
## print.summary.spautolm spdep
## print.WXImpact spdep
## summary.WXImpact spdep
## print.summary.WXImpact spdep
## predict.SLX spdep
##
## Attaching package: 'spatialreg'
## The following objects are masked from 'package:spdep':
##
## anova.sarlm, as.spam.listw, as_dgRMatrix_listw, as_dsCMatrix_I,
## as_dsCMatrix_IrW, as_dsTMatrix_listw, bptest.sarlm, can.be.simmed,
## cheb_setup, coef.gmsar, coef.sarlm, coef.spautolm, coef.stsls,
## create_WX, deviance.gmsar, deviance.sarlm, deviance.spautolm,
## deviance.stsls, do_ldet, eigen_pre_setup, eigen_setup, eigenw,
## errorsarlm, fitted.gmsar, fitted.ME_res, fitted.sarlm,
## fitted.SFResult, fitted.spautolm, get.ClusterOption,
## get.coresOption, get.mcOption, get.VerboseOption,
## get.ZeroPolicyOption, GMargminImage, GMerrorsar, griffith_sone,
## gstsls, Hausman.test, HPDinterval.lagImpact, impacts, intImpacts,
## Jacobian_W, jacobianSetup, l_max, lagmess, lagsarlm, lextrB,
## lextrS, lextrW, lmSLX, logLik.sarlm, logLik.spautolm, LR.sarlm,
## LR1.sarlm, LR1.spautolm, LU_prepermutate_setup, LU_setup,
## Matrix_J_setup, Matrix_setup, mcdet_setup, MCMCsamp, ME, mom_calc,
## mom_calc_int2, moments_setup, powerWeights, predict.sarlm,
## predict.SLX, print.gmsar, print.ME_res, print.sarlm,
## print.sarlm.pred, print.SFResult, print.spautolm, print.stsls,
## print.summary.gmsar, print.summary.sarlm, print.summary.spautolm,
## print.summary.stsls, residuals.gmsar, residuals.sarlm,
## residuals.spautolm, residuals.stsls, sacsarlm, SE_classic_setup,
## SE_interp_setup, SE_whichMin_setup, set.ClusterOption,
## set.coresOption, set.mcOption, set.VerboseOption,
## set.ZeroPolicyOption, similar.listw, spam_setup, spam_update_setup,
## SpatialFiltering, spautolm, spBreg_err, spBreg_lag, spBreg_sac,
## stsls, subgraph_eigenw, summary.gmsar, summary.sarlm,
## summary.spautolm, summary.stsls, trW, vcov.sarlm, Wald1.sarlm
library(readxl)
df= read_excel("C:/Users/Valentina Osorio/Documents/U.N/Computacion Estadistica/BD_MODELADO.xlsx")
Visualizacion de datos
View(df)
Mapeo de conductividad electrica aparente a 150 cm
library(ggplot2)
df %>% ggplot(aes(x = Avg_X_MCB, y=Avg_Y_MCE, colour=Avg_CEa_15))+
geom_point(size = 5,shape=15)+
scale_color_continuous(type = 'viridis')
Se observa dependencia espacial de la conductividad electrica a una profundidad de 150 cm debido a que existen regiones de un mismo color
Matriz de pesos
library(ape)
# Matriz de distancias
df.dists <- as.matrix(dist(cbind(df$Avg_X_MCB, df$Avg_Y_MCE)))
# Inversa de las matriz
df.dists.inv <- 1/df.dists
# Asignar ceros a la diagonal
diag(df.dists.inv) <- 0
df.dists.inv <- round(df.dists.inv,3)
#Matriz de pesos estandarizada
We<-df.dists.inv/rowSums(df.dists.inv)
View(We)
Indice de Moran
# Indice de Moran para CE a 150 cm
IM=Moran.I(df$Avg_CEa_15,df.dists.inv)
IM$p.value
## [1] 0
Regresión lineal no espacial
mod1=lm(df$Avg_CEa_15~df$NDVI)
summary(mod1)
##
## Call:
## lm(formula = df$Avg_CEa_15 ~ df$NDVI)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.71991 -0.45614 -0.02841 0.38067 2.87345
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 22.227 1.179 18.85 < 2e-16 ***
## df$NDVI -4.461 1.412 -3.16 0.00173 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7268 on 311 degrees of freedom
## Multiple R-squared: 0.0311, Adjusted R-squared: 0.02799
## F-statistic: 9.984 on 1 and 311 DF, p-value: 0.001735
#Extrayendo los residuales
df$residuales = mod1$residuals
# Mapeo de los residuales del modelo
df %>% ggplot(aes(x = Avg_X_MCB, y=Avg_Y_MCE, colour=residuales))+
geom_point(size = 5,shape=15)+
scale_color_continuous(type = 'viridis')
En los modelos de regresion clasicos se requiere que que los residuales sean independientes pero en este caso como los residuales presentan dependencia espacial ajustar un modelo como estos no es conveniente
Analisis exploratorio
Separacion de la informacion georeferenciada de la informacion de las variables explicativas
df_xy=df[,c(1,2)] #Coordenadas
X= df[,-c(1,2)] #Variables explicativas
Indice de Moran para todas las variables en X
p.values=c()
Moran_observado =c()
for(i in 1:ncol(X)){
p.values[i]=Moran.I(unlist(df[,i]),We)$p.value
Moran_observado[i]=Moran.I(unlist(df[,i]),We)$observed
}
colnames(X)
## [1] "Avg_CEa_07" "Avg_CEa_15" "NDVI" "DEM" "SLOPE"
## [6] "Avg_z" "residuales"
p.values
## [1] 0 0 0 0 0 0 0
Moran_observado
## [1] 0.45160403 0.42704518 0.26648613 0.15986601 0.09699894 0.30877314 0.06945855
Los p-valores < 0,05 indican que todas las variables explicativas parecen tener dependencia espacial, sin embargo, al evidenciar los valores del indice de Moran se puede afirmar que la mayor dependencia espacial parece estar en la CE a 75 cm. Todo lo anterior indica que se debe realizar un modelado espacial.
library(corrplot)
## corrplot 0.89 loaded
mcp=rcorr(as.matrix(X),type="pearson")
mcs=rcorr(as.matrix(X),type="spearman")
mcorp=mcp$r
mcors=mcs$r
par(mfrow=c(1,2))
corrplot(mcorp, order="hclust", tl.col="black", tl.srt=45,main="Pearson")
corrplot(mcors, order="hclust", tl.col="black", tl.srt=45,main="Spearman")
El analisis exploratorio de correlaciones permite intuir que variables se pueden usar en el modelo para explicar la dependencia espacial. En esta caso se evidencia que las variables con alta correlacion positiva son el DEM con la altura (z), Z con la CE a 75 cm mientras que hay una alta correlacion negativa de Z y DEM con la CE a 150 cm.
Comportamiento de las variables
for(i in 1:ncol(X)){
boxplot(X[,i],main=colnames(X)[i])
}
En la CE a 150 cm, el NDVI y la pendiente se evidencian algunos datos atipicos
Prueba de normalidad para las variables
pruebas_normales=c()
for(i in 1:ncol(X)){
pruebas_normales[i]=shapiro.test(unlist(X[,i]))$p.value
}
pruebas_normales
## [1] 9.826780e-02 9.282551e-05 1.257288e-13 1.311242e-07 5.362136e-09
## [6] 2.194832e-04 4.556127e-04
Se evidencia que la CE a 75 cm es la unica variable que cumple con los supuestos de normalidad, por tanto esta es la mas facil de modelar
Matriz de pesos para modelado espacial
contnb=dnearneigh(coordinates(df_xy),0,380000,longlat = F)
contnb
## Neighbour list object:
## Number of regions: 313
## Number of nonzero links: 97656
## Percentage nonzero weights: 99.68051
## Average number of links: 312
class(contnb)
## [1] "nb"
#Matriz de distancias
df_xy=as.matrix(df_xy)
dlist <- nbdists(contnb, df_xy)
#Inversa de la matriz
dlist <- lapply(dlist, function(x) 1/x)
#Matriz de pesos estandarizada
Wve=nb2listw(contnb,glist=dlist,style = "W")
Modelos de regresion espacial
Modelo autoregresivo puro (SAR)
\[Y=\lambda W Y + \alpha 1_n +\epsilon\]
SAR= spautolm(Avg_CEa_15~1, data= X, listw= Wve, family="SAR")
summary(SAR)
##
## Call: spautolm(formula = Avg_CEa_15 ~ 1, data = X, listw = Wve, family = "SAR")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.453255 -0.397645 -0.042934 0.322283 2.953512
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 19.3151 1.5515 12.45 < 2.2e-16
##
## Lambda: 0.97691 LR test value: 86.774 p-value: < 2.22e-16
## Numerical Hessian standard error of lambda: 0.023
##
## Log likelihood: -304.7918
## ML residual variance (sigma squared): 0.40168, (sigma: 0.63378)
## Number of observations: 313
## Number of parameters estimated: 3
## AIC: 615.58
Residuales del modelo
residuales_mSAR =SAR$fit$residuals
#Prueba de normalidad
shapiro.test(residuales_mSAR)
##
## Shapiro-Wilk normality test
##
## data: residuales_mSAR
## W = 0.95729, p-value = 6.37e-08
Los residuales no cumplen los supuestos de normalidad de acuerdo al p-valor
Indice de Moran para el modelo SAR
Moran.I(residuales_mSAR,We)
## $observed
## [1] 0.09349941
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004635041
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no sirve. En este caso no es suficiente explicar la CE con ella misma, se requiere colocar informacion de otras variables.
Modelo autoregresivo dos veces (SARAR) \[Y=\lambda W Y + \alpha 1_n + u\] \[u=\rho W u + \epsilon\]
SARAR= sacsarlm(Avg_CEa_15~1, data= X, listw= Wve)
## Warning in sacsarlm(Avg_CEa_15 ~ 1, data = X, listw = Wve): inversion of asymptotic covariance matrix failed for tol.solve = 2.22044604925031e-16
## número de condición recíproco = 1.77227e-18 - using numerical Hessian.
summary(SARAR)
##
## Call:sacsarlm(formula = Avg_CEa_15 ~ 1, data = X, listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.364908 -0.357504 -0.063033 0.289858 2.878760
##
## Type: sac
## Coefficients: (numerical Hessian approximate standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.1253 1.1713 0.9607 0.3367
##
## Rho: 0.95895
## Approximate (numerical Hessian) standard error: 0.040792
## z-value: 23.508, p-value: < 2.22e-16
## Lambda: 0.95895
## Approximate (numerical Hessian) standard error: 0.040755
## z-value: 23.53, p-value: < 2.22e-16
##
## LR test value: 133.68, p-value: < 2.22e-16
##
## Log likelihood: -281.3411 for sac model
## ML residual variance (sigma squared): 0.34087, (sigma: 0.58384)
## Number of observations: 313
## Number of parameters estimated: 4
## AIC: 570.68, (AIC for lm: 700.36)
El p valor en ambos casos indica que \(\lambda W\) y \(\rho W\) son significativos, es decir, que al parecer el modelo sirve sin embargo para poder afirmar esto, se requiere calcular el indice de Moran
Residuales del modelo
residuales_SARAR =SARAR$residuals
shapiro.test(residuales_SARAR)
##
## Shapiro-Wilk normality test
##
## data: residuales_SARAR
## W = 0.94498, p-value = 2.076e-09
Los residuales no cumplen los supuestos de normalidad de acuerdo al p-valor
Indice de Moran para el modelo SARAR
Moran.I(residuales_SARAR,We)
## $observed
## [1] 0.0563745
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004629181
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo general espacial anidado (GNS) \[Y= \lambda WY + \alpha1_n +X\beta_{(1)}+ WX \beta_{(2)}+u \\ |\lambda| <1 \\ u=\rho W u + \epsilon \\ |\rho| <1\]
GNS= sacsarlm(formula=Avg_CEa_15~Avg_CEa_07+NDVI+DEM+SLOPE+Avg_z, data= X, listw= Wve,type="mixed")
summary(GNS)
##
## Call:sacsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + NDVI + DEM + SLOPE +
## Avg_z, data = X, listw = Wve, type = "mixed")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.259920 -0.257064 -0.024628 0.256195 1.934415
##
## Type: sacmixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 26.084548 36.251116 0.7196 0.47180
## Avg_CEa_07 0.362195 0.034530 10.4893 < 2.2e-16
## NDVI -0.433013 1.115198 -0.3883 0.69781
## DEM 0.025591 0.016294 1.5706 0.11628
## SLOPE 0.010971 0.013341 0.8224 0.41087
## Avg_z -0.112125 0.022705 -4.9384 7.875e-07
## lag.Avg_CEa_07 -0.486187 0.219517 -2.2148 0.02677
## lag.NDVI -29.360420 11.602286 -2.5306 0.01139
## lag.DEM -0.125137 0.091592 -1.3663 0.17186
## lag.SLOPE 0.883938 0.212106 4.1674 3.080e-05
## lag.Avg_z 0.205119 0.155215 1.3215 0.18633
##
## Rho: 0.9037
## Asymptotic standard error: 0.58886
## z-value: 1.5347, p-value: 0.12487
## Lambda: 0.94686
## Asymptotic standard error: 0.32846
## z-value: 2.8827, p-value: 0.0039429
##
## LR test value: 149.65, p-value: < 2.22e-16
##
## Log likelihood: -189.5009 for sacmixed model
## ML residual variance (sigma squared): 0.19093, (sigma: 0.43695)
## Number of observations: 313
## Number of parameters estimated: 14
## AIC: 407, (AIC for lm: 542.65)
Residuales del modelo
residuales_GNS =GNS$residuals
shapiro.test(residuales_GNS)
##
## Shapiro-Wilk normality test
##
## data: residuales_GNS
## W = 0.97364, p-value = 1.68e-05
Los residuales no cumplen el supuesto de normalidad
Indice de Moran para el modelo GNS
Moran.I(residuales_GNS,We)
## $observed
## [1] 0.04788866
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004639083
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo GNS 2 En este modelo no se tiene en cuenta el DEM debido a que como anteriormente se obtuvo un p-valor mayor a 0.05 tanto de manera natural como rezagada es necesario eliminar esta variable, la cual no esta relacionada con la CE a 150 cm
GNS2= sacsarlm(formula=Avg_CEa_15~Avg_CEa_07+NDVI+SLOPE+Avg_z, data= X, listw= Wve,type="mixed")
summary(GNS2)
##
## Call:sacsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + NDVI + SLOPE + Avg_z,
## data = X, listw = Wve, type = "mixed")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.242977 -0.273753 -0.027046 0.262976 1.942185
##
## Type: sacmixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 17.956728 33.982429 0.5284 0.597213
## Avg_CEa_07 0.373281 0.034028 10.9697 < 2.2e-16
## NDVI -0.543373 1.116766 -0.4866 0.626571
## SLOPE 0.011352 0.013389 0.8479 0.396517
## Avg_z -0.105276 0.022422 -4.6952 2.664e-06
## lag.Avg_CEa_07 -0.559944 0.212632 -2.6334 0.008454
## lag.NDVI -28.742233 11.599813 -2.4778 0.013219
## lag.SLOPE 0.884282 0.203207 4.3516 1.351e-05
## lag.Avg_z 0.138273 0.128293 1.0778 0.281128
##
## Rho: 0.90567
## Asymptotic standard error: 0.5636
## z-value: 1.6069, p-value: 0.10807
## Lambda: 0.94735
## Asymptotic standard error: 0.31799
## z-value: 2.9792, p-value: 0.0028904
##
## LR test value: 147.85, p-value: < 2.22e-16
##
## Log likelihood: -190.7997 for sacmixed model
## ML residual variance (sigma squared): 0.19248, (sigma: 0.43873)
## Number of observations: 313
## Number of parameters estimated: 12
## AIC: 405.6, (AIC for lm: 541.44)
En este modelo \(\rho\) no es significativo
Residuales del modelo
residuales_GNS2 =GNS2$residuals
shapiro.test(residuales_GNS2)
##
## Shapiro-Wilk normality test
##
## data: residuales_GNS2
## W = 0.97534, p-value = 3.293e-05
Los residuales no cumplen los supuestos de normalidad
Indice de Moran para el modelo GNS 2
Moran.I(residuales_GNS2,We)
## $observed
## [1] 0.04841028
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004640051
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo espacial del error (SEM) \[Y= \alpha 1_n + X\beta + u\] \[u=\rho W u + \epsilon\]
SEM=lagsarlm(formula=Avg_CEa_15~Avg_CEa_07+NDVI+DEM+SLOPE+Avg_z, data= X, listw= Wve)
summary(SEM)
##
## Call:lagsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + NDVI + DEM + SLOPE +
## Avg_z, data = X, listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.4682926 -0.3245699 0.0049751 0.3215294 1.9926400
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 22.7597381 2.0758704 10.9639 < 2.2e-16
## Avg_CEa_07 0.2479677 0.0247839 10.0052 < 2.2e-16
## NDVI -1.2527443 1.0391615 -1.2055 0.2280
## DEM -0.0035254 0.0106002 -0.3326 0.7394
## SLOPE 0.0603502 0.0137383 4.3928 1.119e-05
## Avg_z -0.1133123 0.0145926 -7.7650 8.216e-15
##
## Rho: 0.96209, LR test value: 51.297, p-value: 7.9403e-13
## Asymptotic standard error: 0.02667
## z-value: 36.074, p-value: < 2.22e-16
## Wald statistic: 1301.3, p-value: < 2.22e-16
##
## Log likelihood: -238.6759 for lag model
## ML residual variance (sigma squared): 0.26412, (sigma: 0.51393)
## Number of observations: 313
## Number of parameters estimated: 8
## AIC: 493.35, (AIC for lm: 542.65)
## LM test for residual autocorrelation
## test value: 197.83, p-value: < 2.22e-16
Residuales del modelo
residuales_SEM =SEM$residuals
shapiro.test(residuales_SEM)
##
## Shapiro-Wilk normality test
##
## data: residuales_SEM
## W = 0.98401, p-value = 0.001482
Los residuales no cumplen el supuesto de normalidad
Indice de Moran para el modelo SEM
Moran.I(residuales_SEM,We)
## $observed
## [1] 0.06272672
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004645596
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo SEM 2 En este modelo no se tiene en cuenta el NDVI debido a que como anteriormente se obtuvo un p-valor mayor a 0.05, quiere decir que no esta relacionada con la variable de CE a 150 cm
SEM2=lagsarlm(formula=Avg_CEa_15~Avg_CEa_07+DEM+SLOPE+Avg_z, data= X, listw= Wve)
summary(SEM2)
##
## Call:lagsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + DEM + SLOPE + Avg_z,
## data = X, listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.4816823 -0.3104710 -0.0029262 0.3123820 2.0086327
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 22.2840690 2.0415406 10.9153 < 2.2e-16
## Avg_CEa_07 0.2511915 0.0246965 10.1712 < 2.2e-16
## DEM -0.0023501 0.0105797 -0.2221 0.8242
## SLOPE 0.0590076 0.0137250 4.2993 1.713e-05
## Avg_z -0.1174587 0.0142130 -8.2642 2.220e-16
##
## Rho: 0.96224, LR test value: 51.442, p-value: 7.3763e-13
## Asymptotic standard error: 0.026571
## z-value: 36.214, p-value: < 2.22e-16
## Wald statistic: 1311.5, p-value: < 2.22e-16
##
## Log likelihood: -239.4008 for lag model
## ML residual variance (sigma squared): 0.26534, (sigma: 0.51511)
## Number of observations: 313
## Number of parameters estimated: 7
## AIC: 492.8, (AIC for lm: 542.24)
## LM test for residual autocorrelation
## test value: 204.24, p-value: < 2.22e-16
Residuales del modelo
residuales_SEM2 =SEM2$residuals
shapiro.test(residuales_SEM2)
##
## Shapiro-Wilk normality test
##
## data: residuales_SEM2
## W = 0.98402, p-value = 0.001489
Los residuales no cumplen con los supuestos de normalidad Indice de Moran para el modelo SEM 2
Moran.I(residuales_SEM2,We)
## $observed
## [1] 0.06381437
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004645202
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo SEM 3 En este modelo no se tiene en cuenta el NDVI y DEM debido a que como anteriormente se obtuvo un p-valor mayor a 0.05, quiere decir que no estan relacionadas con la variable de CE a 150 cm
SEM3=lagsarlm(formula=Avg_CEa_15~Avg_CEa_07+SLOPE+Avg_z, data= X, listw= Wve)
summary(SEM3)
##
## Call:lagsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + SLOPE + Avg_z, data = X,
## listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.4784823 -0.3104058 -0.0036333 0.3134775 2.0108734
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 22.244004 2.033354 10.9396 < 2.2e-16
## Avg_CEa_07 0.250818 0.024640 10.1794 < 2.2e-16
## SLOPE 0.059387 0.013617 4.3611 1.294e-05
## Avg_z -0.119649 0.010216 -11.7118 < 2.2e-16
##
## Rho: 0.96243, LR test value: 51.997, p-value: 5.56e-13
## Asymptotic standard error: 0.026429
## z-value: 36.416, p-value: < 2.22e-16
## Wald statistic: 1326.1, p-value: < 2.22e-16
##
## Log likelihood: -239.4255 for lag model
## ML residual variance (sigma squared): 0.26537, (sigma: 0.51514)
## Number of observations: 313
## Number of parameters estimated: 6
## AIC: 490.85, (AIC for lm: 540.85)
## LM test for residual autocorrelation
## test value: 204.57, p-value: < 2.22e-16
Residuales del modelo
residuales_SEM3 =SEM3$residuals
shapiro.test(residuales_SEM3)
##
## Shapiro-Wilk normality test
##
## data: residuales_SEM3
## W = 0.98381, p-value = 0.001347
Los residuales no cumplen con los supuestos de normalidad
Indice de Moran para el modelo SEM 3
Moran.I(residuales_SEM3,We)
## $observed
## [1] 0.06388428
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004645126
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo espacial en rezago (SLM) \[Y=\lambda W Y + \alpha 1_n + X\beta + \epsilon\]
SML=errorsarlm(formula=Avg_CEa_15~Avg_CEa_07+NDVI+DEM+SLOPE+Avg_z, data= X, listw= Wve)
summary(SML)
##
## Call:errorsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + NDVI + DEM + SLOPE +
## Avg_z, data = X, listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.46790 -0.32241 -0.02153 0.36060 1.99578
##
## Type: error
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 45.5088603 2.7607166 16.4844 < 2.2e-16
## Avg_CEa_07 0.2959247 0.0286368 10.3337 < 2.2e-16
## NDVI -1.1627276 1.1220178 -1.0363 0.3000703
## DEM -0.0093728 0.0123588 -0.7584 0.4482181
## SLOPE 0.0518339 0.0144655 3.5833 0.0003393
## Avg_z -0.1327355 0.0171932 -7.7202 1.155e-14
##
## Lambda: 0.96877, LR test value: 49.814, p-value: 1.69e-12
## Asymptotic standard error: 0.022011
## z-value: 44.013, p-value: < 2.22e-16
## Wald statistic: 1937.2, p-value: < 2.22e-16
##
## Log likelihood: -239.4171 for error model
## ML residual variance (sigma squared): 0.26504, (sigma: 0.51482)
## Number of observations: 313
## Number of parameters estimated: 8
## AIC: 494.83, (AIC for lm: 542.65)
Residuales del modelo
residuales_SML =SML$residuals
shapiro.test(residuales_SML)
##
## Shapiro-Wilk normality test
##
## data: residuales_SML
## W = 0.98846, p-value = 0.01377
Los residuales no cumplen los supuestos de normalidad Indice de Moran para el modelo SML
Moran.I(residuales_SML,We)
## $observed
## [1] 0.07550844
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004647281
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo SML 2
En este modelo no se tiene en cuenta el NDVI debido a que como anteriormente se obtuvo un p-valor mayor a 0.05, quiere decir que no esta relacionada con la variable de CE a 150 cm
SML1=errorsarlm(formula=Avg_CEa_15~Avg_CEa_07+DEM+SLOPE+Avg_z, data= X, listw= Wve)
summary(SML1)
##
## Call:errorsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + DEM + SLOPE +
## Avg_z, data = X, listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.477728 -0.316994 -0.014091 0.367283 2.009859
##
## Type: error
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 45.035550 2.729375 16.5003 < 2.2e-16
## Avg_CEa_07 0.299387 0.028492 10.5079 < 2.2e-16
## DEM -0.008240 0.012332 -0.6682 0.5040078
## SLOPE 0.051310 0.014481 3.5432 0.0003953
## Avg_z -0.136386 0.016857 -8.0910 6.661e-16
##
## Lambda: 0.96901, LR test value: 50.337, p-value: 1.2949e-12
## Asymptotic standard error: 0.021843
## z-value: 44.363, p-value: < 2.22e-16
## Wald statistic: 1968.1, p-value: < 2.22e-16
##
## Log likelihood: -239.9531 for error model
## ML residual variance (sigma squared): 0.26594, (sigma: 0.51569)
## Number of observations: 313
## Number of parameters estimated: 7
## AIC: 493.91, (AIC for lm: 542.24)
Residuales del modelo
residuales_SML1 =SML1$residuals
shapiro.test(residuales_SML1)
##
## Shapiro-Wilk normality test
##
## data: residuales_SML1
## W = 0.98823, p-value = 0.01217
Los residuales no cumplen con los supuestos de normalidad
Indice de Moran para el modelo SML 2
Moran.I(residuales_SML1,We)
## $observed
## [1] 0.07620439
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004646962
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo SML 3 En este modelo no se tiene en cuenta el NDVI y DEM debido a que como anteriormente se obtuvo un p-valor mayor a 0.05, quiere decir que no estan relacionadas con la variable de CE a 150 cm
SML2=errorsarlm(formula=Avg_CEa_15~Avg_CEa_07+SLOPE+Avg_z, data= X, listw= Wve)
summary(SML2)
##
## Call:errorsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + SLOPE + Avg_z,
## data = X, listw = Wve)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.470171 -0.318709 -0.014481 0.355224 2.014963
##
## Type: error
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 44.749718 2.699784 16.5753 < 2.2e-16
## Avg_CEa_07 0.297488 0.028368 10.4868 < 2.2e-16
## SLOPE 0.052248 0.014422 3.6227 0.0002915
## Avg_z -0.143289 0.013322 -10.7558 < 2.2e-16
##
## Lambda: 0.96928, LR test value: 50.495, p-value: 1.1945e-12
## Asymptotic standard error: 0.021655
## z-value: 44.761, p-value: < 2.22e-16
## Wald statistic: 2003.5, p-value: < 2.22e-16
##
## Log likelihood: -240.1762 for error model
## ML residual variance (sigma squared): 0.2663, (sigma: 0.51604)
## Number of observations: 313
## Number of parameters estimated: 6
## AIC: 492.35, (AIC for lm: 540.85)
Residuales del modelo
residuales_SML2 =SML2$residuals
shapiro.test(residuales_SML2)
##
## Shapiro-Wilk normality test
##
## data: residuales_SML2
## W = 0.98814, p-value = 0.01166
Los residuales no cumplen los supuestos de normalidad
Indice de Moran para el modelo SML 3
Moran.I(residuales_SML2,We)
## $observed
## [1] 0.0767392
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004646816
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo SDE \[Y= \alpha 1_n + X\beta_1 + WX\beta_2 + u\] \[u=\rho W u + \epsilon\]
SDE=lagsarlm(formula=Avg_CEa_15~Avg_CEa_07+NDVI+DEM+SLOPE+Avg_z, data= X, listw= Wve,type="mixed")
summary(SDE)
##
## Call:lagsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + NDVI + DEM + SLOPE +
## Avg_z, data = X, listw = Wve, type = "mixed")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.356577 -0.269279 -0.016311 0.269347 1.954889
##
## Type: mixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 28.265444 13.304190 2.1246 0.033624
## Avg_CEa_07 0.318816 0.033502 9.5163 < 2.2e-16
## NDVI -0.463244 1.170570 -0.3957 0.692295
## DEM 0.026816 0.016575 1.6179 0.105686
## SLOPE 0.010237 0.014082 0.7269 0.467260
## Avg_z -0.127758 0.021328 -5.9901 2.098e-09
## lag.Avg_CEa_07 -0.148588 0.197032 -0.7541 0.450771
## lag.NDVI -33.518708 10.304158 -3.2529 0.001142
## lag.DEM -0.135244 0.080945 -1.6708 0.094759
## lag.SLOPE 1.004251 0.157352 6.3822 1.746e-10
## lag.Avg_z 0.216661 0.099651 2.1742 0.029690
##
## Rho: 0.91953, LR test value: 20.527, p-value: 5.8806e-06
## Asymptotic standard error: 0.056295
## z-value: 16.334, p-value: < 2.22e-16
## Wald statistic: 266.81, p-value: < 2.22e-16
##
## Log likelihood: -202.5621 for mixed model
## ML residual variance (sigma squared): 0.21072, (sigma: 0.45905)
## Number of observations: 313
## Number of parameters estimated: 13
## AIC: 431.12, (AIC for lm: 449.65)
## LM test for residual autocorrelation
## test value: 128.64, p-value: < 2.22e-16
Residuales del modelo
residuales_SDE=SDE$residuals
shapiro.test(residuales_SDE)
##
## Shapiro-Wilk normality test
##
## data: residuales_SDE
## W = 0.97531, p-value = 3.25e-05
Los residuales no cumplen el supuesto de normalidad
Indice de Moran para el modelo SDE
Moran.I(residuales_SDE,We)
## $observed
## [1] 0.04750286
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004640154
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Modelo SDE 2 En este modelo no se tiene en cuenta el DEM debido a que como anteriormente se obtuvo un p-valor mayor a 0.05 tanto de manera natural como rezagada es necesario eliminar esta variable, la cual no esta relacionada con la CE a 150 cm
SDE2=lagsarlm(formula=Avg_CEa_15~Avg_CEa_07+NDVI+SLOPE+Avg_z, data= X, listw= Wve,type="mixed")
summary(SDE2)
##
## Call:lagsarlm(formula = Avg_CEa_15 ~ Avg_CEa_07 + NDVI + SLOPE + Avg_z,
## data = X, listw = Wve, type = "mixed")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.333622 -0.275363 -0.029168 0.282362 1.964752
##
## Type: mixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 19.647922 12.226997 1.6069 0.108070
## Avg_CEa_07 0.330155 0.032674 10.1046 < 2.2e-16
## NDVI -0.589440 1.173067 -0.5025 0.615332
## SLOPE 0.010556 0.014147 0.7461 0.455591
## Avg_z -0.121066 0.020727 -5.8409 5.193e-09
## lag.Avg_CEa_07 -0.223421 0.188506 -1.1852 0.235932
## lag.NDVI -32.761470 10.341965 -3.1678 0.001536
## lag.SLOPE 1.008515 0.155431 6.4885 8.669e-11
## lag.Avg_z 0.143016 0.082839 1.7264 0.084270
##
## Rho: 0.92005, LR test value: 20.705, p-value: 5.3568e-06
## Asymptotic standard error: 0.055914
## z-value: 16.455, p-value: < 2.22e-16
## Wald statistic: 270.76, p-value: < 2.22e-16
##
## Log likelihood: -204.0637 for mixed model
## ML residual variance (sigma squared): 0.21275, (sigma: 0.46124)
## Number of observations: 313
## Number of parameters estimated: 11
## AIC: 430.13, (AIC for lm: 448.83)
## LM test for residual autocorrelation
## test value: 131.98, p-value: < 2.22e-16
Residuales del modelo
residuales_SDE2=SDE2$residuals
shapiro.test(residuales_SDE2)
##
## Shapiro-Wilk normality test
##
## data: residuales_SDE2
## W = 0.97702, p-value = 6.545e-05
Los residuales no cumplen los supuestos de normalidad
Indice de Moran para el modelo SDE 2
Moran.I(residuales_SDE2,We)
## $observed
## [1] 0.04829465
##
## $expected
## [1] -0.003205128
##
## $sd
## [1] 0.004641113
##
## $p.value
## [1] 0
El p-valor indica que los residuales todavia presentan dependencia espacial, lo que quiere decir que este modelo no es util
Conclusion
En este caso ocurrio una mala especificacion del modelo, es decir, ninguno de los modelos pudo explicar la dependencia espacial presentada debido a que las variables usadas no son las adecuadas, es necesario ir a campo a tomar datos de variables que esten relacionadas con la CE como las propiedades fisicas o quimicas del suelo