O presente relatório tem como objetivo realizar uma análise geoestatística dos dados de areia muito fina (AMF) coletados em uma área de estudo. A geoestatística permite modelar e interpretar a variabilidade espacial dos dados, sendo uma ferramenta essencial em estudos ambientais, solos, mineração e recursos naturais.
O desenvolvimento desta análise ocorre em várias etapas, desde a exploração inicial dos dados até o ajuste de modelos e a avaliação da dependência espacial, incluindo a consideração de possíveis efeitos de anisotropia.
Iniciamos com a leitura do conjunto de dados, que contém as coordenadas espaciais dos pontos amostrados e as respectivas medidas da variável de interesse, no caso, a fração de areia muito fina.
X | Y | dados |
---|---|---|
0 | 300 | 6.6 |
650 | 200 | 5.9 |
0 | 0 | 5.9 |
800 | 0 | 5.0 |
100 | 50 | 4.0 |
Antes de realizar qualquer modelagem espacial, é fundamental conhecer o comportamento geral dos dados por meio da análise descritiva. O coeficiente de variação (CV) também é obtido, pois ele fornece uma medida relativa da variabilidade dos dados em relação à média. Valores altos de CV indicam alta dispersão, o que pode influenciar na escolha dos modelos geoestatísticos.
summary(geodados)
## Number of data points: 122
##
## Coordinates summary
## X Y
## min 0 0
## max 850 300
##
## Distance summary
## min max
## 50.0000 901.3878
##
## Data summary
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.50000 4.02500 5.60000 5.35082 6.30000 13.00000
##
## Other elements in the geodata object
## [1] "call"
CV = (sd(dados)/mean(dados))*100
CV
## [1] 28.51166
O valor do CV é 28,51%, indicando uma variabilidade moderada nos dados.
Por meio da análise gráfica dos dados espaciais, buscamos identificar possíveis tendências ou padrões visuais nas observações.
Inicialmente, é realizado um plot dos dados com suavização local, o que permite visualizar se há uma tendência espacial, ou seja, se os valores aumentam ou diminuem sistematicamente em função da posição geográfica.
Em seguida, é ajustado um modelo de tendência linear considerando as coordenadas espaciais. A análise dos resíduos deste modelo (por meio de boxplots) permite verificar se a remoção dessa tendência é necessária antes da construção dos semivariogramas.
!!!!
A análise gráfica inicial evidencia que os pontos amostrais estão distribuídos regularmente na área de estudo, mas há indícios de tendência espacial, especialmente no eixo X, onde observa-se uma leve redução dos valores da variável conforme a coordenada X aumenta.
Nesta etapa, são calculados diferentes semivariogramas utilizando dois tipos de estimadores (clássico e robusto) e diferentes limites de distância (hmax). A comparação dos gráficos permite escolher o modelo mais adequado, considerando estabilidade e coerência dos valores.
Comparando os modelos, verifica-se que o semivariograma clássico com hmax de 80% apresenta menor variabilidade nos pontos e uma definição mais clara do patamar, sendo visualmente mais adequado. Da mesma forma, o semivariograma robusto com hmax de 80% também se destaca pela suavização dos efeitos de possíveis valores extremos.
Para confirmar a existência de dependência espacial, é construído um envelope de simulação, que consiste em múltiplas simulações sob a hipótese de ausência de estrutura espacial. Se o semivariograma empírico se encontra fora do envelope em várias distâncias, isso sugere dependência espacial significativa.
Observa-se que, especialmente nas menores distâncias, os valores da semivariância empírica estão abaixo dos limites inferiores do envelope, o que indica que os pontos próximos entre si possuem valores mais semelhantes do que seria esperado sob a hipótese de aleatoriedade espacial.
Este resultado reforça a ind
Nesta fase, é calculado o semivariograma em quatro direções principais (0°, 45°, 90° e 135°) para verificar se o alcance e o patamar são diferentes conforme a direção. Caso sejam observadas diferenças relevantes, há indicação de anisotropia.
A avaliação dos semivariogramas direcionais revelou a presença de anisotropia no fenômeno estudado, uma vez que a estrutura da dependência espacial varia conforme a direção. A direção 90° apresenta o maior alcance, indicando que a dependência espacial se mantém por maiores distâncias neste sentido. Por outro lado, a direção 45° mostra um crescimento rápido da semivariância e um patamar mais baixo, caracterizando uma menor continuidade espacial.
São ajustados modelos teóricos aos semivariogramas empíricos, sendo o modelo esférico o principal utilizado. Este modelo é ajustado tanto de forma omnidirecional (considerando todas as direções igualmente) quanto de forma direcional.
A comparação dos modelos permite identificar se a estrutura espacial se comporta de maneira isotrópica (sem dependência direcional) ou anisotrópica (dependente da direção).
A partir dos ajustes dos modelos variográficos nas diferentes direções, observou-se que o comportamento da dependência espacial varia de maneira expressiva conforme o sentido considerado. A direção 90° apresenta o maior alcance, indicando maior continuidade espacial, enquanto a direção 45° apresenta o menor alcance, sugerindo uma rápida perda de dependência espacial.
Para quantificar a anisotropia, são calculados dois índices:
Fa (Fator de Anisotropia Geométrica): razão entre o maior e o menor alcance entre as direções.
Fc (Fator de Anisotropia Zonal): razão entre os maiores e menores patamares.
Esses índices ajudam a entender a intensidade da anisotropia presente no fenômeno.
O fator de anisotropia geométrica é dado por 2.4029367
O fator de anisotropia zonal é dado por 1.7961624
O fator de anisotropia geométrica indica que o alcance da dependência espacial é mais de duas vezes maior na direção de maior continuidade em relação à direção perpendicular. Já o fator de anisotropia zonal revela que, além do alcance, há uma diferença significativa na intensidade da variabilidade espacial entre as direções
Quando a anisotropia é detectada, aplica-se uma transformação nas coordenadas espaciais para corrigir essa distorção. Essa transformação busca tornar o fenômeno aproximadamente isotrópico, facilitando o ajuste de modelos e posterior interpolação.
A transformação teve como objetivo equalizar a dependência espacial nas diferentes direções, tornando o processo aproximadamente isotrópico. Observa-se, a partir da comparação entre os gráficos de distribuição dos pontos antes e após a transformação, que os pontos passaram de uma configuração alongada para uma disposição mais simétrica, refletindo o sucesso na correção da anisotropia.
Após a transformação, as curvas tornam-se muito mais próximas, indicando que a dependência espacial passou a se comportar de forma aproximadamente isotrópica.
Com as coordenadas transformadas, realiza-se um novo ajuste do modelo variográfico, buscando representar da melhor forma possível a estrutura espacial dos dados.
São extraídos os parâmetros fundamentais do modelo:
Efeito pepita (C0): representa a variabilidade não explicada pela distância, incluindo erro de amostragem e microvariabilidade.
Contribuição (C1): parte da variabilidade que é explicada pela dependência espacial.
Alcance (a): distância além da qual não há mais dependência espacial.
Patamar (C0 + C1): valor máximo da semivariância.
O modelo apresentou um ajuste satisfatório, representando adequadamente a estrutura de dependência espacial do fenômeno.
sph_OLS | sph_WLS | sph_cre | sph_ML | sph_REML | |
---|---|---|---|---|---|
EP | 0.2296 | 0.2549 | 0.3227 | 0.1585 | 0.1601 |
CT | 1.9031 | 1.8745 | 1.8149 | 1.9635 | 2.5043 |
AL | 226.0815 | 222.4703 | 228.7433 | 124.0704 | 155.5257 |
SQ | 0.1075 | 32.6693 | 14.4384 | NA | NA |
sph_OLS | sph_WLS | sph_cre | sph_ML | sph_REML | |
---|---|---|---|---|---|
AIC | NA | NA | NA | 363.8898 | 350.2636 |
BIC | NA | NA | NA | 380.7139 | 367.0877 |
EM | 0.0052 | 0.0053 | 0.0054 | 0.0118 | 0.0070 |
ER | 0.0035 | 0.0034 | 0.0033 | 0.0067 | 0.0041 |
DPem | 0.7866 | 0.7873 | 0.7879 | 0.7814 | 0.7962 |
Ser | 0.8950 | 0.8841 | 0.8632 | 0.8358 | 0.8485 |
EA | 75.4781 | 75.6222 | 75.7373 | 74.4971 | 77.3346 |
Beta0 | 0.0405 | 0.0004 | -0.1172 | 0.2734 | 0.3408 |
Beta1 | 0.9934 | 1.0009 | 1.0229 | 0.9510 | 0.9375 |
exp_OLS | exp_WLS | exp_cre | exp_ML | exp_REML | |
---|---|---|---|---|---|
EP | 0.0000 | 0.0000 | 0.0000 | 0.1113 | 0.1289 |
CT | 2.2699 | 2.2505 | 2.2852 | 3.1194 | 33.6433 |
AL | 95.8835 | 89.8286 | 94.6214 | 111.7735 | 1303.5468 |
SQ | 0.1978 | 58.4051 | 21.9896 | NA | NA |
exp_OLS | exp_WLS | exp_cre | exp_ML | exp_REML | |
---|---|---|---|---|---|
AIC | NA | NA | NA | 367.6421 | 349.1487 |
BIC | NA | NA | NA | 384.4662 | 365.9729 |
EM | 0.0065 | 0.0069 | 0.0066 | 0.0059 | 0.0029 |
ER | 0.0049 | 0.0050 | 0.0049 | 0.0036 | 0.0020 |
DPem | 0.7987 | 0.7987 | 0.7987 | 0.7920 | 0.7900 |
Ser | 0.9388 | 0.9263 | 0.9342 | 0.8430 | 0.8436 |
EA | 77.8274 | 77.8316 | 77.8283 | 76.5289 | 76.1389 |
Beta0 | 0.4821 | 0.4686 | 0.4795 | 0.2926 | 0.3499 |
Beta1 | 0.9110 | 0.9136 | 0.9115 | 0.9464 | 0.9351 |
gaus_OLS | gaus_WLS | gaus_cre | gaus_ML | gaus_REML | |
---|---|---|---|---|---|
EP | 0.5591 | 0.5694 | 0.6267 | 0.4833 | 0.4864 |
CT | 1.5836 | 1.5697 | 1.5225 | 2.2347 | 2.7574 |
AL | 113.1657 | 110.9742 | 114.6896 | 75.9108 | 80.0113 |
SQ | 0.0985 | 30.8919 | 12.9738 | NA | NA |
gaus_OLS | gaus_WLS | gaus_cre | gaus_ML | gaus_REML | |
---|---|---|---|---|---|
AIC | NA | NA | NA | 359.3342 | 344.5574 |
BIC | NA | NA | NA | 376.1583 | 361.3815 |
EM | 0.0048 | 0.0049 | 0.0049 | 0.0083 | 0.0076 |
ER | 0.0028 | 0.0029 | 0.0028 | 0.0048 | 0.0044 |
DPem | 0.8173 | 0.8153 | 0.8222 | 0.7693 | 0.7715 |
Ser | 0.8995 | 0.8924 | 0.8820 | 0.8359 | 0.8383 |
EA | 81.4969 | 81.0910 | 82.4810 | 72.2076 | 72.6213 |
Beta0 | -0.1715 | -0.1731 | -0.2513 | 0.2046 | 0.2507 |
Beta1 | 1.0330 | 1.0333 | 1.0479 | 0.9632 | 0.9545 |
Para garantir que o modelo ajustado seja o mais adequado, realiza-se uma comparação entre diferentes modelos teóricos (esférico, exponencial e gaussiano) e diferentes métodos de ajuste (WLS, ML, REML, Cressie, etc.).
São calculadas medidas de qualidade, como:
Erro médio (EM)
Erro padronizado (ER)
Desvio padrão dos erros (DPem)
AIC e BIC (critérios de informação)
Coeficientes da regressão entre dados observados e preditos (Beta0 e Beta1)
Modelo | Peso | EM | ER | DPem | Ser | Beta0 | Beta1 | Pontuacao | |
---|---|---|---|---|---|---|---|---|---|
2 | sph | sph_WLS | 0.00529 | 0.00341 | 0.78731 | 0.88412 | 0.00035 | 1.00092 | 0.91316 |
1 | sph | sph_OLS | 0.00522 | 0.00348 | 0.78656 | 0.89500 | 0.04051 | 0.99340 | 0.94736 |
3 | sph | sph_cre | 0.00538 | 0.00326 | 0.78791 | 0.86315 | -0.11720 | 1.02293 | 1.07353 |
11 | gaus | gaus_OLS | 0.00480 | 0.00285 | 0.81732 | 0.89953 | -0.17153 | 1.03298 | 1.12995 |
12 | gaus | gaus_WLS | 0.00490 | 0.00288 | 0.81528 | 0.89240 | -0.17310 | 1.03330 | 1.13705 |
O modelo esférico com ponderação WLS (sph_WLS) é o mais adequado para representar a estrutura espacial dos dados
Calcula-se dois índices importantes para avaliar a intensidade da dependência espacial:
Índice de Dependência Espacial (DE): baseado na proporção da variância explicada pela dependência espacial.
Índice IDE (Índice de Dependência Espacial Integrado): combina o DE com o alcance, tornando a avaliação mais robusta.
Temos:
DE
## Forte dependência espacial
IDE
## Forte dependência espacial