“Everything is related to everything else, but near things are more related than distant things.” - Waldo Tobler, 1970.
Basicamente a frase acima diz que todas as ocorrências geográficas estão relacionados entre si, mas as ocorrências mais próximas possuem uma relação mais forte que ocorrências distantes. Por exemplo, provavelmente os vizinhos tem uma renda parecida já que estão morando em locais com condições similares.
Um processo pontual espacial é caracterizado pela localização dos pontos e a relação entre eles, verificando algum tipo comportamento nos eventos observados. O comportamento podendo ser identificado como agrupado, regular ou completamente aleatório.
Segundo Câmara et al. (2002), a propriedade de 1ª ordem correspode a variações no valor médio do processo pontual no espaço, visando sua itensidade, ou seja, o número de eventos por unidade de área. Sendo definida como:
\[ \lambda(x)=\lim_{|ds|\rightarrow 0}\left \{ \frac{E[N(ds)]}{|ds|} \right \}. \]
Para Gatrell et al. (1995), as propriedades de segunda ordem representam a dependência espacial do processo, proveniente da estrutura de correlação espacial. Essa dependência é verificada estimando o relacionamento entre os pares de pontos no espaço, correspondendo ao cáculo da covariância entre as variáveis aleatórias. Sendo definida como:
\[ \lambda(ds_i,ds_j)=\lim_{|ds_i|,|ds_j|\rightarrow 0}\left \{ \frac{C[N(ds_i),N(ds_j)]}{|ds_i|.|ds_j|} \right \}. \]
OBS: Segundo Perry et al. (2006), na prática as propriedades de primeira e segunda ordem podem se “misturar”, ocasionando a independência nas variáveis aleatórias representadas por um processo estocástico espacial.
Uma das alternativas simples para gerar uma superfície bidimensional, com base em valores pontuais, é ajustar uma função bidimensional sobre as amostras consideradas, compondo uma superfície cujo valor será proporcional à intensidade dos valores das amostras locais. É dado pela formula geral:
\[ \hat\lambda_t(x)=\frac{1}{\tau^2}\sum^{n}_{i=1} k\left ( \frac{h(x_i,x)}{\tau} \right ), h(x_i,x)\leq \tau. \]
O estimador de intensidade é útil afim de fornecer uma visão geral da distribuição de primeira ordem dos eventos. As técnicas mais utilizadas para estimar as propriedades de segunda ordem são baseadas nas funções empíricas F, G, J e K, as quais serão descritas a seguir.
A função F, introduzida por Ripley (1977), é a função de distribuição acumulada da distância entre um ponto aleatoriamente escolhido e o evento mais próximo. O mais simples estimador para a função F pode ser obtido pela equação:
\[\hat F(x)=\lambda^{-1}\sum^{m}_{i=1}I_x(x_i),\]
\(m\) é o número de pontos arbitrários;
\(x_i\) representa a distância do i-ésimo ponto aleatório para o mais próximo dos n eventos no mapa analisado;
\(I_x (x_i)\) é uma função indicadora igual a 1 quando \(x_i\) é menor ou igual a \(x\), e 0 caso contrário.
Contudo, o estimador na equação acima é viesado, uma vez que, para uma mesma distância, pontos aleatórios localizados nas bordas do mapa terão uma probabilidade menor de ter um evento próximo do que os pontos localizados no centro do mapa. Esse efeito ocorre porque, na prática, trabalha-se com regiões de área finita enquanto teoricamente a área é considerada infinita.
Visando corrigir o efeito de bordas, Ripley propôs um estimador não viesado, dado na seguinte equação:
\[ \hat F(x)=\frac{ \sum^{n}_{i=1}I_x(x_i,r_i)}{\sum^{n}_{i=1}I_x(r_i)},x>0, \] Onde:
Para um processo de Poisson homogêneo, com área infinita, Diggle mostra que a F teórica é dada pela equação:
\[ F(x)=1-\exp{(-\lambda\pi x^2)} , x>0. \]
A função G definida por Ripley (1977), conhecida na literatura como o método do vizinho mais próximo, é uma função de distribuição acumulada da distância entre um evento e o vizinho mais próximo. O mais simples estimador para a função G é definido por:
\[ \hat G(y)=\lambda^{-1}\sum^{n}_{i=1}I_y(y_i), \]
Onde:
Visando corrigir o efeito de bordas, Ripley propôs um estimador não viesado, dado na seguinte equação:
\[\hat G(y)=\frac{ \sum^{n}_{i=1}I_y(y_i,r_i)}{\sum^{n}_{i=1}I_y(r_i)}, y>0\] - \(r_i\) é a distância de um evento até o ponto mais próximo na borda do mapa; - \(I_y(y_i,r_i)\) é uma função indicadora igual a 1, quando \(y_i\) é menor ou igual \(y\) e \(r_i\) é maior ou igual a r e 0, caso contrário.
A função J proposta por Van Lieshout & Baddeley (1996), é a razão entre a função G e a função F, na qual, compara as distâncias entre os eventos por meio de distâncias fixadas de algum ponto amostral. A função J é definida por:
\[ J(z)=\frac{1-G(z)}{1-F(z)}, \] sendo, \(z>0\) e \(F(z)<1\). J pode ser utilizada para grandes distâncias de interações espaciais e capaz de avaliar vários modelos estocásticos, de forma que isto poderia ser usado diretamente para estimação de parâmetros.
Diggle (2003), mostra que a função F é útil para detectar agrupamentos de eventos, enquanto a função G é mais poderosa para detectar eventos regularmente distribuídos.Logo, recomenda-se usar uma função que seja igualmente poderosa para detectar os dois padrões em diferentes escalas, como a função K, proposta por Ripley (1977), sendo definida como:
\[K(t)=\frac{2\pi}{\lambda^2}\int_{0}^{t}\lambda^2_{(x)}x dx.\]
A medida de primeira ordem é representada por uma função \(\lambda_1(x)\), que é a função de intensidade de primeira ordem. Ela indica a intensidade do processo na localização \(x\).