O objetivo deste trabalho é verificar a presença de padrão espacial de características de uma planta encontrada na Universidade Federal da Bahia - Campus Ondina. As análises foram realizadas no Software R.
A estatística espacial, ou geoestatística, é o campo da estatística que estuda métodos para ajudar a entender a aparente aleatoriedade dos dados estruturados de forma espacial e estabelecendo uma função de correlação espacial (Yamamoto e Landim, 2013). Em um campo, gramado, ou um mato, é possível encontrar grandes variedades de plantas, gramas, flores e ervas daninhas, que podem sofrer com diversas influencias externas como, alcance dos raios solares, perda de nutrientes, polinização de insetos e dispersão por meio de aves. O presente trabalho estudou o padrão de distribuição de plantas encontradas num campo, em um espaço público em um dos campus da Universidade Federal da Bahia (UFBA).
A análise do padrão espacial foi feita por meio de uma pesquisa de campo aliada a técnicas geoestatísticas como, geração de coordenadas de coleta, teste de aleatorização de Mantel, análise de anisotropia, entre outras - vistas durante as aulas da disciplina “Tópicos Especiais em Estatística A”, ministradas pela professora Doutora Denise Nunes Viola, docente do Departamento de Estatística.
O objeto do experimento, as plantas, foram encontradas num gramado próximo à Portaria 1 da Universidade Federal da Bahia - Campus Ondina. A área definida possui 9 metros quadrados. As plantas estudadas são um tipo de flor, semelhante às margaridas. Inicialmente, 300 pares de pontos aleatórios foram gerados, e destes, foram selecionados 50 pontos com suas respectivas coordenadas. A área de 9 metros quadrados foi dividida num formato de rede ou grid. Com o auxílio do grid, os 50 pontos gerados aleatoriamente no software R foram marcados dentro da área delimitada.
A marcação dos pontos foi realizada com o auxílio dos materiais: barbante, palito de churrasco e fita métrica.
Figura 1: Gráfico de 300 pontos gerados aleatoriamente, dos quais, 50 foram selecionados. Os pontos selecionados estão indicados pela cor vermelha.
A Figura 1 mostra, em vermelho, os pontos que foram selecionados para a amostragem das plantas.
Para cada ponto vermelho gerado no gráfico, é colocado um palito de churrasco no respectivo ponto da área experimental (Figura 2). A planta mais próxima do palito de churrasco foi amostrada, de modo que foram registradas as informações:
Altura da planta em centímetros;
Presença de flor (1 - Sim, 0 - Não);
Número de folhas;
Número de pétalas.
Caso a planta não apresentasse flor, era atribuído 0 para a presença de flor e número de pétalas.
Área Experimental
Figura 2: Área experimental
A Figura 2 mostra uma foto da área experimental de 9 metros quadrados, delimitada por barbantes. É possível verificar que algumas áreas não possuem plantas. Assim, caso não tivesse plantas no local em que foi definida a amostragem com o palito de churrasco, é considerada a planta mais próxima. Um dos pontos não tinha plantas próximas num raio de \(15\) cm, portanto, a análise foi realizada com a amostra de 49 plantas.
A amostra contém \(49\) plantas. A altura média das plantas é \(9,3\)cm, o número médio de folhas é \(9,26\), e \(11\) apresentaram flor. Dentre as plantas que tinham flor, o número médio de pétalas é de \(2,6\).
Figura 3: Gráfico de dispersão entre o número de folhas e a altura das plantas em centímetros.
#correlação entre altura e folhas, correlação entre altura e petalas
cor.test(dados_nosso$altura,dados_nosso$folhas,method = "spearman")
##
## Spearman's rank correlation rho
##
## data: dados_nosso$altura and dados_nosso$folhas
## S = 7155.2, p-value = 9.582e-07
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.6349389
A Figura 3 mostra o gráfico de dispersão entre as variáveis número de folhas e altura em centímetros das plantas. Pelo gráfico, parece haver correlação positiva entre as variáveis indicadas. Dado que as observações não seguem distribuição normal, será utilizado o teste de Spearman para verificar a correlação. O teste indica que existem evidências para rejeitar a hipótese que a verdadeira correlação é 0, portanto, existe correlação entre as variáveis.
Figura 4: Gráfico de dispersão entre o número de pétalas e a altura das plantas em centímetros.
A Figura 4 mostra o gráfico de dispersão entre as variáveis número de pétalas e altura em centímetros. Parece haver correlação positiva entre as variáveis indicadas.
cor.test(dados_nosso$altura,dados_nosso$petalas,method = "spearman")
##
## Spearman's rank correlation rho
##
## data: dados_nosso$altura and dados_nosso$petalas
## S = 8311.5, p-value = 1.491e-05
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.5759444
O teste de correlação de Spearman indica que existem evidências para rejeitar a hipótese que a verdadeira correlação é 0, portanto, existe correlação entre as variáveis.
A Figura 5 indica que as flores parecem ter uma maior altura em cm do que as plantas, no entanto vale ressaltar que existe grande variabilidade na altura das plantas, com a presença de outliers.
Figura 5: Boxplot Flor (Categórica) x Altura
A Figura 6 indica que as flores e as plantas não parecem se diferenciar tanto quanto ao número de folhas, apesar da variabilidade do número de folhas ser menor para as flores.
Figura 6: Boxplot Flor (Categórica) x Folhas
A Figura 7 indica que as flores parecem ter uma maior quantidade de pétalas que as plantas, essa categoria pode ser aberta a discussão, pois algumas plantas em que não havia clareza se deviam ser consideradas como flor ou planta, foram consideradas como plantas.
Figura 7: Boxplot Flor (Categórica) x Pétalas
Agora será analisada a normalidade das variáveis altura em centímetros, número de folhas e número de pétalas. Como não existem informações a priori, será considerado o teste de Shapiro-Wilk, bilateral. Os resultados do teste de normalidade abaixo para a altura, número de folhas e número de pétalas, são respectivamente:
##
## Shapiro-Wilk normality test
##
## data: dados_nosso$altura
## W = 0.87864, p-value = 0.0001184
##
## Shapiro-Wilk normality test
##
## data: dados_nosso$folhas
## W = 0.60963, p-value = 3.525e-10
##
## Shapiro-Wilk normality test
##
## data: dados_nosso$petalas
## W = 0.59396, p-value = 2.068e-10
Todos os testes foram rejeitados a um nível de 5%, portanto temos evidência de que a distribuição destas variáveis não é normal.
Visto que o teste de Shapiro Wilk rejeitou a normalidade dos dados, não é possível avaliar o semi variograma. Portanto, será realizado o teste de aleatorização de Mantel considerando \(10.000\) simulações Monte-Carlo.
O teste de Mantel possui as hipóteses:
\(H_0:\) O padrão espacial é aleatório
\(H_1:\) O padrão espacial não é aleatório
Figura 8: Análise do padrão para Altura
Na Figura 8, no painel superior esquerdo, é possível verificar que existe anisotropia no eixo x, porém o mesmo não é identificado em y. Realizando análise a sentimento, parece haver padrão no eixo y devido a concentração de cores quentes (vermelho e amarelo). No caso de haver anisotropia, será baixa.
O painel superior direito, mostra a dispersão das plantas baixas. Nota-se que as plantas baixas estão concentradas no canto superior esquerdo. O painel inferior esquerdo mostra a dispersão das plantas altas. Esse painel, por outro lado, mostra que as plantas altas estão concentradas na área inferior esquerda. Esses resultados dão indícios de que existe algum tipo de padrão nos dados.
Figura 9: Distribuição dos pontos para a Altura
Na Figura 9, o gráfico de distribuição dos pontos mostra que existe uma concentração de plantas com altura alta no canto superior esquerdo e uma concentração de plantas com altura baixa no canto inferior direito, no entanto, reforçando a idéia de que existe algum tipo de padrão.
## [1] "P-valor = 0.2291"
O Teste de Mantel não demonstra evidências, a um nível de 5% de significância, para rejeitar a hipótese de que o padrão é aleatório. Portanto, pode-se afirmar que os dados possuem padrão aleatório.
Figura 10: Análise do padrão para a quantidade de pétalas
Na Figura 10 não parece haver anisotropia. No painel superior esquerdo, verifica-se a concentração de cores frias (azul e verde). Assim, realizando análise a sentimento parece não haver padrão espacial.
Figura 11: Distribuição de pontos para as pétalas.
O gráfico de pontos, na Figura 11, parece não indicar tendência de padrão espacial não aleatório na quantidade de pétalas.
## [1] "P-valor = 0.9559"
Realizando o Teste de Mantel, não temos evidencia a um nível de 5% de significância para rejeitar a hipótese de que o padrão é aleatório. Portanto, o resultado indica padrão aleatório.
Figura 12: Análise do padrão para o número de folhas
Na Figura 12, verifica-se anisotropia no eixo x, porém o mesmo não é identificado em y. No primeiro gráfico, nota-se uma concentração de cores frias no canto inferior direito, enquanto no canto inferior esquerdo existe a concentração de cores quentes. Por outro lado, no canto superior esquerdo e no meio do gráfico existe a concentração de cores quentes (amarelo e vermelho). Realizando essa análise a sentimento, considerando a anisotropia em x e o gráfico de cores quentes e frias, parece haver indicativo de padrão espacial não aleatório.
Figura 13: Distribuição dos Pontos nas Folhas
O gráfico da distribuição dos pontos, apresentado na Figura 13, mostra a concentração de pontos de tamanho pequeno em diversas localizações, enquanto os pontos de tamanho médio e grande parecem estar mais dispersos pelo gráfico.
## [1] "P-valor = 0.0815"
Realizando o Teste de Mantel, não temos evidência, a um nível de 5% de significância, para rejeitar a hipótese de que o padrão é aleatório. Assim, o resultado indica padrão aleatório.
Não foi encontrado padrão espacial a um nível de 5% de significância. No entanto, a probabilidade de se cometer o erro do tipo 1 (rejeitar a hipótese nula quando ela é verdadeira) ao rejeitar a hipótese de que o padrão espacial é aleatório para a quantidade de folhas é de 8%. Como o erro do tipo 1 é baixo e a correlação de Spearman entre altura e número de folhas é de 63%, uma adaptação no método de coleta de dados, ou a coleta de mais pontos, poderia ajudar a identificar algum padrão na quantidade de folhas das plantas.
YAMAMOTO, Jorge Kazuo; LANDIM, Paulo Milton Barbosa. Geoestatística: conceitos e aplicações. São Paulo, SP: Oficina de Textos, 2013, 215p. ISBN 9788579750779.