Animais domésticos: análises descritivas

Autor

Darren Norris

Objetivo

  • O objetivo deste exemplo é utilizar R para avaliar o monitoramento de animais domésticos no Campus Marco Zero da Universidade Federal do Amapá.

Especificamente, aqui utilizamos o caso dos animais domésticos do Campus Marco Zero para ilustrar exemplos de técnicas utilizadas para avaliar a representatividade e adequação de uma amostra.

A mensagem mais importante deste exemplo é:

  • Amostras padronizadas são necessárias para obter evidências científicas validas.

  • Poucas amostras produzem resultados imprecisos e enganosos.

  • Muitas amostras tornam-se proibitivas em termos de custo e esforço.

Apresentação

Quantos indivíduos em uma população?

A ecologia/biologia populacional é o estudo sobre quais fatores afetam as populações e como e por que uma população muda ao longo do tempo. O crescimento da população humana serve como um modelo importante para os ecologistas populacionais e é uma das questões ambientais mais importantes do século XXI (Wittemyer et al. (2008), Crist, Mora, e Engelman (2017)). Mas todas as populações, incluindo os animais domésticos, têm sido objeto de estudos em biologia e ecologia populacional básicas e aplicadas (Miller et al. (2014) , Belo et al. (2015), Kilgour et al. (2016), Ma et al. (2020)).

O número de indivíduos em uma população varia naturalmente. Além desta variação natural, o número de indivíduos é ainda influenciado tanto por diferenças na técnica quanto no esforço de amostragem (Williams e Brown (2019), Christie et al. (2019)). Registrar cada indivíduo de uma população é muitas vezes impraticável, desnecessário e caro. Em vez disso, cientistas utilizam amostras replicadas para representar a população em geral (Buckland, Goudie, e Borchers (2000), Buckland et al. (2023)).

Adequação de amostras

A amostragem é o processo de selecionar um subconjunto da população total para estudo. Esse subconjunto, conhecido como amostra, deve ser representativo da população total em termos de suas características relevantes. Uma amostragem adequada garante que os resultados do estudo possam ser extrapolados para toda a população com confiança. Portanto, a realização de um estudo preciso e confiável depende de uma amostragem adequada.

Para ajudar a acompanhar e entender os exemplos, use como base os livros sobre ecologia e gestão da vida selvagem disponíveis na biblioteca da universidade (ebooks online Minha Biblioteca), inclusive:

Análises descritivas

Como parte das atividades desenvolvidas durante a aula de Práticas Integradas do curso de Ciências Ambientais um grupo de estudantes monitorou os animais domésticos no campus Marco Zero da Universidade Federal do Amapá.

Pacotes

library(tidyverse)
library(readxl)
library(patchwork)
library(vegan)
library(scales)

Dados

# Registros
fm <- "Monitoramento_202409.xlsx"
registros <- readxl::read_excel(fm, 
                   sheet = "Registros", 
                   .name_repair = "universal") |> 
  rename("meudata" = "data", 
         "meuhora" = "hora..hh.mm.")
# Esforço amostral
esforco <- readxl::read_excel(fm, 
                   sheet = "esforco_amostral", 
                   .name_repair = "universal")
# Animais
animais <- readxl::read_excel("individuos_202409.xlsx", 
                   sheet = "animais", 
                   .name_repair = "universal") |> 
filter(!is.na(Nome))

A apresentação dos resultados graficamente é uma componente importante das análises descritivas (Zuur, Ieno, e Elphick (2009)). Existem diversos tipos de gráficos, aqui ilustraremos com alguns exemplos os resultados obtidos.

Gráfico de barras

Figura 1: Comparação simplista.

Entre agosto 2023 e setembro 2024 foram registrados 75 animais domésticos no campus Marco Zero. Esse total incluiu 33 gatos e 43 cães. Figura 1 mostra um gráfico de barras com uma comparação simplista do número de animais domésticos observados antes e depois da equipe do MI-AU começar a fornecer alimentos. Mas, este tipo de comparação não leva em consideração fatores importantes, incluindo diferenças no esforço amostral, variação na coleta de dados, diferenças na detectabilidade de espécies e indivíduos, variação temporal (estações secas e chuvosas).

Uma comparação simplista (Figura 1) sugere que o número de cães e gatos aumentou após o fornecimento de alimentos adicionais. O número de cães registrados aumentou de 27 para 42, e o número gatos aumentou de 14 para 29.

Figura 2: Comparação mostrando número de indivíduos registrados por dia. A linha tracejada mostra quando foi fornecida comida adicional.

No entanto, uma análise mais detalhada dos dados revela que explicações alternativas para as diferenças observados são muito mais prováveis em vez do fornecimento de alimentos adicionais. Como esperado, o número de indivíduos variou por dia e por espécie (Figura 2). Em média, 17 animais domésticos foram registrados por dia no campus Marco Zero. Houve variação substancial em torno do valor médio, com o número de indivíduos por dia variando de 1 a 37 durante 26 dias de amostragem (Figura 2). Em média, foram registados mais cães do que gatos (média de 10 e 6 indivíduos por dia, para cães e gatos respectivamente, Figura 2).

Assim sendo, explicações alternativas para o aparente acréscimo de indivíduos registrados após o fornecimento de alimentos adicionais incluem:

  • Dados antes incompletos.
    Não houve tempo suficiente para contar todos os indivíduos antes da alimentação foi fornecida.

  • Maior esforço de amostragem.
    Ao longo do tempo houve um aumento de esforço amostral, com mais pessoas cobrindo uma área mais ampla do campus.

  • Dinâmica populacional.
    Os dados apresentados, não leva em conta recrutamento (nascimentos/imigração) ou perda (mortalidade/emigração).

  • Melhor capacidade técnica da equipe.
    Ao longo do tempo houve melhorias para encontrar, observar e registrar os animais.

  • Necessidade de melhorar a metodologia de monitoramento. 
    Por exemplo, diferenças na detectabilidade entre espécies poderiam explicar por que menos gatos são observados.

Resumos - tabelas

Também podemos usar tabelas para apresentar resultados resumidos.

Tabela 1: Comparação de esforço antes e depois.
alimentação semanas dias primeiro registro última registro
antes 4 8 21/08/2023 14/09/2023
depois 16 18 23/09/2023 19/09/2024

Foram realizados mais dias de monitoramento depois da alimentação ser fornecida (Tabela 1). Mas, os dados ainda faltam medidas apropriadas do esforço de amostragem, tais como o número de pessoas, a distância percorrida e o tempo gasto por dia.

Também podemos ver os números registrados por mês.

Tabela 2: Número de indivíduos registrados e número de dias amostrados por mês.
Ano Mês Dias Canis familiaris Felis catus
2023 08 3 21 9
2023 09 4 27 14
2023 09 3 25 11
2024 03 2 22 15
2024 04 2 19 12
2024 05 1 14 6
2024 06 3 16 16
2024 07 1 8 10
2024 08 3 7 11
2024 09 3 12 11

Gráficos de dispersão e caixa

Podemos usar gráficos de dispersão e caixa (boxplots) para representar a variação nos dados. Estes são muito mais apropriados do que o gráfico de barras simplista para compreender os padrões do número de indivíduos registados.

Figura 3 mostrando resultados com base nas planilhas disponíveis no dia 15 de outubro 2024. Esta comparação ilustra como os padrões que vemos dependem não só da forma como os dados são coletados/obtidos, mas também da forma como são processados, resumidos e apresentados.

Figura 3: Comparação escala temporal. Comparando o efeito da mudança da escala temporal, com base em valores por dia e semana.

Devido à variação substancial de indivíduos registrados por dia, parece que não houve diferença significativa no número de cães e gatos registrados por dia ou semana ao longo do tempo (Figura 3). Mas antes de tirar quaisquer conclusões, estas avaliações visuais precisam ser testadas por comparações estatísticas.

Esforço amostral

A ecologia não se baseia em leis rígidas e imutáveis como a física ou a química. Em vez disso, opera sob princípios e regras gerais que guiam as estudo sobre interações entre os organismos e seu ambiente. Uma dessas regras fundamentais é:

  • O número de indivíduos detectados aumenta com o esforço amostral.

Por exemplo, quanto mais dias você amostrar, mais indivíduos você verá.

Figura 4: Número de indivíduos acumulados ao longo do tempo.

Figura 4 mostra como o número de indivíduos detectados aumentou ao longo do tempo.

Numa escala mais detalhada, o tempo gasto na busca a cada dia também afetará o número de indivíduos detectados.

Figura 5: Número de indivíduos e tempo de busca.

O tempo gasto na busca tem um forte efeito no número de indivíduos registrados (Figura 5). E este efeito é muito mais importante para determinar o número de indivíduos registrados do que se foi fornecida comida extra ou não. Isto reforça a importância de padronizar o esforço amostral.

Lembrando, esses totais de indivíduos registrados não representam a população, pois não levam em conta perdas (por mortalidade ou adoção) ou aumentos (nascimentos e imigração). Para quantificar o tamanho e a estrutura de uma população devemos adotar técnicas mais robustas, como a marcação-recaptura (Buckland, Goudie, e Borchers (2000), Buckland et al. (2023)).

Rarefação

Quantos dias são necessários para contar os animais domésticos no campus Marco Zero?

A rarefação responde a esta pergunta. Os totais acumulados (Figura 4) não representam a população, mas podem ser usados para entender quantos dias são necessários para amostrar a população. A técnica de rarefação interpola amostras grandes para comparações com amostras menores. Podemos subamostra repetidamente o número total de indivíduos e calcular o número médio de indivíduos por dia. As curvas resultantes com dias no eixo horizontal e número de indivíduos no eixo vertical exibem o número de indivíduos esperados em subamostras de qualquer número de dias.

….. a ser completado ………..

Figura 6: Curvas de rarefação baseada no número de indivíduos acumulados ao longo do tempo. As linhas horizontais mostram o número total de indivíduos registrados.

Se a maioria dos indivíduos já tiver sido registrados, a curva de rarefação deve se estabilizar, ou seja, atingir uma assíntota (valor máximo) e achatar-se. Após 26 dias, o registro de indivíduos ainda não parece completo para gatos (Figura 6). O tempo mínimo para atingir uma contagem “completa” de cães no intervalo de confiança superior é de 8 dias. Para gatos, o tempo mínimo é de 7 dias. Isso parece muito tempo, considerando a quantidade de animais e o tamanho do campus universitário. Para reduzir o número de dias necessários existem pelo menos duas opções:

  • Aumentar o número de pessoas monitorando a cada dia.

  • Melhorar os métodos utilizados para monitorar os animais domésticos.

Os resultados apresentados no Figura 6 não considera alterações na população devido ao recrutamento (nascimentos). O padrão na acumulação de indivíduos pode ser, pelo menos em parte, causado pelos nascimentos nas populações. Como o monitoramento após o fornecimento de alimentos adicionais durou mais tempo, os nascimentos poderiam criar um viés na comparação antes-depois, onde espera-se mais nascimentos durante mais tempo depois o fornecimento de alimentos. Este viés potencial na amostragem pode ser controlado repetindo a análise usando apenas os adultos registrados.

Figura 7: Curvas de rarefação baseada no número de indivíduos adulto acumulados ao longo do tempo. As linhas horizontais mostram o número total de indivíduos registrados.

Considerando apenas os adultos, parece que o número acumulado de indivíduos atinge a assíntota apos de 12 dias para o monitoramento dos cães e gatos Figura 7. O tempo mínimo para atingir uma contagem “completa” de cães no intervalo de confiança superior é de 9 dias. Para gatos adultos, o tempo mínimo é de 5 dias.

O número de animais domésticos que detecta pode dever-se simplesmente ao aumento da atividade devido à alimentação, não refletindo necessariamente uma mudança na população. A rarefação permite comparar amostras com diferentes números de dias e total de indivíduos registrados (antes e depois da alimentação), subamostrando aleatoriamente cada conjunto de dados.

  • Se as curvas antes e depois se sobrepuserem significativamente, isso sugere que o fornecimento de alimentos adicionais não alterou significativamente o número de animais domésticos utilizando a área.
  • Se a curva após a introdução alimentar for consistentemente maior do que antes, isso sugere um possível aumento no número de animais domésticos utilizando a área devido à fonte de alimento.
Figura 8: Comparação de indivíduos registrados antes e depois do fornecimento de alimentos adicionais. Curvas de rarefação baseada no número de indivíduos acumulados ao longo do tempo.

A comparação mostra que, com a mesma número de dias de busca, um número maior de indivíduos foi registrado após o fornecimento de alimentos adicionais (Figura 8). Este não é um resultado desejado.

Mas, antes de tirar conclusões precipitadas é necessário rodar comparações estatísticas, e, além disso avaliar:

  • Diferenças no esforço amostral (número de pessoas, observadores principais, distâncias, tempo gasto).

  • Variação e erros na coleta e entrada de dados.

  • Variação temporal: estação seca (antes) e chuvosa (depois).

  • Melhorias na metodologia de monitoramento.

Indivíduos Acumulados e Esforço de Amostragem em Populações

Ao compreender como os indivíduos acumulados influenciam os métodos e resultados obtidos de captura-recaptura, você pode projetar um plano de amostragem que forneça uma estimativa confiável do tamanho da população com um esforço razoável (Buckland, Goudie, e Borchers (2000), Buckland et al. (2023)).

Veja como o conceito de indivíduos acumulados se traduz na determinação do esforço amostral para uma população:

  • O desafio: estimar o tamanho da população
    Imagine que você deseja estimar o número total de cães no campus universitário (tamanho da população). Contar todos os cães é quase impossível, especialmente se você deseja estabelecer um monitoramento de longo prazo. Então, você recorre à amostragem - monitorando e fotografando cães que você vê em dias diferentes.

Mas quantos cães você precisa fotografar para ter uma boa ideia da população total?

Indivíduos Acumulados e Captura-Recaptura:

Um método comum usa captura-recaptura. Você fotografa e identifica os cães. Depois, você repete o monitoramento em outro dia/mês. A proporção de indivíduos previamente fotografados na sua nova amostra ajuda a estimar o tamanho total da população. É aqui que entram os indivíduos acumulados:

  • Mais Capturas, Melhores Estimativas:
    Quanto mais cães você fotografar e recapturar (obter múltiplas fotos do mesmo indivíduo em dias diferentes), mais precisa se tornará sua estimativa do tamanho da população. Com um tamanho amostral maior (mais indivíduos acumulados), a proporção de animais fotografados torna-se um reflexo mais confiável da população geral.

Planejando seu esforço de amostragem:

  • Tamanho da amostra e confiança:
    Existem fórmulas estatísticas que relacionam o número de indivíduos capturados e recapturados com o tamanho estimado da população e uma medida de confiança nessa estimativa. À medida que o número de indivíduos acumulados aumenta, o intervalo de confiança em torno da estimativa do tamanho da população diminui.

  • Atingindo um Limiar:
    Chega um ponto em que capturas adicionais (fotos do mesmo indivíduo) proporcionam retornos decrescentes. Ao analisar os dados de captura-recaptura, você pode estimar quando capturou/fotografou indivíduos suficientes para obter uma estimativa suficientemente precisa do tamanho da população.

….. a ser completado ………..

Bibliografia

Belo, Vinícius Silva, Guilherme Loureiro Werneck, Eduardo Sérgio da Silva, David Soeiro Barbosa, e Claudio José Struchiner. 2015. “Population Estimation Methods for Free-Ranging Dogs: A Systematic Review”. Editado por Juliane Kaminski. PLOS ONE 10 (12): e0144830. https://doi.org/10.1371/journal.pone.0144830.
Buckland, S. T., D. L. Borchers, T. A. Marques, e R. M. Fewster. 2023. “Wildlife Population Assessment: Changing Priorities Driven by Technological Advances”. Journal of Statistical Theory and Practice 17 (2). https://doi.org/10.1007/s42519-023-00319-6.
Buckland, S. T., I. B. J. Goudie, e D. L. Borchers. 2000. “Wildlife Population Assessment: Past Developments and Future Directions”. Biometrics 56 (1): 1–12. https://doi.org/10.1111/j.0006-341x.2000.00001.x.
Christie, Alec P., Tatsuya Amano, Philip A. Martin, Gorm E. Shackelford, Benno I. Simmons, e William J. Sutherland. 2019. “Simple Study Designs in Ecology Produce Inaccurate Estimates of Biodiversity Responses”. Editado por Júlio Louzada. Journal of Applied Ecology 56 (12): 2742–54. https://doi.org/10.1111/1365-2664.13499.
Crist, Eileen, Camilo Mora, e Robert Engelman. 2017. “The Interaction of Human Population, Food Production, and Biodiversity Protection”. Science 356 (6335): 260–64. https://doi.org/10.1126/science.aal2011.
Kilgour, R. J., S. B. Magle, M. Slater, A. Christian, E. Weiss, e M. DiTullio. 2016. “Estimating Free-Roaming Cat Populations and the Effects of One Year Trap-Neuter-Return Management Effort in a Highly Urban Area”. Urban Ecosystems 20 (1): 207–16. https://doi.org/10.1007/s11252-016-0583-8.
Ma, Gemma C, Ann-Margret Withers, Jessica Spencer, Jacqueline M Norris, e Michael P Ward. 2020. “Evaluation of a Dog Population Management Intervention: Measuring Indicators of Impact”. Animals 10 (6): 1061. https://doi.org/10.3390/ani10061061.
Miller, Philip S., John D. Boone, Joyce R. Briggs, Dennis F. Lawler, Julie K. Levy, Felicia B. Nutter, Margaret Slater, e Stephen Zawistowski. 2014. “Simulating Free-Roaming Cat Population Management Options in Open Demographic Environments”. Editado por Benjamin Lee Allen. PLoS ONE 9 (11): e113553. https://doi.org/10.1371/journal.pone.0113553.
Williams, Byron K., e Eleanor D. Brown. 2019. “Sampling and Analysis Frameworks for Inference in Ecology”. Editado por Rachel McCrea. Methods in Ecology and Evolution 10 (11): 1832–42. https://doi.org/10.1111/2041-210x.13279.
Wittemyer, George, Paul Elsen, William T. Bean, A. Coleman O. Burton, e Justin S. Brashares. 2008. “Accelerated Human Population Growth at Protected Area Edges”. Science 321 (5885): 123–26. https://doi.org/10.1126/science.1158900.
Zuur, Alain F., Elena N. Ieno, e Chris S. Elphick. 2009. “A Protocol for Data Exploration to Avoid Common Statistical Problems”. Methods in Ecology and Evolution 1 (1): 3–14. https://doi.org/10.1111/j.2041-210x.2009.00001.x.