PM 2.5 no estado de Pernambuco: Um estudo de viés entre duas fontes de medição

Pedro Frazão Dutra (Universidade Federal Fluminense)

Introdução

O presente estudo tem como objetivo principal avaliar a discrepância e o viés entre duas fontes de estimativas de material particulado fino (PM2.5) – o sensoriamento remoto do CAMS e o de Donkelar – no estado de Pernambuco. Para tal, será conduzida uma análise descritiva comparativa, abordando a distribuição espacial, a sazonalidade, o grau de associação e as dinâmicas temporal e espaço-temporal de ambas as fontes de dados. Adicionalmente, será investigada a distribuição das diferenças (viés) entre as medições. O escopo temporal da análise compreende os anos de 2022 e 2023.

1. Análise geográfica da concentração de PM 2.5

Para a visualização da distribuição espacial do PM 2.5, foi realizada a junção dos dados de emissão média anual de material particulado fino com as bases de dados geoespaciais dos municípios de Pernambuco.

1.1. Mapas da Fonte Donkelar e CAMS em 2022

Nota-se que, para o ano de 2022, em um subconjunto específico de municípios pernambucanos, as estimativas médias produzidas pelo CAMS apresentaram valores superiores aos do Donkelar, resultando em uma reclassificação da qualidade do ar (para um nível superior/pior) nestas localidades. Em um grupo mais restrito de municípios, as medições do CAMS foram inferiores às do Donkelar, chegando a diferir em duas ou mais categorias da escala de qualidade.

1.2. Mapas da Fonte Donkelar e CAMS em 2023

Para o ano de 2023, observa-se uma inversão da tendência, onde as estimativas médias anuais da fonte Donkelar foram consistentemente maiores ou iguais às registradas pelo CAMS em todo o território. A discrepância máxima observada entre as fontes foi de duas categorias na escala de qualidade, registrada especificamente no município de Olinda.

2. Mapas das diferenças

A seção subsequente apresenta os mapas coropléticos que ilustram a diferença absoluta (viés) entre as estimativas médias anuais do CAMS e do Donkelar.

A análise comparativa dos mapas de diferença para 2022 e 2023 indica que, em geral, a fonte Donkelar tende a produzir estimativas superiores às do CAMS. Isto é evidenciado pela predominância de áreas com valores de diferença negativos, que cobrem a maior parte do território estadual em ambos os anos.

3. Análise da Sazonalidade

A análise da sazonalidade das medições em nível estadual, realizada por meio de gráficos de violino e boxplot, sugere que ambas as fontes exibem um comportamento sazonal relativamente estável, com pouca variação intermensal. Contudo, é necessária cautela nesta interpretação, recomendando-se análises mais robustas, dada a notória presença de valores atípicos (outliers) na série de dados da fonte Donkelar.

Um ponto de destaque é que, ao avaliar as distribuições mensais de forma agregada (incluindo todos os municípios), as medições do CAMS parecem ser, em mediana, superiores às do Donkelar. Esta observação, que pode ser aferida pela diferença nas escalas do eixo Y entre os gráficos das duas fontes, contrasta com a análise geográfica anual (Seção 2), que indicou uma tendência oposta. Isso sugere que a agregação temporal e espacial pode influenciar a direção do viés.

3.1 Sazonalidade - Fonte CAMS

3.2. Sazonalidade - Fonte Donkelar

4. Tabelas Resumo

As tabelas subsequentes sumarizam as principais estatísticas descritivas (mínimo, quartis, média, máximo, variância e desvio padrão) calculadas a partir das médias mensais de PM2.5 para cada fonte de dados, segmentadas por ano.

Table 1: Estatísticas descritivas - CAMS
Min P25 P50 Méd P75 Max var sd
PM2.5 (µg/m³) – 2022 2.6 7.7 9.8 10.0 12.2 20.1 12.3 3.5
PM2.5 (µg/m³) – 2023 2.5 6.6 7.6 7.6 8.9 13.1 3.5 1.9
Table 1: Estatísticas descritivas - Donkelar
Min P25 P50 Méd P75 Max var sd
PM2.5 (µg/m³) – 2022 4.4 6.9 7.9 8.3 9.2 19.2 3.8 1.9
PM2.5 (µg/m³) – 2023 3.7 7.5 8.6 8.8 9.9 18.3 3.5 1.9

5. Análise do grau de associação entre as fontes

Nesta seção, as medições mensais de ambas as fontes são comparadas diretamente para avaliar o grau de associação e concordância entre elas.

5.1 Gráfico de Dispersão

O gráfico de dispersão permite uma análise empírica visual da associação entre as duas fontes.

Para avaliar a significância desta associação, aplicou-se o teste de correlação de Spearman, obtendo-se \(p < 0.01\) e \(\hat{\rho} = 0.225\), o que revela uma associação positiva significativa.

5.2 Gráfico de Bland-Altman

Para uma análise mais robusta da concordância foi empregado o método gráfico de Bland-Altman.

No gráfico, é possível notar um padrão de funil (heterocedasticidade), indicando que a variabilidade da diferença entre as medições aumenta conforme a média das medições (magnitude do PM2.5) se eleva. Em outras palavras, as fontes tornam-se mais discrepantes em níveis de poluição mais altos.

5.3 Análise do Viés Médio

Para analisar o viés médio entre as duas fontes, calculamos o intervalo de 95% confiança para a diferença de médias (\(\mu_{CAMS} - \mu_{Donkelar}\)) entre as duas fontes de medição ao longo dois dois anos.

O viés médio observado na amostra foi de 0.287 µg/m³.

O Intervalo de Confiança de 95% para esta média é: \(IC \ 95\% = [\) 0.191 µg/m³ ; 0.382 µg/m³\(]\)

Como o valor zero não está incluído neste intervalo (ambos os limites são positivos), temos forte evidência estatística de que existe um viés sistemático. Conclui-se que as medições do CAMS são, em média, significativamente superiores às do Donkelar quando analisadas de forma pareada mensalmente.

6. Análise temporal

A seguir, é analisada a tendência temporal das médias mensais agregadas de PM2.5 para todo o estado de Pernambuco, comparando as duas fontes.

Observa-se, nesta análise agregada, um padrão temporal distinto entre os anos. Durante a maior parte de 2022, a média estadual mensal estimada pelo CAMS foi superior à do Donkelar. Em 2023, entretanto, essa relação se inverteu.

7. Análise espaço-temporal

Por fim, a análise temporal é combinada com a dimensão espacial, por meio do agrupamento dos municípios por Mesorregião de Pernambuco, visando observar a existência de padrões regionais distintos.

7.1 Análise por Mesorregião

A análise desagregada por mesorregião revela padrões temporais mais complexos e distintos daqueles observados na análise global (agregada para o estado). Destaca-se que em nenhuma mesorregião as séries temporais das duas fontes apresentam concordância plena, reforçando a existência de um viés sistemático e, possivelmente, espacialmente variável.

Referências

Bland, J. M., & Altman, D. G. (1986). Statistical methods for assessing agreement between two methods of clinical measurement. The Lancet, 327(8476), 307-310.

Kloke, J., & McKean, J. W. (2014). Nonparametric Statistical Methods Using R. CRC Press.