Plano de Análise — Índice Multidimensional de Pobreza na Amazônia

Protocolo de Pesquisa · Abordagem Sen & Alkire-Foster · Escala PRI-α (Seth & Yalonetzky, 2020)

Documento complementar ao questionário e aos seus Anexos A (recodificação, agregação, dados faltantes) e B (roteiro do grupo focal). Enquanto o questionário é o instrumento de coleta, este documento define o que acontece depois do campo: como transformar respostas em escores, como agregar dimensões, como calcular o índice e como testar a robustez dos resultados.

Referências centrais: Alkire & Santos (2010); Alkire & Foster (2011); Seth & Yalonetzky (2020); Rodrigues (2019); Ellis (2000).

1. Visão geral do fluxo de análise

Dados de campo
   │
   ▼
[1] Limpeza e validação de intervalos plausíveis
   │
   ▼
[2] Recodificação dos indicadores FATO → categorias ordinais / dicotômicas   (Anexo A.3)
   │
   ▼
[3] Tratamento de N/A e dados faltantes                                        (Anexo A.4)
   │
   ▼
[4] Agregação intra-dimensional → escore por dimensão                          (Anexo A.2, sub-pesos)
   │
   ▼
[5] Ponderação entre dimensões: pesos homogêneos E endógenos agregados        (Seção 5)
   │
   ├──► [6A] Caminho A: índice por média ponderada (escores PRI-α)
   │
   └──► [6B] Caminho B: Alkire-Foster (duplo limiar, M₀)
   │
   ▼
[7] Testes de robustez: três escalas PRI-α, dominância estocástica,
    sensibilidade a N/A, sensibilidade a k, reordenação dos pobres
   │
   ▼
[8] Decomposição e relatório

2. Estrutura dos indicadores

Cada dimensão é representada por um escore dimensional composto pelos seus indicadores, conforme os sub-pesos do Anexo A.2. Os indicadores são de dois tipos, que não se misturam no mesmo teste de dominância estocástica:

Tipo	Indicadores	Tratamento
Ordinal de 4 categorias (c₁–c₄)	Antropometria, escolaridade, diversidade alimentar, autossuficiência, segurança alimentar, território (controle/impacto/acesso), autonomia, renda, piso, saneamento, água, bens+energia, participação cultural	Escala PRI-α aplicável; entra no teste de dominância ordinal
Dicotômica (0/1)	Mortalidade infantil, frequência escolar, combustível de cozinha	Entra na contagem de privações Alkire-Foster; não entra no teste de dominância ordinal

Nota sobre o combustível (Q35): mantido como dicotômico por coerência com o MPI global. Caso a equipe decida graduá-lo em 4 níveis (lenha vs. esterco), reclassificá-lo como ordinal e movê-lo para o grupo ordinal — nunca aplicar dominância ordinal a uma mistura de escalas de 2 e 4 níveis.

3. Escala PRI-α (grau de prioridade)

A escala converte as categorias ordinais c₁–c₄ em escores numéricos. A escolha da escala é uma escolha ética: define o quanto se prioriza melhorias nos estratos mais pobres (Seth & Yalonetzky, 2020).

Para uma variável ordinal com categorias c₁ < c₂ < c₃ < c₄, define-se um vetor de valores w = (w₁, w₂, w₃, w₄) com w₁ < w₂ < w₃ < w₄. O grau de prioridade é controlado pelo parâmetro α, que governa o quanto os degraus entre categorias decrescem (escala côncava).

3.1 As três escalas a rodar

Escala	Parâmetro	Vetor w = (w₁, w₂, w₃, w₄)	Interpretação
Linear	sem prioridade	(1, 2, 3, 4)	Todos os degraus valem igual: c₁→c₂ = c₃→c₄ = 1
PRI-MIN	α = 1	(1, 2.5, 3.5, 4)	Prioridade mínima. Degraus decrescentes: 1.5 > 1.0 > 0.5
PRI-MAX	α = 2	(1, 3, 3.8, 4)	Prioridade máxima. Concentra o valor nos degraus inferiores: c₁→c₂ = 2.0

Os vetores PRI-MIN e PRI-MAX acima são os de referência do material do projeto. O essencial é que os degraus sejam decrescentes (c₁→c₂ ≥ c₂→c₃ ≥ c₃→c₄) para satisfazer a propriedade de prioridade mínima (PRI-MIN). Normalizar todos os vetores para o mesmo intervalo (ex.: [1, 4]) antes de comparar.

3.2 Por que rodar as três

Os resultados absolutos dependem da escala escolhida. Rodar as três e verificar se o ordenamento das comunidades se mantém (dominância estocástica — Seção 7.2) é o que dá robustez normativa: se a comunidade A é mais pobre que a B sob todas as escalas, a conclusão não depende da escolha arbitrária de α.

4. Agregação intra-dimensional

O escore de cada dimensão d para o domicílio i é a média ponderada dos seus indicadores ordinais recodificados, usando os sub-pesos do Anexo A.2:

Escore_d(i) = Σ_j  s_dj × W(c_ij)

onde: - s_dj = sub-peso do indicador j dentro da dimensão d (Σ s_dj = 1) - W(c_ij) = valor da escala PRI-α para a categoria observada do indicador j no domicílio i

Os indicadores dicotômicos da dimensão entram com seu valor 0/1 multiplicado pelo respectivo sub-peso (ou, no Caminho B, diretamente na contagem de privações — ver Seção 6).

Indicadores de nível comunitário (D3 inteira; controle de recursos) recebem o mesmo valor para todos os domicílios da comunidade — coletados uma vez por comunidade (Anexo A.1).

Indicador individual feminino (Q25): o escore da dimensão usa a média das mulheres adultas do domicílio.

5. Ponderação entre dimensões

Dois cenários são calculados em paralelo e comparados:

5.1 Cenário 1 — Pesos homogêneos

Cada uma das 8 dimensões recebe peso 1/8 = 0,125. Mais comparável com outros estudos e com o MPI global.

5.2 Cenário 2 — Pesos endógenos agregados

Derivados da hierarquização dos entrevistados (Q45), seguindo Rodrigues (2019). Ponto metodológico crítico:

Os pesos endógenos NÃO são aplicados por domicílio. As prioridades coletadas na Q45 são agregadas no nível da amostra (ou por estrato/comunidade) para produzir UM ÚNICO vetor de pesos λ = (λ₁, …, λ₈), aplicado igualmente a todos os domicílios.

Isso preserva a comparabilidade entre domicílios e o axioma de invariância de população do método Alkire-Foster — que seriam violados se cada domicílio tivesse seu próprio vetor de pesos.

Procedimento de agregação dos pesos: 1. Para cada dimensão, contar a frequência com que foi citada como prioritária (1ª a 4ª) no conjunto da amostra. 2. Atribuir peso proporcional à frequência (ou usar um esquema de pontuação por posição: 1ª = 4 pts, 2ª = 3, 3ª = 2, 4ª = 1). 3. Normalizar para somar 1.

Análise secundária (não entra no índice principal): comparar a hierarquização entre homens e mulheres (dois respondentes da Q45) e entre estratos (ribeirinho/quilombola/indígena) para documentar a variação intra-amostral das prioridades.

6. Cálculo do índice — dois caminhos

6.1 Caminho A — Média ponderada dos escores

Índice(i) = Σ_d  λ_d × Escore_d(i)

Produz um número contínuo por domicílio. Captura intensidade, mas assume substituibilidade entre dimensões (escore alto numa dimensão compensa baixo noutra) — limitação a declarar.

A incidência pode ser obtida definindo um limiar de pobreza sobre o índice contínuo (ex.: índice < 2,5 numa escala 1–4).

6.2 Caminho B — Alkire-Foster (recomendado como principal)

Método de duplo limiar, consistente com a leitura de complementaridade de Sen.

Passo 1 — Limiar de privação (z_d) por dimensão. Um domicílio é privado na dimensão d se seu escore dimensional ficar abaixo do corte. Convenção: escore < 2,5 numa escala 1–4 → privado (variável binária g_d = 1). Para indicadores dicotômicos, a privação já é direta (0/1).

Passo 2 — Contagem ponderada de privações.

c(i) = Σ_d  λ_d × g_d(i)

Passo 3 — Limiar de pobreza (k). O domicílio é multidimensionalmente pobre se c(i) ≥ k. Recomendação: k = 3/8 das dimensões (equivalente a 0,375 com pesos homogêneos), próximo do corte de 33,3% do MPI global. Testar k ∈ {2/8, 3/8, 4/8} na análise de sensibilidade.

Passo 4 — Medidas agregadas (família M₀): - H (incidência): proporção de domicílios pobres = q / n - A (intensidade): média, entre os pobres, da proporção ponderada de privações - M₀ = H × A: índice de pobreza multidimensional ajustado

Decomposições: M₀ é decomponível por (a) subgrupo populacional — comunidade, etnia, estrato — e por (b) contribuição de cada dimensão/indicador. Reportar ambas, pois orientam política pública.

7. Testes de robustez (obrigatórios)

7.1 Três escalas PRI-α

Recalcular todos os resultados (H, A, M₀, ranking de comunidades) sob as escalas Linear, PRI-MIN e PRI-MAX (Seção 3.1).

7.2 Dominância estocástica

Para cada par de comunidades, verificar se o ordenamento de pobreza se mantém sob todas as escalas admissíveis (não só as três pontuais). Se a comunidade A domina a B (é inequivocamente mais pobre) sob toda escala com degraus decrescentes, o resultado é robusto à escolha de α. Onde não houver dominância, reportar a inconclusividade honestamente — não forçar um ranking. Aplicar apenas às variáveis ordinais de 4 categorias (não às dicotômicas).

7.3 Sensibilidade a dados faltantes / N/A

Recalcular H, A e M₀ sob as convenções alternativas do Anexo A.4: - (i) N/A = não-privado (convenção adotada) vs. (ii) exclusão da dimensão com renormalização dos pesos. - Imputação pela mediana do estrato vs. exclusão de domicílios com >1/3 de dados faltantes. - Reportar a taxa de imputação e o quanto cada escolha desloca a incidência.

7.4 Sensibilidade ao limiar k

Reportar H, A e M₀ para k ∈ {2/8, 3/8, 4/8}.

7.5 Pesos homogêneos vs. endógenos — reordenação dos pobres

Não basta reportar que a incidência muda (Rodrigues 2019: 75% → 55%). Reportar também se a ordenação das comunidades/domicílios se mantém — isto é o que importa para focalização de política pública. Usar correlação de ranking (Spearman) entre os dois cenários e identificar quais unidades trocam de posição e por quê (ex.: dimensões de peso alto que penalizam grupos específicos).

8. Sazonalidade

A coleta registra a estação (Q21) e o período mais crítico do ano. Na análise: - Tratar a estação da coleta como variável de controle. - Se houver coleta em duas estações, comparar os escores das dimensões sensíveis (alimentação, território, renda) entre cheia e vazante para distinguir choque sazonal de privação estrutural. - Não interpretar privação observada na vazante como privação permanente sem essa verificação.

9. Coleta eletrônica e qualidade (recomendação operacional)

Recomenda-se fortemente coleta eletrônica (KoboToolbox, ODK ou SurveyCTO — gratuitos, funcionam offline) com: - Validação de intervalos plausíveis em tempo real (ex.: peso de criança, idade × série escolar) — evita erros que a recodificação em escritório não detecta. - Cálculo automático de z-scores antropométricos no momento da coleta. - Campos obrigatórios de motivo para antropometria não medida.

Se a coleta em papel for inevitável, incluir folha de cálculo intermediário (z-scores por criança) e uma checagem de intervalos antes de sair do domicílio.

10. Itens a fixar antes do campo (decisões pendentes)

Estas decisões devem ser tomadas e documentadas antes da coleta principal, idealmente após o grupo focal piloto (Anexo B):

Sub-pesos intra-dimensionais — confirmar ou revisar os valores propostos no Anexo A.2.
Esquema de agregação dos pesos endógenos — proporção por frequência ou pontuação por posição (Seção 5.2).
Limiar k — valor principal e faixa de sensibilidade (Seção 6.2).
Convenção de N/A — confirmar a regra do Anexo A.4 como principal.
Linhas de renda — atualizar os cortes da Q28 conforme os valores vigentes no ano de campo.
Cortes das categorias ordinais — validar/ajustar com o card sorting do grupo focal (Anexo B, Bloco 3).
Estação(ões) de coleta — definir se haverá coleta em uma ou duas estações.

11. Limitações a declarar no relatório

O índice mede funcionamentos e acessos como proxies de capacitações (não capacitações puras, que são não-observáveis) — prática padrão da abordagem Alkire-Foster.
O Caminho A assume substituibilidade entre dimensões; o Caminho B assume complementaridade. Reportar ambos e explicitar o pressuposto.
Lista de dimensões e pesos endógenos customizados reduzem a comparabilidade com o MPI global da OPHI — daí a importância de rodar também o cenário de pesos homogêneos.
Dimensões coletivas (território, parte da autonomia) são parcialmente irredutíveis ao domicílio; tratadas no nível comunitário onde indicado, mas com perda de informação reconhecida.