Ciência de Dados contra a não linearidade e dependência de modelos
“The Dangers of Extreme Counterfactuals” (King & Zeng, 2006)
As faixas de analfabetismo mais altas (15–20% e 20%+) representam regiões do espaço amostral onde há menos municípios, maior heterogeneidade e maior distância dos dados centrais.
São regiões onde qualquer inferência tende a ser mais “model dependent”, pois há menos evidência empírica sustentando generalizações.
Ao combinar o IPS, ampliou-se o suporte empírico e tornou-se possível modelar a relação não linear entre analfabetismo e comportamento eleitoral, aproximando as estimativas de um regime de interpolação, menos especulativo e mais fundamentado nos dados observados.
De maneira a reduzir a dependência de modelo descrita por King e Zeng (2006).
(intencionalmente deixado em branco)
Orientação: Prof. Cadu e Profa. Laura