Diferenças em Diferenças, ou simplesmente DiD, tem por objetivo comparar a variação no tempo da variável de resultado entre tratamento e controle, sendo assim, essa é uma combinação de:
uma comparação transversal (comparar uma amostra que foi tratada com um grupo de controle não tratado)
uma comparação temporal (comparar o grupo de tratamento com ele mesmo, antes e depois do tratamento)
A diferença antes e depois no grupo de tratamento recebe uma correção, levando em conta a diferença antes e depois no grupo de controle, eliminando o problema da tendência. Para obter uma estimativa imparcial do efeito do tratamento, é necessário fazer uma suposição de tendência paralela. Isso significa que, sem a mudança no ambiente, a mudança na variável de resultado teria sido a mesma para os dois grupos (resultado contrafactual).
No Dif-in-Dif não há a necessidade que os mesmos indivíduos sejam repetidos a cada cross-section entretanto, ou seja, não há a necessidade de um painel balanceado. No entanto, alguma agregação que faça sentido tem der possível, isto é os indivíduos dos grupos de controle e tratamento têm de pertencer a algum grupo em que a agregação seja palatável.
Pode ser usado tanto num contexto de dados experimentais e não-experimentais, bem como na situação de um quase-experimento:
Dados experimentais: participação das unidades no grupo de tratamento ou controle é feita de maneira aleatória como, por exemplo, em ensaios clínicos;
Dados não experimentais: participação das unidades no grupo de tratamento ou controle é feita com base em algum critério de seleção como, em geral, definição de grupos alvo por políticas públicas. Geralmente a participação no grupo de tratamento está atrelada ao nível da variável resposta;
Quase-experimento: situação em que a ocorrência de um evento é não-esperada e permite gerar grupos de tratamento e controle de forma automática. Esses eventos podem ter origem em mudanças que ocorrem na própria natureza, alterações institucionais (não correlacionadas com a variável resposta). Em suma, variações exógenas ao que se está estudando é que determina ou não em que grupo a unidade estará
- A principal pergunta aqui é: o que teria acontecido com as unidades tratadas se não tivessem recebido tratamento? Ou seja: se tivéssemos um contrafactual, |
- Se pudéssemos observar tal situação conseguiríamos estimar com precisão o efeito de um tratamento qualquer sobre as unidades. |
- O problema fundamental da inferência causal é que os possíveis resultados potenciais no contrafactual não podem ser observados. Podemos estimar funções desse contrafactual usando outras observações. Isso é o que chamamos de grupo de controle. Um conjunto de unidades que não receberam o tratamento mas que mimetizam o comportamento dos tratados, |
- A validade da abordagem DiD está intimamente relacionada à semelhança entre o grupo de tratamento e o grupo de controle. |
- Principal hipótese: trajetória temporal da variável de resultado para o grupo de controle representa o que teria ocorrido com variável de resultado dos tratados na ausência do tratamento: Common Trend Hypothesis ou Tendências paralelas. |
Por quê usar grupos de controle é tão importante?
Quando se vai analisar o efeito de uma intervenção a primeira curiosidade que vem à mente é: vamos comparar como os indivíduos estavam antes e como estão agora,
Embora seja fácil, e tentador, realizar essa análise ela pode (e provavelmente deverá) produzir resultados ruim. Vejamos um exemplo:
- Entre 2002 e e 2003 o número de casos de tuberculose nas comunidades do Rio de Janeiro estavam aumentando,
- Em meados de 2003 o governo implementa o programa DOTS, que tem por objetivo diagnosticar e tratar os caso,
- Regitrou-se o tamanho da população sob risco e o número de casos,
- Esses registros foram realizados entre abril e outubro de cada ano
FIGURA
Qual o efeito real do programa?
Compara o antes e o depois pode ser errôneo pois os fenômenos sofrem de trajetória prévia, provocada por outros fatores, que nem sempre conseguimos controloar (confound factors)
Assim, por mais que controlemos por tudo aquilo que achamos relevante, sempre pode existir um fator não controlado e não observado que afeta o fenômeno
Se não isolarmos corretamente esse efeito nossa medição acerca dos impactos do programa estará viesada!
A solução é procurar um bom grupo de controle! Por bom grupo de controle entende-se obsevações que apresentem trajetória temporal da variável de resultado \(Y\) similar ao grupo de tratamento. Em outra palavras: Tendências paralelas.

Notação: \[ Y_{T,0} \ \text{: representa a variável de interesse do grupo de tratamento antes da interveção,}\] \[ Y_{T,1} \ \text{: representa a variável de interesse do grupo de tratamento depois da interveção,}\] \[ Y_{C,0} \ \text{: representa a variável de interesse do grupo de controle antes da interveção,}\] \[ Y_{C,1} \ \text{: representa a variável de interesse do grupo de controle depois da interveção}\]
Vamos assumir que cada grupo tenha seu prórprio nível (ou efeito fixo):
- \(\alpha_C\): nível para grupo de controle,
- \(\alpha_T\): nível para grupo de tratamento,
Vamos supor que essas observações sofram de uma trajetória prévia comum denotada por \(\gamma\).
Asuuma que o verdadeiro efeito da intervenção é o parâmetros \(\delta\).
Desta forma, vamos considerar os seguintes valores para a variável de interesse:
\(Y_{C,0} = \alpha_C + u_{C,0}\): Valor para grupo de controle antes da interveção;
\(Y_{T,0} = \alpha_T + u_{C,0}\): Valor para grupo de trantamento antes da interveção;
\(Y_{C,1} = \alpha_C + \gamma + u_{C,1}\): Valor para grupo de controle pós interveção;
\(Y_{T,1} = \alpha_T + \gamma + \delta + u_{T,1}\): Valor para grupo de tratamento pós interveção;
Se considerarmos apenas os tratados antes e depois estamos calculando o seguinte efeito:
\[ Y_{T,1} - Y_{T,0} = (\alpha_T + \gamma + \delta + u_{T,1}) - (\alpha_T + u_{C,0})\] \[ Y_{T,1} - Y_{T,0} = (\gamma + \delta + u_{T,1} - u_{C,0})\] * Se tomarmos a esperança:
\[ E[Y_{T,1} - Y_{T,0}] = E[(\gamma + \delta + u_{T,1}) - (\alpha_T + u_{T,0})] = \gamma + \delta\]
O resultado final fica poluído pela trajetória prévia,
Desta forma, precisamos de uma dupla diferença para remover o parâmetro \(\delta\):
\[ (Y_{T,1} - Y_{T,0}) - (Y_{C,1} - Y_{C,0}) = \] \[ [(\alpha_T + \gamma + \delta + u_{T,1}) - (\alpha_T + u_{T,0})] - [(\alpha_C + \gamma + u_{C,1}) - (\alpha_C + u_{T,0})] = \] \[ \delta + u_{T,1} - u_{T,0} - u_{C,1} + u_{T,0} \] \[ E[\delta + u_{T,1} - u_{T,0} - u_{C,1} + u_{T,0}] = \delta\]
No formato de uma regressão, a equação de um modelo diff-in-diff fica:
\[Y_{s,t}= \alpha_C + \alpha_T Treatment_s + \gamma d_t + \delta(Treatment \times d_t) + \beta X_{s,t} + u_{s,t}\]
onde \(s = (C,T)\) representa o índice de indivíduo, \(t = \{1,\ldots,T\}\) é o índice de tempow e:
Treatment é uma dummy que igual a to 1 se a observação pertence ao grupo de tratamento,
\(d_t\) é uma dummy que é igual a para o período anterior ao tratamento para cada unidade,
\(X_{s,t}\) são variáveis de controle.