Este tutorial apresenta as diferenças na especificação e interpretação entre interação multiplicativa e aditiva no contexto de modelos de regressão de Poisson. Para isso, considera-se a interação entre um fator binário e um fator de interesse com três categorias (por exemplo, setor censitário rural, codificado como SIM=1 / NÃO=0; e cor ou raça, codificado como Preta, Parda e Branca, respectivamente).
Assumimos que o preditor linear consiste em um número fixo (digamos, p-3) de covariáveis de controle, 1 fator binário e 1 fator de interesse de três categorias, totalizando p covariáveis todas juntas.
\[ \log(\lambda|X) = \beta_0 + \beta_1 X_1 + \cdots + \beta_{p-2} X_{p-2} + \beta_{p-1} X_{p-1} + \beta_p X_p \]
Onde \(X_{p-2}\) representa o fator binário, enquanto \(X_{p-1}\) e \(X_p\) representam as 2 categorias do fator de 3 categorias. Portanto, \(X_{p-1}\) e \(X_p\) são variáveis binárias ortogonais, ou seja, \(X_{p-1} \cdot X_p = 0\) para cada observação.
Comparado ao modelo anterior, aqui adicionamos um termo de interação multiplicativo. Basicamente, este é um modelo como o anterior, mas adicionando dois termos extras correspondentes ao produto do fator binário com cada variável fictícia representando as 2 categorias do fator de três categorias.
\[ \log(\lambda|X) = \beta_0 + \beta_1 X_1 + \cdots + \beta_{p-2} X_{p-2} + \beta_{p-1} X_{p-1} + \beta_p X_p + \gamma_{mi} X_{p-2} X_{p-1} + \delta_{mi} X_{p-2} X_p \]
Note que este modelo é um caso particular de um modelo de efeitos principais e interação com relação a 3 variáveis fictícias, já que 2 das 3 variáveis fictícias são ortogonais (como acima). Isso faz com que a interação tripla seja igual a zero, ou seja:
\[ X_{p-2} \cdot X_{p-1} \cdot X_p = 0, \quad \text{assim como} \quad X_{p-1} \cdot X_p = 0 \quad \text{para cada observação.} \]
Suponha 5 novas covariáveis binárias definidas como segue:
Agora, vamos supor o seguinte modelo:
\[ \log(\lambda|X) = \beta_0 + \beta_1 X_1 + \cdots + \beta_{p-2} Y_{p-2} + \beta_p^{(1)} Y_p^{(1)} + \beta_p^{(2)} Y_p^{(2)} + \beta_{ai}^{(1)} Y_{1i}^{(1)} + \beta_{ai}^{(2)} Y_{ai}^{(2)} \]
Curiosamente, os modelos (ii) e (iii) são equivalentes; eles diferem apenas na parametrização. No entanto, a interpretação dos coeficientes sob esses modelos é diferente.
Existem apenas 4 combinações possíveis de valores de \(X_{p-1}\) e \(X_p\), a saber:
\[ RR_{X_{p-1} (1|0)} = e^{\beta_{p-1}} \]
\[ RR_{X_p (1|0)} = e^{\beta_p} \]
\[ RR_{mi(1|0)} = e^{\beta_p} \cdot e^{\beta_{p-1}} \cdot e^{\beta_{mi}} = e^{\beta_p + \beta_{p-1} + \beta_{mi}} \]
\[ RR_{Y_{p-1} (1|0)} = e^{\beta_{p-1}} \]
\[ RR_{Y_p (1|0)} = e^{\beta_p} \]
\[ RR_{ai(1|0)} = e^{\beta_{ai}} \]
É fácil ver que em ambos os modelos, se \(X_{p-1} = 1\) e \(X_p = 1\), então:
\[ RR_{mi(1|0)} = RR_{ai(1|0)} \]
Consequentemente:
\[ e^{\beta_p + \beta_{p-1} + \beta_{mi}} = e^{\beta_{ai}} \]