Já sabemos que:
\(\theta_i=-\frac{1}{\mu_i}\); \(b'(\theta_i)=\log(\mu_i)=-\log(-\theta_i)\)
\(\tilde\theta_i=-\frac{1}{y_i}\); \(b'(\tilde\theta_i)=\log(y_i)\)
\(\hat\theta_i=-\frac{1}{\hat\mu}\); \(b(\hat\theta_i)=\log(\hat\mu_i)\)
Então
\[D^{*}(y,\hat\mu)=\phi D(y,\hat\mu)\]
Para \(D(y,\hat\mu)\) temos
\[D(y,\hat\mu)=2\sum^{n}_{i=1} \left \{ y_i\left [-\frac{1}{y_i}+\frac{1}{\hat\mu_i} \right ]+\log(\hat\mu_ì)-\log(y_i) \right \} \]
\[=2\sum^{n}_{i=1} \left \{ y_i\left [\frac{-\hat\mu_i+y_i}{y_i \hat\mu_i} \right ]+\log \left ( \frac{\hat\mu_ì}{y_i} \right ) \right \}\]
\[=2\sum^{n}_{i=1} \left \{ \frac{-\hat\mu_i+y_i}{\hat\mu_i}+\log \left ( \frac{\hat\mu_ì}{y_i} \right ) \right \}\]
Se algum componente de \(y_i\) é igual a zero o desvio fica indeterminado. McCullagh e Nelder (1989) sugerem substituir \(D(y,\hat\mu_i)\) nesse caso por
\[D^{*}(y,\hat\mu_i)=2\phi C(y)+ 2\phi \sum^{n}_{i=1} \log(\hat\mu_i)+ 2\phi \sum^{n}_{i=1}y_i/ \hat\mu_i,\]
em que \(C(y)\) é uma função arbitrária, porém limitada. Por exemplo, podemos usar \(C(y)= \sum^{n}_{i=1}\frac{y_i}{(1+y_i)}\).