Ejercicio 1

Se eligió un modelo Poisson pues es claramente un problema de conteo, en este caso se cuenta el número de fibras de asbesto que quedan atrapadas en un filtro. Nuestro estimador será \(\lambda\).

Para la siguiente parte de este ejercicio basta probar que \(T < w_{1-\alpha}\) donde \(T = \sum_{i=1}^k \frac{(O_i-Ei)^2}{E_i}\) y \(w_{1-\alpha}\) es el cuantil \(1-\alpha\) de una distribución \(\chi^2_{(n)}\). Notemos que para este ejercicio hay 7 celdas y se estimó 1 parámetro por lo que los grados de libertad de la distribución seran \(n=7-1-1=5\). Por otro lado el nivel de significancia es de .05 así que el cuantil que buscamos es el .95.

En el ejercicio \(T = 35.49\) ya fue calculada y \(w_{.95} = 11.0705\) como \(T>w_{.95}\) decimos que el modelo no es adecuado por el criterio de la prueba de \(\chi ^2\)

Ejercicio 2

Empezamos por ajustar el modelo

# Aplicación de Modelo

modelo <- glm(incidents ~ offset(log(service)) + type + year + period , family = poisson , data = datos )
summary(modelo)
## 
## Call:
## glm(formula = incidents ~ offset(log(service)) + type + year + 
##     period, family = poisson, data = datos)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.5348  -0.9319  -0.3686   0.4654   2.8833  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -10.079076   0.876149 -11.504  < 2e-16 ***
## typeB        -0.546090   0.178415  -3.061 0.002208 ** 
## typeC        -0.632631   0.329500  -1.920 0.054862 .  
## typeD        -0.232257   0.287979  -0.807 0.419951    
## typeE         0.405975   0.234933   1.728 0.083981 .  
## year          0.042247   0.012826   3.294 0.000988 ***
## period        0.023705   0.008091   2.930 0.003392 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 146.328  on 33  degrees of freedom
## Residual deviance:  59.375  on 27  degrees of freedom
## AIC: 171.24
## 
## Number of Fisher Scoring iterations: 5
# Bondad de Ajuste 

modelChi <- modelo$null.deviance - modelo$deviance
chidf <- modelo$df.null - modelo$df.residual
chisq.prob <- 1 - pchisq(modelChi, chidf)
chisq.prob
## [1] 1.110223e-16

Tanto de las variables obtenidas en el modelo como del resultado de la bondad de ajuste opdemos decir que nuestro modelo es estadísticamente significativo. Por lo que en ese sentido es un buen modelo.

Sin embargo si analizamos un poco más veremos que la devianza obtenida es de 146.238 con 33 grados de libertad, el cociente de ambas cantidades nos da 4.43 que al estar alejado de 1 indica que el modelo no ajusta bien los datos. Utilizando \(R_{pseudo}^2 = \frac{null \hspace{2mm} deviance - residual \hspace{2mm} deviance}{null \hspace{2mm} deviance}=0.59\) lo que indica que las variables explican aproximadamente el 59% de la variabilidad del número incidentes. Esto nos dice que en este aspecto el modelo no es tan bueno.

Dado que la variable service varía mucho en cada caso, el uso de offset() es buena idea pues nos interesa más la tasa ya que no es lo mismo tener 10 incidentes en 3 meses de servicio que tener 10 incidentes en 300 meses de servicio. Esto permitirá que el modelo se ajuste mejor.