Trabalho II - Análise de Dados Categóricos
Vitor Nickhorn Kroeff
GRR20195798
Questão 1
a)
A suposição de independência dos O-rings em cada lançamento é essencial na regressão logística para assegurar a validade. A falta de independência pode distorcer estimativas e violar os pressupostos do modelo, tornando os resultados, como probabilidades, difíceis de interpretar.
b)
## Carregando pacotes exigidos: knitr
challenger <- read.csv(file = "http://leg.ufpr.br/~lucambio/CE073/20222S/challenger.csv")
ajuste <- glm(cbind(O.ring, Number-O.ring) ~ Temp + Pressure, family = binomial(link = "logit"), data = challenger)
coef(ajuste)## (Intercept) Temp Pressure
## 2.520194641 -0.098296750 0.008484021
Então temos: \[log(\frac{\hat\pi}{1- \hat\pi}) = 2,52-0,098.Temp+0,008.Pressure\]
c)
O teste TRV pode ser realizado da seguinte forma:
## Analysis of Deviance Table (Type II tests)
##
## Response: cbind(O.ring, Number - O.ring)
## LR Chisq Df Pr(>Chisq)
## Temp 5.1838 1 0.0228 *
## Pressure 1.5407 1 0.2145
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
d)
De acordo com o teste realizado na alternativa c, a variável não demonstrou significância para o modelo, justificando sua exclusão. No entanto, é importante considerar que um número muito reduzido de variáveis explicativas pode resultar em um modelo muito simplificado.
Questão 4
a)
data <- read.csv(file = "http://leg.ufpr.br/~lucambio/ADC/picloram.csv")
ajuste_picloram <- glm(cbind(kill, total-kill) ~ picloram, family = binomial(link = "logit"), data = data)
coef(ajuste_picloram)## (Intercept) picloram
## -3.459958 2.656715
Então temos:
\[log(\frac{\hat\pi}{1- \hat\pi}) = −3,46+2,66.picloram\]