dança
Este script tem o objetivo de fazer a análise quantitativa da
metodologia de uma variável do tipo Poisson.
Inicialmente foi realizada uma análise exploratória dos dados do Censo
Escolar do estado do Tocantins para saber o perfil dos estudantes com
deficiência matriculados na rede escolar.
# Regressao Poisson
# 1. acotes necessarios (Listar todos aqui)
library(stats) # para testes estatisticos do modelo
library(mfx) # para o efeito marginal das variaveis
library(MASS) # para avaliacao da matriz de confusao do modelo
library(openxlsx) # para exportacao de dados em Excel
library(dplyr) # para organizacao dos dados
library(ggplot2) # para construcao de graficos
library(tidyr) # para organizacao dos dados
library(broom) # melhor exposição dos resultados
library(tidyverse) # para organização dos dados
library(ResourceSelection) # selecao dos criterios de informacao
library(DHARMa) # diagnostico dos residuos do modelo
library(psych) # para estatisticas descritivas
library(ggplot2) # para construcao de graficos
library(car) # para analise de regressao
library(pROC) # para a construcao da Curva ROC
library(readxl) # para leitura dos dados
# 1.1 - Mudando o Diretorio
setwd("C:/Users/mvmar/Documents/Portfolios/Censo_Escolar_TO")
# 2 - Carregando os Dados:
dados <- read_excel("base.xlsx", sheet = "dados")
dados20 <- subset(dados, dados$ano == 2020)
dados21 <- subset(dados, dados$ano == 2021)
# 3. - Estatisticas descritivas
descritivas20 <- psych::describe(dados20[,7:18], quant = c(0.25, 0.75))
descritivas20
## vars n mean sd median trimmed mad min max range
## alunos_incluidos 1 1204 10.87 12.59 6 8.46 7.41 0 104 104
## surdez 2 1204 0.18 0.54 0 0.04 0.00 0 6 6
## surdocegueira 3 1204 0.00 0.07 0 0.00 0.00 0 1 1
## baixa_visao 4 1204 0.88 1.66 0 0.54 0.00 0 23 23
## cegueira 5 1204 0.05 0.25 0 0.00 0.00 0 2 2
## deficiencia_auditiva 6 1204 0.38 1.03 0 0.15 0.00 0 13 13
## deficiencia_fisica 7 1204 1.36 2.95 1 0.83 1.48 0 38 38
## deficiencia_intelectual 8 1204 9.93 15.60 4 6.76 4.45 0 199 199
## deficiencia_multipla 9 1204 1.11 3.47 0 0.48 0.00 0 46 46
## autismo 10 1204 1.50 2.41 1 0.96 1.48 0 27 27
## superdotacao 11 1204 0.10 0.53 0 0.00 0.00 0 11 11
## especial_exclusiva 12 1204 2.00 13.78 0 0.00 0.00 0 216 216
## skew kurtosis se Q0.25 Q0.75
## alunos_incluidos 2.15 6.33 0.36 2 15
## surdez 4.41 26.76 0.02 0 0
## surdocegueira 14.04 195.34 0.00 0 0
## baixa_visao 5.01 42.94 0.05 0 1
## cegueira 5.41 31.40 0.01 0 0
## deficiencia_auditiva 5.82 50.89 0.03 0 0
## deficiencia_fisica 6.53 55.46 0.08 0 2
## deficiencia_intelectual 4.25 30.09 0.45 1 13
## deficiencia_multipla 7.32 64.07 0.10 0 1
## autismo 3.15 16.57 0.07 0 2
## superdotacao 10.72 169.83 0.02 0 0
## especial_exclusiva 8.48 86.48 0.40 0 0
descritivas21 <- psych::describe(dados21[,7:18], quant = c(0.25, 0.75))
descritivas21
## vars n mean sd median trimmed mad min max range
## alunos_incluidos 1 1209 10.68 12.33 6 8.34 7.41 0 85 85
## surdez 2 1209 0.15 0.53 0 0.01 0.00 0 6 6
## surdocegueira 3 1209 0.01 0.08 0 0.00 0.00 0 1 1
## baixa_visao 4 1209 0.86 1.52 0 0.52 0.00 0 16 16
## cegueira 5 1209 0.06 0.26 0 0.00 0.00 0 3 3
## deficiencia_auditiva 6 1209 0.37 1.02 0 0.14 0.00 0 13 13
## deficiencia_fisica 7 1209 1.31 3.00 1 0.77 1.48 0 40 40
## deficiencia_intelectual 8 1209 9.67 15.49 4 6.53 4.45 0 201 201
## deficiencia_multipla 9 1209 1.09 3.52 0 0.44 0.00 0 45 45
## autismo 10 1209 1.66 2.69 1 1.07 1.48 0 26 26
## superdotacao 11 1209 0.10 0.46 0 0.00 0.00 0 7 7
## especial_exclusiva 12 1209 2.01 13.85 0 0.00 0.00 0 217 217
## skew kurtosis se Q0.25 Q0.75
## alunos_incluidos 2.14 5.98 0.35 2 15
## surdez 5.12 35.12 0.02 0 0
## surdocegueira 13.01 167.44 0.00 0 0
## baixa_visao 3.44 18.56 0.04 0 1
## cegueira 5.43 34.43 0.01 0 0
## deficiencia_auditiva 5.83 50.51 0.03 0 0
## deficiencia_fisica 6.63 57.03 0.09 0 1
## deficiencia_intelectual 4.42 32.21 0.45 1 12
## deficiencia_multipla 7.35 63.54 0.10 0 1
## autismo 3.17 14.99 0.08 0 2
## superdotacao 8.19 89.09 0.01 0 0
## especial_exclusiva 8.51 86.78 0.40 0 0
# write.xlsx(descritivas20, "descritivas20.xlsx", row.names = T)
# write.xlsx(descritivas21, "descritivas21.xlsx", row.names = T)
Como mostrado acima nas estatísticas descritivas, em 2020 e 2021
estavam matriculadas 34.149 e 33.807 crianças com deficiência no estado
do Tocantins respectivamente. Destas matrículas em 2020 foram 245 na
zona rural e 959 na zona urbana, já em 2021 foram 256 na zona rural e
953 na zona urbana.
Em termos percentuais as matrículas na zona urbana representaram 91,4% e
91,2% em 2020 e 2021 respectivamente. Já na zona rural foram de 8,6% e
8,8% nos anos de 2020 e 2021 respectivamente. Há uma forte concentração
de alunos matriculados na zona urbana, mas houve um quantitativo
considerável na zona rural além de um crescimento anual de 1,1% nas
matrículas nesta zona.
Em relação as matrículas por rede escolar, a escola com o maior número
de matriculados em 2020 foi a Escola de Ensino Especial Raios de Luz –
APAE localizada no município de Araguaína, que contou com 520 discentes
matriculados, seguida pela Escola de Ensino Especial Integração de
Palmas, com 357 estudantes.
Em termos de participação os estudantes autistas representaram 5,3% e 6%
das matrículas em 2020 e 2021 respectivamente, sendo o quarto maior
grupo por deficiência na rede escolar tocantinense durante o período.
Outro dado que chamou à atenção foi em relação à surdo-cegueira, pois
foram registradas 6 matrículas em 2020 e 7 em 2021 e apenas um estudante
por escola, ou seja, haviam 6 escolas com este tipo de matrícula em 2020
e 7 em 2021.
a escola com mais aluno autistas foi a Escola Estadual de Ensino
Especial Raios de Luz – APAE de Araguaína, com 27 alunos matriculados,
sendo a de valor máximo em 2021 também, com 26 estudantes autistas
matriculados.
Em relação ao modelo, foi aplicada uma regressão do tipo Poisson pois a
variável dependente foi o número de matrículas de estudantes com
autismo, um evento raro ao longo do tempo. Uma variável do tipo Poisson
tem a seguinte função de probabilidade:
\[ p(k)=e^{-\lambda} \frac{\lambda^k}{k!}, k=0,1,2,... \ (1) \] O modelo a ser estimado é dado por: \[ lambda= e^{(\alpha+ \delta_1 * Escola \ Estadual + \delta_2 * Escola \ Municipal + \delta_3 \ Escola \ Urbana + erro)} \] Ou seja, vamos avaliar a matrícula esperada dos estudantes autistas com base no fato da escola escolhida ser Estadual, Municipal e Urbana.
par(family="serif")
hist(dados20$autismo, main = "Matrículas 2020 - Autismo", col = "white",
ylab = "frequência", xlab = "")
par(family="serif")
hist(dados21$autismo, main = "Matrículas 2021 - Autismo", col = "white",
ylab = "frequência", xlab = "")
# 4. - Modelo Poisson
names(dados)
## [1] "ano" "regional"
## [3] "municipio" "nome_entidade"
## [5] "dep_adm" "zona"
## [7] "alunos_incluidos" "surdez"
## [9] "surdocegueira" "baixa_visao"
## [11] "cegueira" "deficiencia_auditiva"
## [13] "deficiencia_fisica" "deficiencia_intelectual"
## [15] "deficiencia_multipla" "autismo"
## [17] "superdotacao" "especial_exclusiva"
# 4.1. Criando dummies
dados20$urbana <- ifelse(dados20$zona == "URBANA", 1, 0)
dados20$estadual <- ifelse(dados20$dep_adm == "ESTADUAL", 1, 0)
dados20$municipal <- ifelse(dados20$dep_adm == "MUNICIPAL", 1, 0)
dados21$urbana <- ifelse(dados21$zona == "URBANA", 1, 0)
dados21$estadual <- ifelse(dados21$dep_adm == "ESTADUAL", 1, 0)
dados21$municipal <- ifelse(dados21$dep_adm == "MUNICIPAL", 1, 0)
# 4.2. Regressoes
modelo20 <- glm(autismo ~ estadual + municipal + urbana,
data = dados20, family = poisson)
modelo21 <- glm(autismo ~ estadual + municipal + urbana,
data = dados21, family = poisson)
summary(modelo20)
##
## Call:
## glm(formula = autismo ~ estadual + municipal + urbana, family = poisson,
## data = dados20)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.9720 -1.8487 -0.7475 0.2168 9.9226
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.28438 0.13070 -9.827 < 2e-16 ***
## estadual 0.28706 0.08986 3.195 0.0014 **
## municipal 0.41615 0.08644 4.815 1.48e-06 ***
## urbana 1.53315 0.10385 14.763 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 3465.9 on 1203 degrees of freedom
## Residual deviance: 3115.5 on 1200 degrees of freedom
## AIC: 4829.3
##
## Number of Fisher Scoring iterations: 6
summary(modelo21)
##
## Call:
## glm(formula = autismo ~ estadual + municipal + urbana, family = poisson,
## data = dados21)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1611 -1.6590 -0.7924 0.4166 9.5832
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.39848 0.13021 -10.740 < 2e-16 ***
## estadual 0.23996 0.08944 2.683 0.0073 **
## municipal 0.52877 0.08525 6.203 5.56e-10 ***
## urbana 1.71778 0.10301 16.676 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 3799.3 on 1208 degrees of freedom
## Residual deviance: 3310.5 on 1205 degrees of freedom
## AIC: 5135.7
##
## Number of Fisher Scoring iterations: 6
hist(modelo20$residuals)
hist(modelo21$residuals)
qqPlot(modelo20$residuals)
## [1] 512 244
qqPlot(modelo21$residuals)
## [1] 411 242
# 4.3. Calculando valores esperados de 2021
# 4.3.1. Escola urbana da rede estadual
exp(-1.39848+0.23996+1.71778)
## [1] 1.749377
# 4.3.2. Escola rural da rede municipal
exp(-1.39848+0.52877)
## [1] 0.4190731
# 4.3.3. Escolas federais e privadas
exp(-1.39848)
## [1] 0.2469721
# 4.3.4. Escolas urbnas da rede municipal
exp(-1.39848+0.52877+1.71778)
## [1] 2.335136
###########################FIM#################################################
Em relação aos resultados, em 2020 e 2021 as três variáveis tiveram
efeitos positivos sobre a esperança da matrícula de estudantes autistas
e os seus coeficientes foram estatisticamente significativos em 1%.
Vamos fazer as previsões:
A quantidade de matrículas esperadas numa escola da zona urbana e rede
estadual no ano de 2021 foi 1,79. Para uma escola rural da rede
municipal em 2021 essa esperança foi de 0,42.Para uma escola urbana da
rede municipal teve um valor esperado de matrículas de 2,34.
Escolas urbanas da rede municipal têm uma maior probabilidade de receber
estudantes autistas.