dança

1. Introdução

Este script tem o objetivo de fazer a análise quantitativa da metodologia de uma variável do tipo Poisson.
Inicialmente foi realizada uma análise exploratória dos dados do Censo Escolar do estado do Tocantins para saber o perfil dos estudantes com deficiência matriculados na rede escolar.

2.Perfil dos Estudantes com Deficiência

# Regressao Poisson

#  1. acotes necessarios (Listar todos aqui)

library(stats) # para testes estatisticos do modelo
library(mfx) # para o efeito marginal das variaveis
library(MASS) # para avaliacao da matriz de confusao do modelo
library(openxlsx) # para exportacao de dados em Excel
library(dplyr) # para organizacao dos dados
library(ggplot2) # para construcao de graficos
library(tidyr) # para organizacao dos dados
library(broom) # melhor exposição dos resultados
library(tidyverse) # para organização dos dados
library(ResourceSelection) # selecao dos criterios de informacao
library(DHARMa) # diagnostico dos residuos do modelo
library(psych) # para estatisticas descritivas
library(ggplot2) # para construcao de graficos
library(car) # para analise de regressao
library(pROC) # para a construcao da Curva ROC
library(readxl) # para leitura dos dados
# 1.1 - Mudando o Diretorio
setwd("C:/Users/mvmar/Documents/Portfolios/Censo_Escolar_TO")

# 2 - Carregando os Dados:
dados <- read_excel("base.xlsx", sheet = "dados")
dados20 <- subset(dados, dados$ano == 2020)
dados21 <- subset(dados, dados$ano == 2021)

# 3. - Estatisticas descritivas
descritivas20 <- psych::describe(dados20[,7:18], quant = c(0.25, 0.75))
descritivas20
##                         vars    n  mean    sd median trimmed  mad min max range
## alunos_incluidos           1 1204 10.87 12.59      6    8.46 7.41   0 104   104
## surdez                     2 1204  0.18  0.54      0    0.04 0.00   0   6     6
## surdocegueira              3 1204  0.00  0.07      0    0.00 0.00   0   1     1
## baixa_visao                4 1204  0.88  1.66      0    0.54 0.00   0  23    23
## cegueira                   5 1204  0.05  0.25      0    0.00 0.00   0   2     2
## deficiencia_auditiva       6 1204  0.38  1.03      0    0.15 0.00   0  13    13
## deficiencia_fisica         7 1204  1.36  2.95      1    0.83 1.48   0  38    38
## deficiencia_intelectual    8 1204  9.93 15.60      4    6.76 4.45   0 199   199
## deficiencia_multipla       9 1204  1.11  3.47      0    0.48 0.00   0  46    46
## autismo                   10 1204  1.50  2.41      1    0.96 1.48   0  27    27
## superdotacao              11 1204  0.10  0.53      0    0.00 0.00   0  11    11
## especial_exclusiva        12 1204  2.00 13.78      0    0.00 0.00   0 216   216
##                          skew kurtosis   se Q0.25 Q0.75
## alunos_incluidos         2.15     6.33 0.36     2    15
## surdez                   4.41    26.76 0.02     0     0
## surdocegueira           14.04   195.34 0.00     0     0
## baixa_visao              5.01    42.94 0.05     0     1
## cegueira                 5.41    31.40 0.01     0     0
## deficiencia_auditiva     5.82    50.89 0.03     0     0
## deficiencia_fisica       6.53    55.46 0.08     0     2
## deficiencia_intelectual  4.25    30.09 0.45     1    13
## deficiencia_multipla     7.32    64.07 0.10     0     1
## autismo                  3.15    16.57 0.07     0     2
## superdotacao            10.72   169.83 0.02     0     0
## especial_exclusiva       8.48    86.48 0.40     0     0
descritivas21 <- psych::describe(dados21[,7:18], quant = c(0.25, 0.75))
descritivas21
##                         vars    n  mean    sd median trimmed  mad min max range
## alunos_incluidos           1 1209 10.68 12.33      6    8.34 7.41   0  85    85
## surdez                     2 1209  0.15  0.53      0    0.01 0.00   0   6     6
## surdocegueira              3 1209  0.01  0.08      0    0.00 0.00   0   1     1
## baixa_visao                4 1209  0.86  1.52      0    0.52 0.00   0  16    16
## cegueira                   5 1209  0.06  0.26      0    0.00 0.00   0   3     3
## deficiencia_auditiva       6 1209  0.37  1.02      0    0.14 0.00   0  13    13
## deficiencia_fisica         7 1209  1.31  3.00      1    0.77 1.48   0  40    40
## deficiencia_intelectual    8 1209  9.67 15.49      4    6.53 4.45   0 201   201
## deficiencia_multipla       9 1209  1.09  3.52      0    0.44 0.00   0  45    45
## autismo                   10 1209  1.66  2.69      1    1.07 1.48   0  26    26
## superdotacao              11 1209  0.10  0.46      0    0.00 0.00   0   7     7
## especial_exclusiva        12 1209  2.01 13.85      0    0.00 0.00   0 217   217
##                          skew kurtosis   se Q0.25 Q0.75
## alunos_incluidos         2.14     5.98 0.35     2    15
## surdez                   5.12    35.12 0.02     0     0
## surdocegueira           13.01   167.44 0.00     0     0
## baixa_visao              3.44    18.56 0.04     0     1
## cegueira                 5.43    34.43 0.01     0     0
## deficiencia_auditiva     5.83    50.51 0.03     0     0
## deficiencia_fisica       6.63    57.03 0.09     0     1
## deficiencia_intelectual  4.42    32.21 0.45     1    12
## deficiencia_multipla     7.35    63.54 0.10     0     1
## autismo                  3.17    14.99 0.08     0     2
## superdotacao             8.19    89.09 0.01     0     0
## especial_exclusiva       8.51    86.78 0.40     0     0
# write.xlsx(descritivas20, "descritivas20.xlsx", row.names = T)
# write.xlsx(descritivas21, "descritivas21.xlsx", row.names = T)

Como mostrado acima nas estatísticas descritivas, em 2020 e 2021 estavam matriculadas 34.149 e 33.807 crianças com deficiência no estado do Tocantins respectivamente. Destas matrículas em 2020 foram 245 na zona rural e 959 na zona urbana, já em 2021 foram 256 na zona rural e 953 na zona urbana.
Em termos percentuais as matrículas na zona urbana representaram 91,4% e 91,2% em 2020 e 2021 respectivamente. Já na zona rural foram de 8,6% e 8,8% nos anos de 2020 e 2021 respectivamente. Há uma forte concentração de alunos matriculados na zona urbana, mas houve um quantitativo considerável na zona rural além de um crescimento anual de 1,1% nas matrículas nesta zona.
Em relação as matrículas por rede escolar, a escola com o maior número de matriculados em 2020 foi a Escola de Ensino Especial Raios de Luz – APAE localizada no município de Araguaína, que contou com 520 discentes matriculados, seguida pela Escola de Ensino Especial Integração de Palmas, com 357 estudantes.
Em termos de participação os estudantes autistas representaram 5,3% e 6% das matrículas em 2020 e 2021 respectivamente, sendo o quarto maior grupo por deficiência na rede escolar tocantinense durante o período. Outro dado que chamou à atenção foi em relação à surdo-cegueira, pois foram registradas 6 matrículas em 2020 e 7 em 2021 e apenas um estudante por escola, ou seja, haviam 6 escolas com este tipo de matrícula em 2020 e 7 em 2021.
a escola com mais aluno autistas foi a Escola Estadual de Ensino Especial Raios de Luz – APAE de Araguaína, com 27 alunos matriculados, sendo a de valor máximo em 2021 também, com 26 estudantes autistas matriculados.
Em relação ao modelo, foi aplicada uma regressão do tipo Poisson pois a variável dependente foi o número de matrículas de estudantes com autismo, um evento raro ao longo do tempo. Uma variável do tipo Poisson tem a seguinte função de probabilidade:

\[ p(k)=e^{-\lambda} \frac{\lambda^k}{k!}, k=0,1,2,... \ (1) \] O modelo a ser estimado é dado por: \[ lambda= e^{(\alpha+ \delta_1 * Escola \ Estadual + \delta_2 * Escola \ Municipal + \delta_3 \ Escola \ Urbana + erro)} \] Ou seja, vamos avaliar a matrícula esperada dos estudantes autistas com base no fato da escola escolhida ser Estadual, Municipal e Urbana.

par(family="serif")
hist(dados20$autismo, main = "Matrículas 2020 - Autismo", col = "white",
    ylab = "frequência", xlab = "")

par(family="serif")
hist(dados21$autismo, main = "Matrículas 2021 - Autismo", col = "white",
     ylab = "frequência", xlab = "")

# 4. - Modelo Poisson 
names(dados)
##  [1] "ano"                     "regional"               
##  [3] "municipio"               "nome_entidade"          
##  [5] "dep_adm"                 "zona"                   
##  [7] "alunos_incluidos"        "surdez"                 
##  [9] "surdocegueira"           "baixa_visao"            
## [11] "cegueira"                "deficiencia_auditiva"   
## [13] "deficiencia_fisica"      "deficiencia_intelectual"
## [15] "deficiencia_multipla"    "autismo"                
## [17] "superdotacao"            "especial_exclusiva"
# 4.1. Criando dummies
dados20$urbana <- ifelse(dados20$zona == "URBANA", 1, 0)
dados20$estadual <- ifelse(dados20$dep_adm == "ESTADUAL", 1, 0)
dados20$municipal <- ifelse(dados20$dep_adm == "MUNICIPAL", 1, 0)

dados21$urbana <- ifelse(dados21$zona == "URBANA", 1, 0)
dados21$estadual <- ifelse(dados21$dep_adm == "ESTADUAL", 1, 0)
dados21$municipal <- ifelse(dados21$dep_adm == "MUNICIPAL", 1, 0)

# 4.2. Regressoes
modelo20 <- glm(autismo ~ estadual + municipal + urbana,
                data = dados20, family = poisson)

modelo21 <- glm(autismo ~ estadual + municipal + urbana,
              data = dados21, family = poisson)

summary(modelo20)
## 
## Call:
## glm(formula = autismo ~ estadual + municipal + urbana, family = poisson, 
##     data = dados20)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.9720  -1.8487  -0.7475   0.2168   9.9226  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -1.28438    0.13070  -9.827  < 2e-16 ***
## estadual     0.28706    0.08986   3.195   0.0014 ** 
## municipal    0.41615    0.08644   4.815 1.48e-06 ***
## urbana       1.53315    0.10385  14.763  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 3465.9  on 1203  degrees of freedom
## Residual deviance: 3115.5  on 1200  degrees of freedom
## AIC: 4829.3
## 
## Number of Fisher Scoring iterations: 6
summary(modelo21)
## 
## Call:
## glm(formula = autismo ~ estadual + municipal + urbana, family = poisson, 
##     data = dados21)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1611  -1.6590  -0.7924   0.4166   9.5832  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -1.39848    0.13021 -10.740  < 2e-16 ***
## estadual     0.23996    0.08944   2.683   0.0073 ** 
## municipal    0.52877    0.08525   6.203 5.56e-10 ***
## urbana       1.71778    0.10301  16.676  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 3799.3  on 1208  degrees of freedom
## Residual deviance: 3310.5  on 1205  degrees of freedom
## AIC: 5135.7
## 
## Number of Fisher Scoring iterations: 6
hist(modelo20$residuals)

hist(modelo21$residuals)

qqPlot(modelo20$residuals)

## [1] 512 244
qqPlot(modelo21$residuals)

## [1] 411 242
# 4.3. Calculando valores esperados de 2021

# 4.3.1. Escola urbana da rede estadual
exp(-1.39848+0.23996+1.71778)
## [1] 1.749377
# 4.3.2. Escola rural da rede municipal
exp(-1.39848+0.52877)
## [1] 0.4190731
# 4.3.3. Escolas federais e privadas
exp(-1.39848)
## [1] 0.2469721
# 4.3.4. Escolas urbnas da rede municipal
exp(-1.39848+0.52877+1.71778)
## [1] 2.335136
###########################FIM#################################################

Em relação aos resultados, em 2020 e 2021 as três variáveis tiveram efeitos positivos sobre a esperança da matrícula de estudantes autistas e os seus coeficientes foram estatisticamente significativos em 1%. Vamos fazer as previsões:
A quantidade de matrículas esperadas numa escola da zona urbana e rede estadual no ano de 2021 foi 1,79. Para uma escola rural da rede municipal em 2021 essa esperança foi de 0,42.Para uma escola urbana da rede municipal teve um valor esperado de matrículas de 2,34.
Escolas urbanas da rede municipal têm uma maior probabilidade de receber estudantes autistas.