1 Configuraçõs iniciais

1.1 Carregamentos dos pacotes

if(!require(pacman)) intall.packages("pacman")
library(pacman)

pacman::p_load(dplyr, rstatix, psych, car, MASS, DescTools, QuantPsyc, ggplot2,
               nnet, AER, lmtest, DescTools, gtsummary, reshape2, sjPlot, ggtext)

library(readr)
library(tidyverse)
library(HH)
library(brant)
library(stats)
library(cowplot)
library(knitr)
library(likert)
library(rmarkdown)
library(kableExtra)
library(plyr)
library(devtools)

1.2 Preparação do R

options(scipen=999) # Evitando a notação científica

theme_gtsummary_language(
  "pt", big.mark = ".", decimal.mark = ",",
  ci.sep = "; ", set_theme = T) # Adequando às formatações brasileiras
## Setting theme `language: pt`
show_col_types = FALSE

2 Tratamento do banco

2.1 Carregamento

# Ao carregar os dados criamos o banco "SD", para significar "Satisfação Docente". E depois criamos o SD2, com os filtros para os questionários considerados válidos pelo Inep e para as escolas públicas.

SD <- read_csv("D:/1_bases_originais/SAEB/Microdados_Saeb/DADOS/TS_PROFESSOR.csv")
SD2 <- filter(SD, IN_PREENCHIMENTO_QUESTIONARIO == "1")
SD2 <- filter(SD2, ID_DEPENDENCIA_ADM != "4")

2.2 Renomeando categorias

SD2$REGIAO <- factor(SD2$ID_REGIAO, 
                                     label = c("NORTE"  ,
                                               "NORDESTE",
                                               "SUDESTE",
                                               "SUL",
                                               "CENTRO_OESTE"),
                                     
                                     levels = c(1, 
                                                2,
                                                3,
                                                4,
                                                5))
                                    


SD2$ESTADO <- factor(SD2$ID_UF, 
                                     label = c("RO",
                                               "AC",
                                               "AM",
                                               "RR",
                                               "PA",
                                               "AP",
                                               "TO",
                                               "MA",
                                               "PI",
                                               "CE",
                                               "RN",
                                               "PB",
                                               "PE",
                                               "AL",
                                               "SE",
                                               "BA",
                                               "MG",
                                               "ES",
                                               "RJ",
                                               "SP",
                                               "PR",
                                               "SC",
                                               "RS",
                                               "MS",
                                               "MT",
                                               "GO",
                                               "DF"),
                                     
                                     levels = c(11,
                                                12,
                                                13,
                                                14,
                                                15,
                                                16,
                                                17,
                                                21,
                                                22,
                                                23,
                                                24,
                                                25,
                                                26,
                                                27,
                                                28,
                                                29,
                                                31,
                                                32,
                                                33,
                                                35,
                                                41,
                                                42,
                                                43,
                                                50,
                                                51,
                                                52,
                                                53))
                                     

SD2$AREA <- factor(SD2$ID_AREA, 
                                   label = c("CAPITAL",
                                             "INTERIOR"),
                                   
                                   levels = c(1,
                                              2))
                                    


SD2$DEPENDENCIA <- factor(SD2$ID_DEPENDENCIA_ADM, 
                                          label = c("FEDERAL",
                                                    "ESTADUAL",
                                                    "MUNICIPAL"),
                                          
                                          levels = c(1,2,3))
                                     

SD2$LOCALIZACAO <- factor(SD2$ID_LOCALIZACAO, 
                                          label = c("URBANA",
                                                    "RURAL"),
                                          
                                          levels = c(1,2))
                                     

SD2$SERIE <- factor(SD2$ID_SERIE, 
                                    label = c("5_ANO_EF",
                                              "9_ANO_EF",
                                              "3_ANO_EM",
                                              "3_ANO_EM_INTEGRADO"),
                                    
                                    levels = c(5,9,12,13))
                                     

SD2$Q1_RACA <- factor(SD2$TX_RESP_Q001, 
                                      label = c("BRANCA",
                                                "PRETA",
                                                "PARDA",
                                                "AMARELA",
                                                "INDIGENA",
                                                "NAO_DECLARAR"),
                                      
                                      levels = c("A","B","C","D","E","F"))
                                    

SD2$Q2_ANOS_COMO_PROFESSOR <- factor(SD2$TX_RESP_Q002, 
                                                     label = c("PRIMEIRO_ANO",
                                                               "DE_1_A_2",
                                                               "DE_3_A_5",
                                                               "DE_6_A_10",
                                                               "DE_11_A_15",
                                                               "DE_16_A_20",
                                                               "MAIS_DE_20"),
                                                     
                                                     levels = c("A","B","C","D","E","F","G"))
                                     
                              

SD2$Q4_QUANTAS_ESCOLAS_TRABALHA <- factor(SD2$TX_RESP_Q004, 
                                                          label = c("APENAS_NESTA",
                                                                    "EM_2",
                                                                    "EM_3",
                                                                    "EM_4_OU_MAIS"),
                                                          
                                                          levels = c("A","B","C","D"))
                                    

SD2$Q5_TIPO_VINCULO <- factor(SD2$TX_RESP_Q005, 
                                              label = c("EFETIVO",
                                                        "TEMPORARIO",
                                                        "TERCEIRIZADO",
                                                        "CLT",
                                                        "PJ",
                                                        "OUTRA"),
                                              
                                              levels = c("A","B","C","D","E","F"))


SD2$Q6_REALIZACAO_DE_SONHO <- factor(SD2$TX_RESP_Q006, 
                                                     label = c("DISCORDO_FORTEMENTE",
                                                               "DISCORDO",
                                                               "CONCORDO",
                                                               "CONCORDO_FORTEMENTE"
                                                     ),
                                                     
                                                     levels = c("A","B","C","D"))

SD2$Q7_PROFISSAO_VALORIZADA <- factor(SD2$TX_RESP_Q007, 
                                                      label = c("DISCORDO_FORTEMENTE",
                                                                "DISCORDO",
                                                                "CONCORDO",
                                                                "CONCORDO_FORTEMENTE"
                                                      ),
                                                      
                                                      levels = c("A","B","C","D"))

SD2$Q8_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(SD2$TX_RESP_Q008, 
                                                                label = c("DISCORDO_FORTEMENTE",
                                                                          "DISCORDO",
                                                                          "CONCORDO",
                                                                          "CONCORDO_FORTEMENTE"
                                                                ),
                                                                
                                                                levels = c("A","B","C","D"))

SD2$Q9_SATISFEITO <- factor(SD2$TX_RESP_Q009, 
                                            label = c("DISCORDO_FORTEMENTE",
                                                      "DISCORDO",
                                                      "CONCORDO",
                                                      "CONCORDO_FORTEMENTE"
                                            ),
                                            
                                            levels = c("A","B","C","D"))

2.3 Apagando variáveis em desuso

SD2 <- SD2 %>% 
  mutate(IN_PREENCHIMENTO_QUESTIONARIO = NULL,
         ID_SAEB = NULL,
         ID_UF = NULL,
         ID_MUNICIPIO = NULL,
         ID_ESCOLA = NULL,
         ID_TURMA = NULL,
         CO_PROFESSOR = NULL,
         ID_DEPENDENCIA_ADM = NULL, 
         ID_LOCALIZACAO = NULL,  
         ID_SERIE = NULL, 
         ID_AREA = NULL,
         ID_REGIAO = NULL,
         TX_RESP_Q001   =   NULL,
         TX_RESP_Q002   =   NULL,
         TX_RESP_Q003   =   NULL,
         TX_RESP_Q004   =   NULL,
         TX_RESP_Q005   =   NULL,
         TX_RESP_Q006   =   NULL,
         TX_RESP_Q007   =   NULL,
         TX_RESP_Q008   =   NULL,
         TX_RESP_Q009   =   NULL,
         TX_RESP_Q010   =   NULL,
         TX_RESP_Q011   =   NULL,
         TX_RESP_Q012   =   NULL,
         TX_RESP_Q013   =   NULL,
         TX_RESP_Q014   =   NULL,
         TX_RESP_Q015   =   NULL,
         TX_RESP_Q016   =   NULL,
         TX_RESP_Q017   =   NULL,
         TX_RESP_Q018   =   NULL,
         TX_RESP_Q019   =   NULL,
         TX_RESP_Q020   =   NULL,
         TX_RESP_Q021   =   NULL,
         TX_RESP_Q022   =   NULL,
         TX_RESP_Q023   =   NULL,
         TX_RESP_Q024   =   NULL,
         TX_RESP_Q025   =   NULL,
         TX_RESP_Q026   =   NULL,
         TX_RESP_Q027   =   NULL,
         TX_RESP_Q028   =   NULL,
         TX_RESP_Q029   =   NULL,
         TX_RESP_Q030   =   NULL,
         TX_RESP_Q031   =   NULL,
         TX_RESP_Q032   =   NULL,
         TX_RESP_Q033   =   NULL,
         TX_RESP_Q034   =   NULL,
         TX_RESP_Q035   =   NULL,
         TX_RESP_Q036   =   NULL,
         TX_RESP_Q037   =   NULL,
         TX_RESP_Q038   =   NULL,
         TX_RESP_Q039   =   NULL,
         TX_RESP_Q040   =   NULL,
         TX_RESP_Q041   =   NULL,
         TX_RESP_Q042   =   NULL,
         TX_RESP_Q043   =   NULL,
         TX_RESP_Q044   =   NULL,
         TX_RESP_Q045   =   NULL,
         TX_RESP_Q046   =   NULL,
         TX_RESP_Q047   =   NULL,
         TX_RESP_Q048   =   NULL,
         TX_RESP_Q049   =   NULL,
         TX_RESP_Q050   =   NULL,
         TX_RESP_Q051   =   NULL,
         TX_RESP_Q052   =   NULL,
         TX_RESP_Q053   =   NULL,
         TX_RESP_Q054   =   NULL,
         TX_RESP_Q055   =   NULL,
         TX_RESP_Q056   =   NULL,
         TX_RESP_Q057   =   NULL,
         TX_RESP_Q058   =   NULL,
         TX_RESP_Q059   =   NULL,
         TX_RESP_Q060   =   NULL,
         TX_RESP_Q061   =   NULL,
         TX_RESP_Q062   =   NULL,
         TX_RESP_Q063   =   NULL,
         TX_RESP_Q064   =   NULL,
         TX_RESP_Q065   =   NULL,
         TX_RESP_Q066   =   NULL,
         TX_RESP_Q067   =   NULL,
         TX_RESP_Q068   =   NULL,
         TX_RESP_Q069   =   NULL,
         TX_RESP_Q070   =   NULL,
         TX_RESP_Q071   =   NULL,
         TX_RESP_Q072   =   NULL,
         TX_RESP_Q073   =   NULL,
         TX_RESP_Q074   =   NULL,
         TX_RESP_Q075   =   NULL,
         TX_RESP_Q076   =   NULL,
         TX_RESP_Q077   =   NULL,
         TX_RESP_Q078   =   NULL,
         TX_RESP_Q079   =   NULL,
         TX_RESP_Q080   =   NULL,
         TX_RESP_Q081   =   NULL,
         TX_RESP_Q082   =   NULL,
         TX_RESP_Q083   =   NULL,
         TX_RESP_Q084   =   NULL,
         TX_RESP_Q085   =   NULL,
         TX_RESP_Q086   =   NULL,
         TX_RESP_Q087   =   NULL,
         TX_RESP_Q088   =   NULL,
         TX_RESP_Q089   =   NULL,
         TX_RESP_Q090   =   NULL,
         TX_RESP_Q091   =   NULL,
         TX_RESP_Q092   =   NULL,
         TX_RESP_Q093   =   NULL,
         TX_RESP_Q094   =   NULL,
         TX_RESP_Q095   =   NULL,
         TX_RESP_Q096   =   NULL,
         TX_RESP_Q097   =   NULL,
         TX_RESP_Q098   =   NULL,
         TX_RESP_Q099   =   NULL,
         TX_RESP_Q100   =   NULL,
         TX_RESP_Q101   =   NULL,
         TX_RESP_Q102   =   NULL,
         TX_RESP_Q103   =   NULL,
         TX_RESP_Q104   =   NULL,
         TX_RESP_Q105   =   NULL,
         TX_RESP_Q106   =   NULL,
         TX_RESP_Q107   =   NULL,
         TX_RESP_Q108   =   NULL,
         TX_RESP_Q109   =   NULL,
         TX_RESP_Q110   =   NULL,
         TX_RESP_Q111   =   NULL,
         TX_RESP_Q112   =   NULL,
         TX_RESP_Q113   =   NULL,
         TX_RESP_Q114   =   NULL,
         TX_RESP_Q115   =   NULL,
         TX_RESP_Q116   =   NULL,
         TX_RESP_Q117   =   NULL,
         TX_RESP_Q118   =   NULL,
         TX_RESP_Q119   =   NULL,
         TX_RESP_Q120   =   NULL,
         TX_RESP_Q121   =   NULL,
         TX_RESP_Q122   =   NULL,
         TX_RESP_Q123   =   NULL,
         TX_RESP_Q124   =   NULL,
         TX_RESP_Q125   =   NULL,
         TX_RESP_Q126   =   NULL,
         TX_RESP_Q127   =   NULL,
         TX_RESP_Q128 = NULL)

2.4 Criando variáveis

2.4.1 Agregando para a variável “Regiao_geoeconomica”

SD2$GE_REGIAO <- factor(SD2$ESTADO,
                                                  label = c("AMAZONIA",
                                                            "AMAZONIA",
                                                            "AMAZONIA",
                                                            "AMAZONIA",
                                                            "AMAZONIA",
                                                            "AMAZONIA",
                                                            "AMAZONIA",
                                                            "AMAZONIA",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "NORDESTE",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL",
                                                            "AMAZONIA",
                                                            "CENTRO-SUL",
                                                            "CENTRO-SUL"),
                                                   
                                                  levels = c("RO",
                                                            "AC",
                                                            "AM",
                                                            "RR",
                                                            "PA",
                                                            "AP",
                                                            "TO",
                                                            "MA",
                                                            "PI",
                                                            "CE",
                                                            "RN",
                                                            "PB",
                                                            "PE",
                                                            "AL",
                                                            "SE",
                                                            "BA",
                                                            "MG",
                                                            "ES",
                                                            "RJ",
                                                            "SP",
                                                            "PR",
                                                            "SC",
                                                            "RS",
                                                            "MS",
                                                            "MT",
                                                            "GO",
                                                            "DF"))

2.4.2 Agregando para as variáveis “Concordo” e “Discordo”

SD2$Q6_2_REALIZACAO_DE_SONHO <- factor(SD2$Q6_REALIZACAO_DE_SONHO, 
                                                     label = c("DISCORDO",
                                                               "DISCORDO",
                                                               "CONCORDO",
                                                               "CONCORDO"
                                                     ),
                                                     
                                                     levels = c("DISCORDO_FORTEMENTE",
                                                                "DISCORDO",
                                                                "CONCORDO",
                                                                "CONCORDO_FORTEMENTE"))

SD2$Q7_2_PROFISSAO_VALORIZADA <- factor(SD2$Q7_PROFISSAO_VALORIZADA, 
                                                      label = c("DISCORDO",
                                                                "DISCORDO",
                                                                "CONCORDO",
                                                                "CONCORDO"
                                                      ),
                                                      
                                                      levels = c("DISCORDO_FORTEMENTE",
                                                                 "DISCORDO",
                                                                 "CONCORDO",
                                                                 "CONCORDO_FORTEMENTE"))

SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(SD2$Q8_VANTAGENS_SUPERAM_DESVANTAGENS, 
                                                                label = c("DISCORDO",
                                                                          "DISCORDO",
                                                                          "CONCORDO",
                                                                          "CONCORDO"
                                                                ),
                                                                
                                                                levels = c("DISCORDO_FORTEMENTE",
                                                                           "DISCORDO",
                                                                           "CONCORDO",
                                                                           "CONCORDO_FORTEMENTE"))

SD2$Q9_2_SATISFEITO <- factor(SD2$Q9_SATISFEITO, 
                                            label = c("DISCORDO",
                                                      "DISCORDO",
                                                      "CONCORDO",
                                                      "CONCORDO"
                                            ),
                                            
                                            levels = c("DISCORDO_FORTEMENTE",
                                                       "DISCORDO",
                                                       "CONCORDO",
                                                       "CONCORDO_FORTEMENTE"))

2.5 Conferindo banco

paged_table(SD2)
write.csv(SD2,"SATISFACAO_DOCENTE_2.csv")

3 Análise Exploratória

3.1 Selecionando as variáveis

# Para a análise exploratória trabalharemos com as variáveis originais, ou seja, não utilizaremos aquelas produzidas para o modelo binário.

AE <- as.data.frame(unclass(SD2), stringsAsFactors = TRUE)

glimpse(AE)
## Rows: 311,597
## Columns: 19
## $ REGIAO                              <fct> NORTE, NORTE, NORTE, NORTE, NORTE,~
## $ ESTADO                              <fct> RO, RO, RO, RO, RO, RO, RO, RO, RO~
## $ AREA                                <fct> INTERIOR, INTERIOR, INTERIOR, INTE~
## $ DEPENDENCIA                         <fct> MUNICIPAL, ESTADUAL, ESTADUAL, EST~
## $ LOCALIZACAO                         <fct> RURAL, URBANA, URBANA, URBANA, URB~
## $ SERIE                               <fct> 5_ANO_EF, 5_ANO_EF, 5_ANO_EF, 5_AN~
## $ Q1_RACA                             <fct> PARDA, BRANCA, BRANCA, PRETA, BRAN~
## $ Q2_ANOS_COMO_PROFESSOR              <fct> DE_16_A_20, MAIS_DE_20, MAIS_DE_20~
## $ Q4_QUANTAS_ESCOLAS_TRABALHA         <fct> APENAS_NESTA, APENAS_NESTA, APENAS~
## $ Q5_TIPO_VINCULO                     <fct> EFETIVO, EFETIVO, EFETIVO, EFETIVO~
## $ Q6_REALIZACAO_DE_SONHO              <fct> CONCORDO_FORTEMENTE, CONCORDO, CON~
## $ Q7_PROFISSAO_VALORIZADA             <fct> DISCORDO, DISCORDO, DISCORDO, DISC~
## $ Q8_VANTAGENS_SUPERAM_DESVANTAGENS   <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q9_SATISFEITO                       <fct> CONCORDO_FORTEMENTE, CONCORDO, CON~
## $ GE_REGIAO                           <fct> AMAZONIA, AMAZONIA, AMAZONIA, AMAZ~
## $ Q6_2_REALIZACAO_DE_SONHO            <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q7_2_PROFISSAO_VALORIZADA           <fct> DISCORDO, DISCORDO, DISCORDO, DISC~
## $ Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q9_2_SATISFEITO                     <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
AE <- AE %>% select(REGIAO, GE_REGIAO, AREA, LOCALIZACAO, DEPENDENCIA, SERIE, Q2_ANOS_COMO_PROFESSOR, Q4_QUANTAS_ESCOLAS_TRABALHA, Q5_TIPO_VINCULO, Q6_REALIZACAO_DE_SONHO, Q7_PROFISSAO_VALORIZADA, Q8_VANTAGENS_SUPERAM_DESVANTAGENS, Q9_SATISFEITO)

glimpse(AE)
## Rows: 311,597
## Columns: 13
## $ REGIAO                            <fct> NORTE, NORTE, NORTE, NORTE, NORTE, N~
## $ GE_REGIAO                         <fct> AMAZONIA, AMAZONIA, AMAZONIA, AMAZON~
## $ AREA                              <fct> INTERIOR, INTERIOR, INTERIOR, INTERI~
## $ LOCALIZACAO                       <fct> RURAL, URBANA, URBANA, URBANA, URBAN~
## $ DEPENDENCIA                       <fct> MUNICIPAL, ESTADUAL, ESTADUAL, ESTAD~
## $ SERIE                             <fct> 5_ANO_EF, 5_ANO_EF, 5_ANO_EF, 5_ANO_~
## $ Q2_ANOS_COMO_PROFESSOR            <fct> DE_16_A_20, MAIS_DE_20, MAIS_DE_20, ~
## $ Q4_QUANTAS_ESCOLAS_TRABALHA       <fct> APENAS_NESTA, APENAS_NESTA, APENAS_N~
## $ Q5_TIPO_VINCULO                   <fct> EFETIVO, EFETIVO, EFETIVO, EFETIVO, ~
## $ Q6_REALIZACAO_DE_SONHO            <fct> CONCORDO_FORTEMENTE, CONCORDO, CONCO~
## $ Q7_PROFISSAO_VALORIZADA           <fct> DISCORDO, DISCORDO, DISCORDO, DISCOR~
## $ Q8_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONCOR~
## $ Q9_SATISFEITO                     <fct> CONCORDO_FORTEMENTE, CONCORDO, CONCO~

3.2 Reorganizando os níveis das VIs e VDs

levels(AE$REGIAO)
## [1] "NORTE"        "NORDESTE"     "SUDESTE"      "SUL"          "CENTRO_OESTE"
levels(AE$GE_REGIAO) 
## [1] "AMAZONIA"   "NORDESTE"   "CENTRO-SUL"
levels(AE$AREA)
## [1] "CAPITAL"  "INTERIOR"
levels(AE$LOCALIZACAO)   
## [1] "URBANA" "RURAL"
levels(AE$DEPENDENCIA)   
## [1] "FEDERAL"   "ESTADUAL"  "MUNICIPAL"
levels(AE$SERIE)
## [1] "5_ANO_EF"           "9_ANO_EF"           "3_ANO_EM"          
## [4] "3_ANO_EM_INTEGRADO"
levels(AE$Q2_ANOS_COMO_PROFESSOR)   
## [1] "PRIMEIRO_ANO" "DE_1_A_2"     "DE_3_A_5"     "DE_6_A_10"    "DE_11_A_15"  
## [6] "DE_16_A_20"   "MAIS_DE_20"
levels(AE$Q4_QUANTAS_ESCOLAS_TRABALHA)   
## [1] "APENAS_NESTA" "EM_2"         "EM_3"         "EM_4_OU_MAIS"
levels(AE$Q5_TIPO_VINCULO)   
## [1] "EFETIVO"      "TEMPORARIO"   "TERCEIRIZADO" "CLT"          "PJ"          
## [6] "OUTRA"
levels(AE$Q6_REALIZACAO_DE_SONHO)   
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q7_PROFISSAO_VALORIZADA)   
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS)   
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q9_SATISFEITO)
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
AE$GE_REGIAO <- factor(AE$GE_REGIAO,
                               levels = c("AMAZONIA", "NORDESTE", "CENTRO-SUL"))

AE$LOCALIZACAO <- factor(AE$LOCALIZACAO,
                                 levels = c("URBANA", "RURAL"))

AE$SERIE <- factor(AE$SERIE,
                                 levels = c("9_ANO_EF", "5_ANO_EF", "3_ANO_EM", "3_ANO_EM_INTEGRADO"))

AE$Q2_ANOS_COMO_PROFESSOR <- factor(AE$Q2_ANOS_COMO_PROFESSOR,
                           levels = c("PRIMEIRO_ANO", "DE_1_A_2", "DE_3_A_5", "DE_6_A_10", "DE_11_A_15", "DE_16_A_20", "MAIS_DE_20"))

AE$Q5_TIPO_VINCULO <- factor(AE$Q5_TIPO_VINCULO,
                                            levels = c("EFETIVO", "TEMPORARIO", "CLT", "TERCEIRIZADO", "PJ", "OUTRA"))

AE$Q6_REALIZACAO_DE_SONHO <- factor(AE$Q6_REALIZACAO_DE_SONHO,
                                     levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE"))                      

AE$Q7_PROFISSAO_VALORIZADA <- factor(AE$Q7_PROFISSAO_VALORIZADA,
                                              levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE"))                      

AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS,
                                               levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE")) 

AE$Q9_SATISFEITO <- factor(AE$Q9_SATISFEITO,
                                               levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE")) 

levels(AE$GE_REGIAO) 
## [1] "AMAZONIA"   "NORDESTE"   "CENTRO-SUL"
levels(AE$AREA)
## [1] "CAPITAL"  "INTERIOR"
levels(AE$LOCALIZACAO)   
## [1] "URBANA" "RURAL"
levels(AE$DEPENDENCIA)   
## [1] "FEDERAL"   "ESTADUAL"  "MUNICIPAL"
levels(AE$SERIE)
## [1] "9_ANO_EF"           "5_ANO_EF"           "3_ANO_EM"          
## [4] "3_ANO_EM_INTEGRADO"
levels(AE$Q2_ANOS_COMO_PROFESSOR)   
## [1] "PRIMEIRO_ANO" "DE_1_A_2"     "DE_3_A_5"     "DE_6_A_10"    "DE_11_A_15"  
## [6] "DE_16_A_20"   "MAIS_DE_20"
levels(AE$Q4_QUANTAS_ESCOLAS_TRABALHA)   
## [1] "APENAS_NESTA" "EM_2"         "EM_3"         "EM_4_OU_MAIS"
levels(AE$Q5_TIPO_VINCULO)   
## [1] "EFETIVO"      "TEMPORARIO"   "CLT"          "TERCEIRIZADO" "PJ"          
## [6] "OUTRA"
levels(AE$Q6_REALIZACAO_DE_SONHO)   
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q7_PROFISSAO_VALORIZADA)   
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS)   
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q9_SATISFEITO)
## [1] "DISCORDO_FORTEMENTE" "DISCORDO"            "CONCORDO"           
## [4] "CONCORDO_FORTEMENTE"

3.3 Tabelas de contingência

3.3.1 Variáveis dependentes (VD)

Q6 <- round((prop.table(table(AE$Q6_REALIZACAO_DE_SONHO))*100),2)
Q6
## 
## DISCORDO_FORTEMENTE            DISCORDO            CONCORDO CONCORDO_FORTEMENTE 
##                1.72                9.06               52.98               36.24
Q7 <- round((prop.table(table(AE$Q7_PROFISSAO_VALORIZADA))*100),2)
Q7
## 
## DISCORDO_FORTEMENTE            DISCORDO            CONCORDO CONCORDO_FORTEMENTE 
##               27.81               56.65               13.97                1.56
Q8 <- round((prop.table(table(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS))*100),2)
Q8
## 
## DISCORDO_FORTEMENTE            DISCORDO            CONCORDO CONCORDO_FORTEMENTE 
##                8.63               40.33               45.62                5.42
Q9 <- round((prop.table(table(AE$Q9_SATISFEITO))*100),2)
Q9
## 
## DISCORDO_FORTEMENTE            DISCORDO            CONCORDO CONCORDO_FORTEMENTE 
##                1.95               15.90               65.02               17.14

3.3.2 Q6

3.3.2.1 Q6_TERRITORIALIDADE

REGIÃO POLÍTICO-ADMINISTRATIVA

round((prop.table(Q6_X_REGIAO,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   NORTE                       1.86    12.01    54.19               31.94
##   NORDESTE                    1.59    10.09    54.13               34.19
##   SUDESTE                     1.84     8.14    52.11               37.91
##   SUL                         1.59     6.77    51.13               40.51
##   CENTRO_OESTE                1.71     9.40    54.21               34.68

REGIÃO GEOECONÔMICA

round((prop.table(Q6_X_GE_REGIAO,1)*100), 2)
##             
##              DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   AMAZONIA                  1.85    11.92    55.62               30.61
##   NORDESTE                  1.50     9.56    53.39               35.55
##   CENTRO-SUL                1.77     7.91    51.93               38.39

ÁREA

round((prop.table(Q6_X_AREA,1)*100), 2)
##           
##            DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   CAPITAL                 2.20    10.36    52.12               35.32
##   INTERIOR                1.63     8.83    53.13               36.41

LOCALIZAÇÃO

round((prop.table(Q6_X_LOCALIZACAO,1)*100), 2)
##         
##          DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   URBANA                1.79     9.11    52.98               36.11
##   RURAL                 1.33     8.80    52.95               36.92

3.3.2.2 Q6_SISTEMA_ESCOLAR

DEPENDÊNCIA ADMINISTRATIVA

round((prop.table(Q6_X_DEPENDENCIA,1)*100), 2)
##            
##             DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   FEDERAL                  2.29    11.65    44.96               41.10
##   ESTADUAL                 1.97     9.36    53.84               34.83
##   MUNICIPAL                1.48     8.75    52.28               37.50

SÉRIE

round((prop.table(Q6_X_SERIE,1)*100), 2)
##                     
##                      DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   9_ANO_EF                          1.82    10.07    55.24               32.87
##   5_ANO_EF                          1.35     7.28    49.96               41.41
##   3_ANO_EM                          2.13    10.44    54.52               32.91
##   3_ANO_EM_INTEGRADO                2.56     9.99    52.07               35.39

3.3.2.3 Q6_CARACTERÍSTICAS_PROFISSIONAIS

ANOS COMO PROFESSOR

round((prop.table(Q6_X_Q2_ANOS_PROFESSOR,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   PRIMEIRO_ANO                1.76     7.50    48.21               42.53
##   DE_1_A_2                    1.27     7.41    50.74               40.59
##   DE_3_A_5                    1.26     7.74    53.02               37.98
##   DE_6_A_10                   1.57     8.90    54.39               35.14
##   DE_11_A_15                  1.89     9.93    54.39               33.78
##   DE_16_A_20                  1.75    10.26    54.96               33.02
##   MAIS_DE_20                  1.81     8.54    50.78               38.88

QUANTIDADE DE ESCOLAS EM QUE TRABALHA

round((prop.table(Q6_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   APENAS_NESTA                1.64     8.70    52.47               37.19
##   EM_2                        1.70     9.44    53.97               34.88
##   EM_3                        2.11    10.22    53.44               34.23
##   EM_4_OU_MAIS                2.36     9.08    50.51               38.05

TIPO DE VÍNCULO

round((prop.table(Q6_X_Q5_TIPO_VINCULO,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   EFETIVO                     1.82    10.02    53.65               34.50
##   TEMPORARIO                  1.29     6.57    51.55               40.59
##   CLT                         2.33     6.74    49.43               41.50
##   TERCEIRIZADO                8.50    16.64    45.21               29.66
##   PJ                          4.84    14.52    54.84               25.81
##   OUTRA                       2.46     9.35    51.77               36.42

3.3.3 Q7_PROFISSÃO_VALORIZADA

3.3.3.1 Q7_TERRITORIALIDADE

REGIÃO POLÍTICO-ADMINISTRATIVA

round((prop.table(Q7_X_REGIAO,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   NORTE                      25.74    55.47    16.33                2.46
##   NORDESTE                   23.58    58.30    16.38                1.74
##   SUDESTE                    31.24    55.71    11.74                1.32
##   SUL                        30.70    55.61    12.49                1.20
##   CENTRO_OESTE               25.99    58.20    14.35                1.46

REGIÃO GEOECONÔMICA

round((prop.table(Q7_X_GE_REGIAO,1)*100), 2)
##             
##              DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   AMAZONIA                 24.57    57.16    16.13                2.13
##   NORDESTE                 23.60    58.19    16.46                1.75
##   CENTRO-SUL               30.76    55.80    12.15                1.30

ÁREA

round((prop.table(Q7_X_AREA,1)*100), 2)
##           
##            DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   CAPITAL                35.72    52.58    10.01                1.70
##   INTERIOR               26.38    57.39    14.69                1.54

LOCALIZAÇÃO

round((prop.table(Q7_X_LOCALIZACAO,1)*100), 2)
##         
##          DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   URBANA               29.17    56.21    13.13                1.49
##   RURAL                20.66    59.00    18.37                1.97

3.3.3.2 Q7_SISTEMA

DEPENDÊNCIA ADMINISTRATIVA

round((prop.table(Q7_X_DEPENDENCIA,1)*100), 2)
##            
##             DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   FEDERAL                 34.24    54.23     9.96                1.56
##   ESTADUAL                29.94    55.09    13.42                1.55
##   MUNICIPAL               25.75    58.14    14.53                1.58

SÉRIE

round((prop.table(Q7_X_SERIE,1)*100), 2)
##                     
##                      DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   9_ANO_EF                         28.62    56.27    13.55                1.55
##   5_ANO_EF                         25.63    58.41    14.40                1.57
##   3_ANO_EM                         30.17    54.26    14.01                1.56
##   3_ANO_EM_INTEGRADO               29.89    55.28    12.98                1.85

3.3.3.3 Q7_CARACTERÍSTICAS_PROFISSIONAIS

ANOS COMO PROFESSOR

round((prop.table(Q7_X_Q2_ANOS_PROFESSOR,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   PRIMEIRO_ANO               23.70    56.82    17.62                1.86
##   DE_1_A_2                   22.90    59.16    16.05                1.90
##   DE_3_A_5                   25.46    58.53    14.70                1.31
##   DE_6_A_10                  28.66    56.55    13.29                1.50
##   DE_11_A_15                 29.00    56.35    13.23                1.42
##   DE_16_A_20                 28.57    56.36    13.63                1.44
##   MAIS_DE_20                 27.59    56.33    14.33                1.75

QUANTIDADE DE ESCOLAS EM QUE TRABALHA

round((prop.table(Q7_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   APENAS_NESTA               27.17    57.14    14.13                1.56
##   EM_2                       28.57    56.55    13.46                1.42
##   EM_3                       29.49    54.36    14.38                1.77
##   EM_4_OU_MAIS               28.27    52.82    16.11                2.79

TIPO DE VÍNCULO

##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   EFETIVO                    29.73    56.18    12.69                1.40
##   TEMPORARIO                 23.05    57.93    17.13                1.90
##   CLT                        25.39    56.55    15.63                2.42
##   TERCEIRIZADO               20.25    55.33    20.80                3.62
##   PJ                         17.74    56.45    22.58                3.23
##   OUTRA                      27.17    55.81    14.57                2.46

3.3.4 Q8_VANTAGENS_SUPERAM_DESVANTAGENS

3.3.4.1 Q8_TERRITORIALIDADE

REGIÃO POLÍTICO-ADMINISTRATIVA

round((prop.table(Q7_X_REGIAO,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   NORTE                      25.74    55.47    16.33                2.46
##   NORDESTE                   23.58    58.30    16.38                1.74
##   SUDESTE                    31.24    55.71    11.74                1.32
##   SUL                        30.70    55.61    12.49                1.20
##   CENTRO_OESTE               25.99    58.20    14.35                1.46

REGIÃO GEOECONÔMICA AE

round((prop.table(Q8_X_GE_REGIAO,1)*100), 2)
##             
##              DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   AMAZONIA                  7.21    36.99    49.11                6.69
##   NORDESTE                  6.94    36.32    49.96                6.78
##   CENTRO-SUL                9.85    43.23    42.53                4.39

ÁREA

round((prop.table(Q8_X_AREA,1)*100), 2)
##           
##            DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   CAPITAL                12.38    45.18    38.43                4.00
##   INTERIOR                7.95    39.46    46.92                5.67

LOCALIZAÇÃO

round((prop.table(Q8_X_LOCALIZACAO,1)*100), 2)
##         
##          DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   URBANA                9.20    41.57    44.28                4.94
##   RURAL                 5.61    33.82    52.65                7.92

3.3.4.2 Q8_SISTEMA

DEPENDÊNCIA ADMINISTRATIVA

round((prop.table(Q8_X_DEPENDENCIA,1)*100), 2)
##            
##             DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   FEDERAL                  8.33    38.84    45.35                7.48
##   ESTADUAL                10.07    42.97    42.54                4.43
##   MUNICIPAL                7.29    37.90    48.49                6.31

SÉRIE

round((prop.table(Q8_X_SERIE,1)*100), 2)
##                     
##                      DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   9_ANO_EF                          9.30    41.67    44.33                4.71
##   5_ANO_EF                          7.04    37.84    48.48                6.64
##   3_ANO_EM                         10.25    42.61    42.72                4.41
##   3_ANO_EM_INTEGRADO                9.50    38.80    45.53                6.17

3.3.4.3 Q8_CARACTERÍSTICAS_PROFISSIONAIS

ANOS COMO PROFESSOR

round((prop.table(Q8_X_Q2_ANOS_PROFESSOR,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   PRIMEIRO_ANO                6.54    35.86    51.05                6.56
##   DE_1_A_2                    6.37    38.01    48.92                6.69
##   DE_3_A_5                    7.63    39.93    46.71                5.73
##   DE_6_A_10                   8.91    41.96    43.92                5.20
##   DE_11_A_15                  9.36    41.96    43.99                4.69
##   DE_16_A_20                  9.05    40.83    45.13                4.99
##   MAIS_DE_20                  8.39    38.84    46.88                5.89

QUANTIDADE DE ESCOLAS EM QUE TRABALHA

round((prop.table(Q8_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   APENAS_NESTA                8.23    39.74    46.34                5.69
##   EM_2                        8.85    41.16    45.17                4.82
##   EM_3                       10.24    42.06    42.56                5.14
##   EM_4_OU_MAIS               10.39    39.06    43.02                7.52

TIPO DE VÍNCULO

##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   EFETIVO                     9.32    41.41    44.43                4.83
##   TEMPORARIO                  6.85    37.72    48.57                6.85
##   CLT                         8.17    38.01    47.56                6.27
##   TERCEIRIZADO                7.61    34.78    48.91                8.70
##   PJ                          8.06    51.61    35.48                4.84
##   OUTRA                       9.36    38.23    45.81                6.60

3.3.5 Q9_SATISFEITO

3.3.5.1 Q9_TERRITORIALIDADE

REGIÃO POLÍTICO-ADMINISTRATIVA

round((prop.table(Q9_X_REGIAO,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   NORTE                       1.92    14.94    63.25               19.88
##   NORDESTE                    1.42    14.13    64.98               19.47
##   SUDESTE                     2.20    16.75    65.68               15.38
##   SUL                         2.68    19.27    63.93               14.12
##   CENTRO_OESTE                1.51    13.99    66.58               17.91

REGIÃO GEOECONÔMICA

round((prop.table(Q9_X_GE_REGIAO,1)*100), 2)
##             
##              DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   AMAZONIA                  1.71    15.08    64.23               18.98
##   NORDESTE                  1.40    13.81    64.95               19.84
##   CENTRO-SUL                2.27    17.11    65.30               15.32

ÁREA

round((prop.table(Q9_X_AREA,1)*100), 2)
##           
##            DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   CAPITAL                 2.85    19.93    63.23               13.99
##   INTERIOR                1.78    15.17    65.34               17.71

LOCALIZAÇÃO

round((prop.table(Q9_X_LOCALIZACAO,1)*100), 2)
##         
##          DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   URBANA                2.09    16.54    65.14               16.23
##   RURAL                 1.18    12.55    64.35               21.91

3.3.5.2 Q9_SISTEMA

DEPENDÊNCIA ADMINISTRATIVA

round((prop.table(Q9_X_DEPENDENCIA,1)*100), 2)
##            
##             DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   FEDERAL                  0.72     9.62    59.75               29.91
##   ESTADUAL                 2.49    18.94    64.37               14.20
##   MUNICIPAL                1.46    13.15    65.69               19.70

SÉRIE

round((prop.table(Q9_X_SERIE,1)*100), 2)
##                     
##                      DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   9_ANO_EF                          2.25    18.26    65.06               14.43
##   5_ANO_EF                          1.28    11.74    65.31               21.67
##   3_ANO_EM                          2.63    19.39    64.67               13.31
##   3_ANO_EM_INTEGRADO                1.65    14.35    61.63               22.37

3.3.5.3 Q9_CARACTERÍSTICAS_PROFISSIONAIS

ANOS COMO PROFESSOR

round((prop.table(Q9_X_Q2_ANOS_PROFESSOR,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   PRIMEIRO_ANO                1.39    10.83    65.44               22.34
##   DE_1_A_2                    1.09    11.51    66.73               20.67
##   DE_3_A_5                    1.40    12.67    66.44               19.50
##   DE_6_A_10                   1.85    15.73    65.54               16.87
##   DE_11_A_15                  2.10    17.38    64.66               15.85
##   DE_16_A_20                  2.01    17.37    65.34               15.28
##   MAIS_DE_20                  2.12    15.90    64.18               17.80

QUANTIDADE DE ESCOLAS EM QUE TRABALHA

round((prop.table(Q9_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)
##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   APENAS_NESTA                1.83    15.20    64.86               18.11
##   EM_2                        1.95    16.54    65.88               15.64
##   EM_3                        2.73    18.48    63.56               15.23
##   EM_4_OU_MAIS                2.66    16.79    60.74               19.81

TIPO DE VÍNCULO

##               
##                DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
##   EFETIVO                     2.14    17.14    65.31               15.42
##   TEMPORARIO                  1.44    12.78    64.38               21.39
##   CLT                         2.18    12.99    64.57               20.26
##   TERCEIRIZADO                2.00    16.91    60.00               21.09
##   PJ                          1.61    22.58    62.90               12.90
##   OUTRA                       2.08    15.42    62.06               20.45

3.4 Likert

O bloco que questões denominado “Concepções” utiliza como comando a seguinte orientação: “Indique o quanto você concorda ou discorda em relação aos seguintes temas envolvendo o seu trabalho como professor(a) da Educação Básica:”

Para tanto, usa a escala Likert. A seguir utilizamos o gráfico Likert representar as respostas que foram coletadas:

AE_VD <- AE %>% select(Q6_REALIZACAO_DE_SONHO, Q7_PROFISSAO_VALORIZADA, Q8_VANTAGENS_SUPERAM_DESVANTAGENS, Q9_SATISFEITO)

likert_SD2_VD <- likert(AE_VD)

likert_SD2_VD
##                                Item DISCORDO_FORTEMENTE  DISCORDO CONCORDO
## 1            Q6_REALIZACAO_DE_SONHO            1.717675  9.061549 52.97729
## 2           Q7_PROFISSAO_VALORIZADA           27.813119 56.652420 13.96977
## 3 Q8_VANTAGENS_SUPERAM_DESVANTAGENS            8.629686 40.334148 45.61875
## 4                     Q9_SATISFEITO            1.946359 15.899544 65.01641
##   CONCORDO_FORTEMENTE
## 1           36.243488
## 2            1.564693
## 3            5.417415
## 4           17.137686
### modelo likert 1

likert.bar.plot(likert_SD2_VD,plot.percents=T,legend = "Legenda", low.color = "#D8B365", text.size=4) + ggtitle("") + labs( x = "Questões", y = "Porcentagem") + theme_minimal() + theme(legend.position = "bottom")

4 Regressão Logística Binária

4.1 Correlação entre as variáveis dependentes

# Planejamento da análise:

## Q6_2 a Q9_2 são dependentes

## Foram construindo quatro modelos, um para cada variável dependente. As variáveis independentes são as mesmas para todos os modelos. Para 

### Modelo completo, com todas as outras VIs


BIN_SD2 <- SD2 %>% select(GE_REGIAO, AREA, LOCALIZACAO, DEPENDENCIA, SERIE, Q2_ANOS_COMO_PROFESSOR, Q4_QUANTAS_ESCOLAS_TRABALHA, Q5_TIPO_VINCULO, Q6_2_REALIZACAO_DE_SONHO, Q7_2_PROFISSAO_VALORIZADA, Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS, Q9_2_SATISFEITO)

glimpse(BIN_SD2)
## Rows: 311,597
## Columns: 12
## $ GE_REGIAO                           <fct> AMAZONIA, AMAZONIA, AMAZONIA, AMAZ~
## $ AREA                                <fct> INTERIOR, INTERIOR, INTERIOR, INTE~
## $ LOCALIZACAO                         <fct> RURAL, URBANA, URBANA, URBANA, URB~
## $ DEPENDENCIA                         <fct> MUNICIPAL, ESTADUAL, ESTADUAL, EST~
## $ SERIE                               <fct> 5_ANO_EF, 5_ANO_EF, 5_ANO_EF, 5_AN~
## $ Q2_ANOS_COMO_PROFESSOR              <fct> DE_16_A_20, MAIS_DE_20, MAIS_DE_20~
## $ Q4_QUANTAS_ESCOLAS_TRABALHA         <fct> APENAS_NESTA, APENAS_NESTA, APENAS~
## $ Q5_TIPO_VINCULO                     <fct> EFETIVO, EFETIVO, EFETIVO, EFETIVO~
## $ Q6_2_REALIZACAO_DE_SONHO            <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q7_2_PROFISSAO_VALORIZADA           <fct> DISCORDO, DISCORDO, DISCORDO, DISC~
## $ Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q9_2_SATISFEITO                     <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
# Reorganizando os níveis das VIs e VDs:

levels(BIN_SD2$GE_REGIAO) 
## [1] "AMAZONIA"   "NORDESTE"   "CENTRO-SUL"
levels(BIN_SD2$AREA)
## [1] "CAPITAL"  "INTERIOR"
levels(BIN_SD2$LOCALIZACAO)   
## [1] "URBANA" "RURAL"
levels(BIN_SD2$DEPENDENCIA)   
## [1] "FEDERAL"   "ESTADUAL"  "MUNICIPAL"
levels(BIN_SD2$SERIE)
## [1] "5_ANO_EF"           "9_ANO_EF"           "3_ANO_EM"          
## [4] "3_ANO_EM_INTEGRADO"
levels(BIN_SD2$Q2_ANOS_COMO_PROFESSOR)   
## [1] "PRIMEIRO_ANO" "DE_1_A_2"     "DE_3_A_5"     "DE_6_A_10"    "DE_11_A_15"  
## [6] "DE_16_A_20"   "MAIS_DE_20"
levels(BIN_SD2$Q4_QUANTAS_ESCOLAS_TRABALHA)   
## [1] "APENAS_NESTA" "EM_2"         "EM_3"         "EM_4_OU_MAIS"
levels(BIN_SD2$Q5_TIPO_VINCULO)   
## [1] "EFETIVO"      "TEMPORARIO"   "TERCEIRIZADO" "CLT"          "PJ"          
## [6] "OUTRA"
levels(BIN_SD2$Q6_2_REALIZACAO_DE_SONHO)   
## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q7_2_PROFISSAO_VALORIZADA)   
## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS)   
## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q9_2_SATISFEITO)
## [1] "DISCORDO" "CONCORDO"
BIN_SD2$GE_REGIAO <- factor(BIN_SD2$GE_REGIAO,
                               levels = c("AMAZONIA", "NORDESTE", "CENTRO-SUL"))

BIN_SD2$LOCALIZACAO <- factor(BIN_SD2$LOCALIZACAO,
                                 levels = c("URBANA", "RURAL"))

BIN_SD2$SERIE <- factor(BIN_SD2$SERIE,
                                 levels = c("9_ANO_EF", "5_ANO_EF", "3_ANO_EM", "3_ANO_EM_INTEGRADO"))

BIN_SD2$Q2_ANOS_COMO_PROFESSOR <- factor(BIN_SD2$Q2_ANOS_COMO_PROFESSOR,
                           levels = c("PRIMEIRO_ANO", "DE_1_A_2", "DE_3_A_5", "DE_6_A_10", "DE_11_A_15", "DE_16_A_20", "MAIS_DE_20"))

BIN_SD2$Q5_TIPO_VINCULO <- factor(BIN_SD2$Q5_TIPO_VINCULO,
                                            levels = c("EFETIVO", "TEMPORARIO", "CLT", "TERCEIRIZADO", "PJ", "OUTRA"))

BIN_SD2$Q6_2_REALIZACAO_DE_SONHO <- factor(BIN_SD2$Q6_2_REALIZACAO_DE_SONHO,
                                     levels = c("DISCORDO", "CONCORDO"))                      

BIN_SD2$Q7_2_PROFISSAO_VALORIZADA <- factor(BIN_SD2$Q7_2_PROFISSAO_VALORIZADA,
                                              levels = c("DISCORDO", "CONCORDO"))                      

BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS,
                                               levels = c("DISCORDO", "CONCORDO")) 

BIN_SD2$Q9_2_SATISFEITO <- factor(BIN_SD2$Q9_2_SATISFEITO,
                                               levels = c("DISCORDO", "CONCORDO")) 

levels(BIN_SD2$GE_REGIAO) 
## [1] "AMAZONIA"   "NORDESTE"   "CENTRO-SUL"
levels(BIN_SD2$AREA)
## [1] "CAPITAL"  "INTERIOR"
levels(BIN_SD2$LOCALIZACAO)   
## [1] "URBANA" "RURAL"
levels(BIN_SD2$DEPENDENCIA)   
## [1] "FEDERAL"   "ESTADUAL"  "MUNICIPAL"
levels(BIN_SD2$SERIE)
## [1] "9_ANO_EF"           "5_ANO_EF"           "3_ANO_EM"          
## [4] "3_ANO_EM_INTEGRADO"
levels(BIN_SD2$Q2_ANOS_COMO_PROFESSOR)   
## [1] "PRIMEIRO_ANO" "DE_1_A_2"     "DE_3_A_5"     "DE_6_A_10"    "DE_11_A_15"  
## [6] "DE_16_A_20"   "MAIS_DE_20"
levels(BIN_SD2$Q4_QUANTAS_ESCOLAS_TRABALHA)   
## [1] "APENAS_NESTA" "EM_2"         "EM_3"         "EM_4_OU_MAIS"
levels(BIN_SD2$Q5_TIPO_VINCULO)   
## [1] "EFETIVO"      "TEMPORARIO"   "CLT"          "TERCEIRIZADO" "PJ"          
## [6] "OUTRA"
levels(BIN_SD2$Q6_2_REALIZACAO_DE_SONHO)   
## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q7_2_PROFISSAO_VALORIZADA)   
## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS)   
## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q9_2_SATISFEITO)
## [1] "DISCORDO" "CONCORDO"
##################### Modelos de regressão logística binária ########################


############# Modelo Q6  ######################################

## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_lin_Q6 <- lm(as.numeric(Q6_2_REALIZACAO_DE_SONHO) ~ GE_REGIAO + AREA + LOCALIZACAO 
            + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
              as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
              Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_lin_Q6)
##                                             GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO                               1.163545  2        1.038594
## AREA                                    1.047089  1        1.023273
## LOCALIZACAO                             1.174142  1        1.083579
## DEPENDENCIA                             2.610307  2        1.271080
## SERIE                                   2.406874  3        1.157645
## Q2_ANOS_COMO_PROFESSOR                  1.254857  6        1.019099
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022173  1        1.011026
## Q5_TIPO_VINCULO                         1.302335  5        1.026768
### Os VIFs são inferiores a 5, indicando ausência de multicolinearidade

## Criação do modelo de regressão logística binária
mod_bin_Q6 <- glm(Q6_2_REALIZACAO_DE_SONHO ~ GE_REGIAO + AREA + LOCALIZACAO + DEPENDENCIA +
                 + SERIE + Q2_ANOS_COMO_PROFESSOR +
                   as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
                   Q5_TIPO_VINCULO,
                 data = BIN_SD2, family = "binomial"(link = "logit"))

## Overall effects
tbl_over_bin_Q6 <- Anova(mod_bin_Q6, type = 'II', test = "Wald")
write.table(tbl_over_bin_Q6, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = T)
tbl_over_bin_Q6
## Analysis of Deviance Table (Type II tests)
## 
## Response: Q6_2_REALIZACAO_DE_SONHO
##                                         Df    Chisq            Pr(>Chisq)    
## GE_REGIAO                                2 554.1440 < 0.00000000000000022 ***
## AREA                                     1  79.6236 < 0.00000000000000022 ***
## LOCALIZACAO                              1  31.5665         0.00000001927 ***
## DEPENDENCIA                              2   5.0989               0.07812 .  
## SERIE                                    3 553.7788 < 0.00000000000000022 ***
## Q2_ANOS_COMO_PROFESSOR                   6 139.7542 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  1  29.4929         0.00000005612 ***
## Q5_TIPO_VINCULO                          5 826.1597 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
length(mod_bin_Q6$residuals)
## [1] 219980
#### Observação: apenas a variável "dependencia" apresentou o qui-quadrado maior que 0,5. Assim, no momento, deixaremos fora de nossa análise.

mod_bin_Q6_ajustado <- glm(Q6_2_REALIZACAO_DE_SONHO ~ GE_REGIAO + AREA + LOCALIZACAO + 
                 + SERIE + Q2_ANOS_COMO_PROFESSOR +
                   as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
                   Q5_TIPO_VINCULO,
                 data = BIN_SD2, family = "binomial"(link = "logit"))



## Efeitos específicos
summary(mod_bin_Q6_ajustado)
## 
## Call:
## glm(formula = Q6_2_REALIZACAO_DE_SONHO ~ GE_REGIAO + AREA + LOCALIZACAO + 
##     +SERIE + Q2_ANOS_COMO_PROFESSOR + as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) + 
##     Q5_TIPO_VINCULO, family = binomial(link = "logit"), data = BIN_SD2)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.5306   0.3911   0.4487   0.5157   1.0103  
## 
## Coefficients:
##                                          Estimate Std. Error z value
## (Intercept)                              1.415767   0.058518  24.194
## GE_REGIAONORDESTE                        0.255262   0.020014  12.754
## GE_REGIAOCENTRO-SUL                      0.429979   0.018025  23.854
## AREAINTERIOR                             0.163061   0.018569   8.781
## LOCALIZACAORURAL                         0.110348   0.020620   5.352
## SERIE5_ANO_EF                            0.375109   0.016417  22.848
## SERIE3_ANO_EM                           -0.055181   0.017749  -3.109
## SERIE3_ANO_EM_INTEGRADO                 -0.042351   0.052610  -0.805
## Q2_ANOS_COMO_PROFESSORDE_1_A_2           0.124659   0.068092   1.831
## Q2_ANOS_COMO_PROFESSORDE_3_A_5           0.127005   0.057377   2.214
## Q2_ANOS_COMO_PROFESSORDE_6_A_10          0.047942   0.054153   0.885
## Q2_ANOS_COMO_PROFESSORDE_11_A_15         0.001166   0.054344   0.021
## Q2_ANOS_COMO_PROFESSORDE_16_A_20         0.027550   0.054629   0.504
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20         0.202805   0.054036   3.753
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) -0.051367   0.009404  -5.462
## Q5_TIPO_VINCULOTEMPORARIO                0.514736   0.018938  27.180
## Q5_TIPO_VINCULOCLT                       0.250970   0.066875   3.753
## Q5_TIPO_VINCULOTERCEIRIZADO             -0.851685   0.100871  -8.443
## Q5_TIPO_VINCULOPJ                       -0.478054   0.334961  -1.427
## Q5_TIPO_VINCULOOUTRA                     0.026418   0.098826   0.267
##                                                     Pr(>|z|)    
## (Intercept)                             < 0.0000000000000002 ***
## GE_REGIAONORDESTE                       < 0.0000000000000002 ***
## GE_REGIAOCENTRO-SUL                     < 0.0000000000000002 ***
## AREAINTERIOR                            < 0.0000000000000002 ***
## LOCALIZACAORURAL                                0.0000000872 ***
## SERIE5_ANO_EF                           < 0.0000000000000002 ***
## SERIE3_ANO_EM                                       0.001878 ** 
## SERIE3_ANO_EM_INTEGRADO                             0.420824    
## Q2_ANOS_COMO_PROFESSORDE_1_A_2                      0.067138 .  
## Q2_ANOS_COMO_PROFESSORDE_3_A_5                      0.026862 *  
## Q2_ANOS_COMO_PROFESSORDE_6_A_10                     0.375988    
## Q2_ANOS_COMO_PROFESSORDE_11_A_15                    0.982875    
## Q2_ANOS_COMO_PROFESSORDE_16_A_20                    0.614046    
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20                    0.000175 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)         0.0000000471 ***
## Q5_TIPO_VINCULOTEMPORARIO               < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT                                  0.000175 ***
## Q5_TIPO_VINCULOTERCEIRIZADO             < 0.0000000000000002 ***
## Q5_TIPO_VINCULOPJ                                   0.153525    
## Q5_TIPO_VINCULOOUTRA                                0.789225    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 149975  on 219979  degrees of freedom
## Residual deviance: 147462  on 219960  degrees of freedom
##   (91617 observations deleted due to missingness)
## AIC: 147502
## 
## Number of Fisher Scoring iterations: 5
## Tabela resumo completa
tbl_bin_Q6 <- gtsummary::tbl_regression(mod_bin_Q6_ajustado, exponentiate = T) %>% 
  as_tibble()

  write.table(tbl_bin_Q6, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = F)
tbl_bin_Q6
## # A tibble: 31 x 4
##    `**Características**` `**OR**` `**95% IC**` `**Valor p**`
##    <chr>                 <chr>    <chr>        <chr>        
##  1 GE_REGIAO             <NA>     <NA>         <NA>         
##  2 AMAZONIA              <NA>     <NA>         <NA>         
##  3 NORDESTE              1,29     1,24; 1,34   <0,001       
##  4 CENTRO-SUL            1,54     1,48; 1,59   <0,001       
##  5 AREA                  <NA>     <NA>         <NA>         
##  6 CAPITAL               <NA>     <NA>         <NA>         
##  7 INTERIOR              1,18     1,13; 1,22   <0,001       
##  8 LOCALIZACAO           <NA>     <NA>         <NA>         
##  9 URBANA                <NA>     <NA>         <NA>         
## 10 RURAL                 1,12     1,07; 1,16   <0,001       
## # ... with 21 more rows
## Obtenção do "n" usado no modelo
length(mod_bin_Q6_ajustado$residuals)
## [1] 219980
## Construção de um gráfico

plot_model(mod_bin_Q6_ajustado, title = "", axis.title = "Razão de chances (OR)",
           colors = "black", dot.size = 1.5, line.size = 0.5,
           vline.color = "gray50", transform = "exp",
           axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
                               "Região: Centro-sul<sup>1</sup>",
                               "Área: Interior<sup>2</sup>",
                               "Localização: Rural<sup>3</sup>",
                               "Série: 5º ano EF<sup>4</sup>",
                               "Série: 3º ano EM<sup>4</sup>",
                               "Série: 3º ano EM Integrado<sup>4</sup>",
                               "Anos de docência: 1-2 anos<sup>5</sup>",
                               "Anos de docência: 3-5 anos<sup>5</sup>",
                               "Anos de docência: 6-10 anos<sup>5</sup>",
                               "Anos de docência: 11-15 anos<sup>5</sup>",
                               "Anos de docência: 16-20 anos<sup>5</sup>",
                               "Anos de docência: Mais de 20 anos<sup>5</sup>",
                               "Maior número de escolas<sup>6</sup>",
                               "Tipo de vínculo: Temporário<sup>7</sup>",
                               "Tipo de vínculo: CLT<sup>7</sup>",
                               "Tipo de vínculo: Terceirizado<sup>7</sup>",
                               "Tipo de vínculo: PJ<sup>7</sup>",
                               "Tipo de vínculo: Outras<sup>7</sup>"))) +
  scale_y_continuous(label = scales::number_format(accuracy = 0.1,
                                                   decimal.mark = ",")) +
  labs(caption = '1. Categoria de referência = "Amazônia"
       2. Categoria de referência = "Capital"
       3. Categoria de referência = "Urbano"
       4. Categoria de referência = "9 ano EF"
       5. Categoria de referência = "Primeiro ano"
       6. Categoria de referência = "Menor número de escolas"
       7. Categoria de referência = "Efetivo"') +
  theme_sjplot() +
  theme(plot.background = element_rect(fill = "white", color = "white"),
       axis.title.x = element_text(size = 10, color = "black"),
        axis.text.y = element_markdown(size = 10, color = "black"),
        plot.caption = element_text(size = 8, color = "black"),
        panel.spacing = unit(1, "lines"))
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

ggsave("Mod_Bin_4.png", dpi = 600, width = 16, height = 11, units = "cm")

############# Modelo Q7   ######################################

## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_5 <- lm(as.numeric(Q7_2_PROFISSAO_VALORIZADA) ~ GE_REGIAO + AREA + LOCALIZACAO 
            + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
              as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
              Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_5)
##                                             GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO                               1.163481  2        1.038580
## AREA                                    1.047025  1        1.023243
## LOCALIZACAO                             1.174023  1        1.083523
## DEPENDENCIA                             2.615510  2        1.271713
## SERIE                                   2.411293  3        1.157999
## Q2_ANOS_COMO_PROFESSOR                  1.254849  6        1.019098
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022080  1        1.010980
## Q5_TIPO_VINCULO                         1.302466  5        1.026778
### Os VIFs são inferiores a 5, indício de ausência de multicolinearidade

## Criação do modelo de regressão logística binária
mod_bin_5 <- glm(Q7_2_PROFISSAO_VALORIZADA ~ GE_REGIAO + AREA + LOCALIZACAO 
                 + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
                   as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
                   Q5_TIPO_VINCULO,
                 data = BIN_SD2, family = "binomial"(link = "logit"))

## Overall effects
tbl_over_bin_5 <- Anova(mod_bin_5, type = 'II', test = "Wald")
write.table(tbl_over_bin_5, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = T)

tbl_over_bin_5
## Analysis of Deviance Table (Type II tests)
## 
## Response: Q7_2_PROFISSAO_VALORIZADA
##                                         Df    Chisq            Pr(>Chisq)    
## GE_REGIAO                                2 582.9195 < 0.00000000000000022 ***
## AREA                                     1 283.6639 < 0.00000000000000022 ***
## LOCALIZACAO                              1 203.9311 < 0.00000000000000022 ***
## DEPENDENCIA                              2   8.1583              0.016922 *  
## SERIE                                    3  70.0651  0.000000000000004134 ***
## Q2_ANOS_COMO_PROFESSOR                   6 281.3162 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  1   8.2249              0.004132 ** 
## Q5_TIPO_VINCULO                          5 749.9189 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Efeitos específicos
summary(mod_bin_5)
## 
## Call:
## glm(formula = Q7_2_PROFISSAO_VALORIZADA ~ GE_REGIAO + AREA + 
##     LOCALIZACAO + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR + 
##     as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) + Q5_TIPO_VINCULO, 
##     family = binomial(link = "logit"), data = BIN_SD2)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -0.9418  -0.6111  -0.5497  -0.4830   2.3233  
## 
## Coefficients:
##                                          Estimate Std. Error z value
## (Intercept)                             -2.201630   0.102890 -21.398
## GE_REGIAONORDESTE                       -0.007207   0.017166  -0.420
## GE_REGIAOCENTRO-SUL                     -0.311820   0.016076 -19.397
## AREAINTERIOR                             0.312332   0.018544  16.842
## LOCALIZACAORURAL                         0.231467   0.016209  14.280
## DEPENDENCIAESTADUAL                      0.243249   0.093092   2.613
## DEPENDENCIAMUNICIPAL                     0.223688   0.094343   2.371
## SERIE5_ANO_EF                            0.114530   0.014419   7.943
## SERIE3_ANO_EM                            0.078410   0.018151   4.320
## SERIE3_ANO_EM_INTEGRADO                  0.059127   0.056852   1.040
## Q2_ANOS_COMO_PROFESSORDE_1_A_2          -0.097806   0.049847  -1.962
## Q2_ANOS_COMO_PROFESSORDE_3_A_5          -0.206141   0.042485  -4.852
## Q2_ANOS_COMO_PROFESSORDE_6_A_10         -0.221798   0.040215  -5.515
## Q2_ANOS_COMO_PROFESSORDE_11_A_15        -0.162285   0.040613  -3.996
## Q2_ANOS_COMO_PROFESSORDE_16_A_20        -0.087878   0.040921  -2.148
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20         0.042806   0.040056   1.069
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  0.023291   0.008121   2.868
## Q5_TIPO_VINCULOTEMPORARIO                0.388055   0.014663  26.464
## Q5_TIPO_VINCULOCLT                       0.381210   0.049620   7.683
## Q5_TIPO_VINCULOTERCEIRIZADO              0.663719   0.101801   6.520
## Q5_TIPO_VINCULOPJ                        0.696645   0.298946   2.330
## Q5_TIPO_VINCULOOUTRA                     0.190921   0.084672   2.255
##                                                     Pr(>|z|)    
## (Intercept)                             < 0.0000000000000002 ***
## GE_REGIAONORDESTE                                    0.67463    
## GE_REGIAOCENTRO-SUL                     < 0.0000000000000002 ***
## AREAINTERIOR                            < 0.0000000000000002 ***
## LOCALIZACAORURAL                        < 0.0000000000000002 ***
## DEPENDENCIAESTADUAL                                  0.00898 ** 
## DEPENDENCIAMUNICIPAL                                 0.01774 *  
## SERIE5_ANO_EF                            0.00000000000000198 ***
## SERIE3_ANO_EM                            0.00001560614922242 ***
## SERIE3_ANO_EM_INTEGRADO                              0.29834    
## Q2_ANOS_COMO_PROFESSORDE_1_A_2                       0.04975 *  
## Q2_ANOS_COMO_PROFESSORDE_3_A_5           0.00000122191920151 ***
## Q2_ANOS_COMO_PROFESSORDE_6_A_10          0.00000003480796407 ***
## Q2_ANOS_COMO_PROFESSORDE_11_A_15         0.00006446055662882 ***
## Q2_ANOS_COMO_PROFESSORDE_16_A_20                     0.03175 *  
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20                     0.28523    
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)              0.00413 ** 
## Q5_TIPO_VINCULOTEMPORARIO               < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT                       0.00000000000001559 ***
## Q5_TIPO_VINCULOTERCEIRIZADO              0.00000000007041205 ***
## Q5_TIPO_VINCULOPJ                                    0.01979 *  
## Q5_TIPO_VINCULOOUTRA                                 0.02414 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 190203  on 220523  degrees of freedom
## Residual deviance: 187565  on 220502  degrees of freedom
##   (91073 observations deleted due to missingness)
## AIC: 187609
## 
## Number of Fisher Scoring iterations: 4
## Tabela resumo completa
tbl_bin_5 <- gtsummary::tbl_regression(mod_bin_5, exponentiate = T) %>% 
  as_tibble()

write.table(tbl_bin_5, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = F)

## Obtenção do n usado no modelo
length(mod_bin_5$residuals)
## [1] 220524
## Construção de um gráfico

plot_model(mod_bin_5, title = "", axis.title = "Razão de chances (OR)",
           colors = "black", dot.size = 1.5, line.size = 0.5,
           vline.color = "grey50", transform = "exp",
           axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
                               "Região: Centro-sul<sup>1</sup>",
                               "Área: Interior<sup>2</sup>",
                               "Localização: Rural<sup>3</sup>",
                               "Dependência: Federal<sup>4</sup>",
                               "Dependência: Municipal<sup>4</sup>",
                               "Série: 5º ano EF<sup>5</sup>",
                               "Série: 3º ano EM<sup>5</sup>",
                               "Série: 3º ano EM Integrado<sup>5</sup>",
                               "Anos de docência: 1-2 anos<sup>6</sup>",
                               "Anos de docência: 3-5 anos<sup>6</sup>",
                               "Anos de docência: 6-10 anos<sup>6</sup>",
                               "Anos de docência: 11-15 anos<sup>6</sup>",
                               "Anos de docência: 16-20 anos<sup>6</sup>",
                               "Anos de docência: Mais de 20 anos<sup>6</sup>",
                               "Maior número de escolas<sup>7</sup>",
                               "Tipo de vínculo: Temporário<sup>8</sup>",
                               "Tipo de vínculo: CLT<sup>8</sup>",
                               "Tipo de vínculo: Terceirizado<sup>8</sup>",
                               "Tipo de vínculo: PJ<sup>8</sup>",
                               "Tipo de vínculo: Outras<sup>8</sup>"))) +
  scale_y_continuous(label = scales::number_format(accuracy = 0.1,
                                                   decimal.mark = ",")) +
  labs(caption = '1. Categoria de referência = "Amazônia"
       2. Categoria de referência = "Capital"
       3. Categoria de referência = "Urbano"
       4. Categoria de referência = "Estadual"
       5. Categoria de referência = "9 ano EF"
       6. Categoria de referência = "Primeiro ano"
       7. Categoria de referência = "Menor número de escolas"
       8. Categoria de referência = "Efetivo"') +
  theme_sjplot() +
  theme(plot.background = element_rect(fill = "white", color = "white"),
        axis.title.x = element_text(size = 10, color = "black"),
        axis.text.y = element_markdown(size = 10, color = "black"),
        plot.caption = element_text(size = 8, color = "black"),
        panel.spacing = unit(1, "lines"))
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

ggsave("Mod_Bin_5.png", dpi = 600, width = 16, height = 11, units = "cm")

############# Modelo 6: Q8 modelo completo  ######################################

## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_6 <- lm(as.numeric(Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS) ~ GE_REGIAO + AREA + LOCALIZACAO 
            + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
              as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
              Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_6)
##                                             GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO                               1.163550  2        1.038595
## AREA                                    1.047015  1        1.023237
## LOCALIZACAO                             1.173909  1        1.083471
## DEPENDENCIA                             2.616778  2        1.271867
## SERIE                                   2.412515  3        1.158097
## Q2_ANOS_COMO_PROFESSOR                  1.254730  6        1.019090
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022076  1        1.010978
## Q5_TIPO_VINCULO                         1.302441  5        1.026776
### Os VIFs são inferiores a 5, indício de ausência de multicolinearidade

## Criação do modelo de regressão logística binária
mod_bin_6 <- glm(Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS ~ GE_REGIAO + AREA + LOCALIZACAO 
                 + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
                   as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
                   Q5_TIPO_VINCULO,
                 data = BIN_SD2, family = "binomial"(link = "logit"))

## Overall effects
tbl_over_bin_6 <- Anova(mod_bin_6, type = 'II', test = "Wald")
write.table(tbl_over_bin_6, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = T)

tbl_over_bin_6
## Analysis of Deviance Table (Type II tests)
## 
## Response: Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS
##                                         Df    Chisq            Pr(>Chisq)    
## GE_REGIAO                                2 1081.153 < 0.00000000000000022 ***
## AREA                                     1  738.567 < 0.00000000000000022 ***
## LOCALIZACAO                              1  349.417 < 0.00000000000000022 ***
## DEPENDENCIA                              2  115.762 < 0.00000000000000022 ***
## SERIE                                    3  560.475 < 0.00000000000000022 ***
## Q2_ANOS_COMO_PROFESSOR                   6  519.344 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  1   40.788       0.0000000001696 ***
## Q5_TIPO_VINCULO                          5  731.094 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Efeitos específicos
summary(mod_bin_6)
## 
## Call:
## glm(formula = Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS ~ GE_REGIAO + 
##     AREA + LOCALIZACAO + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR + 
##     as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) + Q5_TIPO_VINCULO, 
##     family = binomial(link = "logit"), data = BIN_SD2)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.6754  -1.1546   0.8716   1.1398   1.5948  
## 
## Coefficients:
##                                           Estimate Std. Error z value
## (Intercept)                              0.0318255  0.0704469   0.452
## GE_REGIAONORDESTE                        0.0159616  0.0134122   1.190
## GE_REGIAOCENTRO-SUL                     -0.2965002  0.0120546 -24.597
## AREAINTERIOR                             0.3347180  0.0123164  27.177
## LOCALIZACAORURAL                         0.2410839  0.0128972  18.693
## DEPENDENCIAESTADUAL                     -0.2111664  0.0616830  -3.423
## DEPENDENCIAMUNICIPAL                    -0.0904843  0.0626204  -1.445
## SERIE5_ANO_EF                            0.2488400  0.0105719  23.538
## SERIE3_ANO_EM                            0.0376703  0.0129999   2.898
## SERIE3_ANO_EM_INTEGRADO                  0.0958026  0.0414977   2.309
## Q2_ANOS_COMO_PROFESSORDE_1_A_2          -0.0802957  0.0395369  -2.031
## Q2_ANOS_COMO_PROFESSORDE_3_A_5          -0.1950477  0.0336268  -5.800
## Q2_ANOS_COMO_PROFESSORDE_6_A_10         -0.2497614  0.0319707  -7.812
## Q2_ANOS_COMO_PROFESSORDE_11_A_15        -0.2213036  0.0322414  -6.864
## Q2_ANOS_COMO_PROFESSORDE_16_A_20        -0.1487478  0.0324661  -4.582
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20        -0.0007627  0.0319270  -0.024
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) -0.0382493  0.0059890  -6.387
## Q5_TIPO_VINCULOTEMPORARIO                0.2930720  0.0110722  26.469
## Q5_TIPO_VINCULOCLT                       0.2602510  0.0384838   6.763
## Q5_TIPO_VINCULOTERCEIRIZADO              0.3776980  0.0886753   4.259
## Q5_TIPO_VINCULOPJ                       -0.3896122  0.2646434  -1.472
## Q5_TIPO_VINCULOOUTRA                     0.0852098  0.0640280   1.331
##                                                     Pr(>|z|)    
## (Intercept)                                         0.651438    
## GE_REGIAONORDESTE                                   0.234015    
## GE_REGIAOCENTRO-SUL                     < 0.0000000000000002 ***
## AREAINTERIOR                            < 0.0000000000000002 ***
## LOCALIZACAORURAL                        < 0.0000000000000002 ***
## DEPENDENCIAESTADUAL                                 0.000618 ***
## DEPENDENCIAMUNICIPAL                                0.148468    
## SERIE5_ANO_EF                           < 0.0000000000000002 ***
## SERIE3_ANO_EM                                       0.003759 ** 
## SERIE3_ANO_EM_INTEGRADO                             0.020964 *  
## Q2_ANOS_COMO_PROFESSORDE_1_A_2                      0.042265 *  
## Q2_ANOS_COMO_PROFESSORDE_3_A_5           0.00000000661729695 ***
## Q2_ANOS_COMO_PROFESSORDE_6_A_10          0.00000000000000562 ***
## Q2_ANOS_COMO_PROFESSORDE_11_A_15         0.00000000000669830 ***
## Q2_ANOS_COMO_PROFESSORDE_16_A_20         0.00000461362125443 ***
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20                    0.980942    
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  0.00000000016962786 ***
## Q5_TIPO_VINCULOTEMPORARIO               < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT                       0.00000000001355342 ***
## Q5_TIPO_VINCULOTERCEIRIZADO              0.00002050353004226 ***
## Q5_TIPO_VINCULOPJ                                   0.140963    
## Q5_TIPO_VINCULOOUTRA                                0.183248    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 305428  on 220385  degrees of freedom
## Residual deviance: 299581  on 220364  degrees of freedom
##   (91211 observations deleted due to missingness)
## AIC: 299625
## 
## Number of Fisher Scoring iterations: 4
## Tabela resumo completa
tbl_bin_6 <- gtsummary::tbl_regression(mod_bin_6, exponentiate = T) %>% 
  as_tibble()

write.table(tbl_bin_6, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = F)

## Obtenção do n usado no modelo
length(mod_bin_6$residuals)
## [1] 220386
## Construção de um gráfico

plot_model(mod_bin_6, title = "", axis.title = "Razão de chances (OR)",
           colors = "black", dot.size = 1.5, line.size = 0.5,
           vline.color = "grey50", transform = "exp",
           axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
                               "Região: Centro-sul<sup>1</sup>",
                               "Área: Interior<sup>2</sup>",
                               "Localização: Rural<sup>3</sup>",
                               "Dependência: Federal<sup>4</sup>",
                               "Dependência: Municipal<sup>4</sup>",
                               "Série: 5º ano EF<sup>5</sup>",
                               "Série: 3º ano EM<sup>5</sup>",
                               "Série: 3º ano EM Integrado<sup>5</sup>",
                               "Anos de docência: 1-2 anos<sup>6</sup>",
                               "Anos de docência: 3-5 anos<sup>6</sup>",
                               "Anos de docência: 6-10 anos<sup>6</sup>",
                               "Anos de docência: 11-15 anos<sup>6</sup>",
                               "Anos de docência: 16-20 anos<sup>6</sup>",
                               "Anos de docência: Mais de 20 anos<sup>6</sup>",
                               "Maior número de escolas<sup>7</sup>",
                               "Tipo de vínculo: Temporário<sup>8</sup>",
                               "Tipo de vínculo: CLT<sup>8</sup>",
                               "Tipo de vínculo: Terceirizado<sup>8</sup>",
                               "Tipo de vínculo: PJ<sup>8</sup>",
                               "Tipo de vínculo: Outras<sup>8</sup>"))) +
  scale_y_continuous(label = scales::number_format(accuracy = 0.1,
                                                   decimal.mark = ",")) +
  labs(caption = '1. Categoria de referência = "Amazônia"
       2. Categoria de referência = "Capital"
       3. Categoria de referência = "Urbano"
       4. Categoria de referência = "Estadual"
       5. Categoria de referência = "9 ano EF"
       6. Categoria de referência = "Primeiro ano"
       7. Categoria de referência = "Menor número de escolas"
       8. Categoria de referência = "Efetivo"') +
  theme_sjplot() +
  theme(plot.background = element_rect(fill = "white", color = "white"),
        axis.title.x = element_text(size = 10, color = "black"),
        axis.text.y = element_markdown(size = 10, color = "black"),
        plot.caption = element_text(size = 8, color = "black"),
        panel.spacing = unit(1, "lines"))
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

ggsave("Mod_Bin_6.png", dpi = 600, width = 16, height = 11, units = "cm")

############# Modelo 7: Q9 modelo completo ######################################

## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_7 <- lm(as.numeric(Q9_2_SATISFEITO) ~ GE_REGIAO + AREA + LOCALIZACAO 
            + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
              as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
              Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_7)
##                                             GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO                               1.163579  2        1.038602
## AREA                                    1.047044  1        1.023252
## LOCALIZACAO                             1.173994  1        1.083510
## DEPENDENCIA                             2.617607  2        1.271968
## SERIE                                   2.413272  3        1.158158
## Q2_ANOS_COMO_PROFESSOR                  1.254751  6        1.019091
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022036  1        1.010958
## Q5_TIPO_VINCULO                         1.302476  5        1.026779
### Os VIFs são inferiores a 5, indício de ausência de multicolinearidade

## Criação do modelo de regressão logística binária
mod_bin_7 <- glm(Q9_2_SATISFEITO ~ GE_REGIAO + AREA + LOCALIZACAO 
                 + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
                   as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
                   Q5_TIPO_VINCULO,
                 data = BIN_SD2, family = "binomial"(link = "logit"))

## Overall effects
tbl_over_bin_7 <- Anova(mod_bin_7, type = 'II', test = "Wald")
write.table(tbl_over_bin_7, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = T)

tbl_over_bin_7
## Analysis of Deviance Table (Type II tests)
## 
## Response: Q9_2_SATISFEITO
##                                         Df    Chisq            Pr(>Chisq)    
## GE_REGIAO                                2  233.781 < 0.00000000000000022 ***
## AREA                                     1  423.760 < 0.00000000000000022 ***
## LOCALIZACAO                              1   56.072   0.00000000000006986 ***
## DEPENDENCIA                              2  308.863 < 0.00000000000000022 ***
## SERIE                                    3 1324.875 < 0.00000000000000022 ***
## Q2_ANOS_COMO_PROFESSOR                   6  243.282 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  1   54.757   0.00000000000013642 ***
## Q5_TIPO_VINCULO                          5  610.766 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Efeitos específicos
summary(mod_bin_7)
## 
## Call:
## glm(formula = Q9_2_SATISFEITO ~ GE_REGIAO + AREA + LOCALIZACAO + 
##     DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR + as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) + 
##     Q5_TIPO_VINCULO, family = binomial(link = "logit"), data = BIN_SD2)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.4634   0.4672   0.5638   0.6748   0.9815  
## 
## Coefficients:
##                                          Estimate Std. Error z value
## (Intercept)                              2.134676   0.106149  20.110
## GE_REGIAONORDESTE                        0.094040   0.018128   5.188
## GE_REGIAOCENTRO-SUL                     -0.123519   0.015807  -7.814
## AREAINTERIOR                             0.305577   0.014844  20.585
## LOCALIZACAORURAL                         0.135035   0.018033   7.488
## DEPENDENCIAESTADUAL                     -0.864408   0.093984  -9.197
## DEPENDENCIAMUNICIPAL                    -0.636567   0.095022  -6.699
## SERIE5_ANO_EF                            0.517544   0.014293  36.209
## SERIE3_ANO_EM                            0.056848   0.015679   3.626
## SERIE3_ANO_EM_INTEGRADO                  0.140794   0.053108   2.651
## Q2_ANOS_COMO_PROFESSORDE_1_A_2          -0.014448   0.059192  -0.244
## Q2_ANOS_COMO_PROFESSORDE_3_A_5          -0.125793   0.050036  -2.514
## Q2_ANOS_COMO_PROFESSORDE_6_A_10         -0.306470   0.047402  -6.465
## Q2_ANOS_COMO_PROFESSORDE_11_A_15        -0.378131   0.047598  -7.944
## Q2_ANOS_COMO_PROFESSORDE_16_A_20        -0.357440   0.047856  -7.469
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20        -0.241019   0.047321  -5.093
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) -0.056440   0.007627  -7.400
## Q5_TIPO_VINCULOTEMPORARIO                0.366139   0.015015  24.384
## Q5_TIPO_VINCULOCLT                       0.292768   0.053469   5.475
## Q5_TIPO_VINCULOTERCEIRIZADO              0.024193   0.112560   0.215
## Q5_TIPO_VINCULOPJ                       -0.299330   0.301412  -0.993
## Q5_TIPO_VINCULOOUTRA                     0.049306   0.084559   0.583
##                                                     Pr(>|z|)    
## (Intercept)                             < 0.0000000000000002 ***
## GE_REGIAONORDESTE                        0.00000021304807565 ***
## GE_REGIAOCENTRO-SUL                      0.00000000000000553 ***
## AREAINTERIOR                            < 0.0000000000000002 ***
## LOCALIZACAORURAL                         0.00000000000006986 ***
## DEPENDENCIAESTADUAL                     < 0.0000000000000002 ***
## DEPENDENCIAMUNICIPAL                     0.00000000002096661 ***
## SERIE5_ANO_EF                           < 0.0000000000000002 ***
## SERIE3_ANO_EM                                       0.000288 ***
## SERIE3_ANO_EM_INTEGRADO                             0.008024 ** 
## Q2_ANOS_COMO_PROFESSORDE_1_A_2                      0.807170    
## Q2_ANOS_COMO_PROFESSORDE_3_A_5                      0.011935 *  
## Q2_ANOS_COMO_PROFESSORDE_6_A_10          0.00000000010103192 ***
## Q2_ANOS_COMO_PROFESSORDE_11_A_15         0.00000000000000195 ***
## Q2_ANOS_COMO_PROFESSORDE_16_A_20         0.00000000000008076 ***
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20         0.00000035197824206 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA)  0.00000000000013642 ***
## Q5_TIPO_VINCULOTEMPORARIO               < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT                       0.00000004363995252 ***
## Q5_TIPO_VINCULOTERCEIRIZADO                         0.829817    
## Q5_TIPO_VINCULOPJ                                   0.320664    
## Q5_TIPO_VINCULOOUTRA                                0.559829    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 206712  on 220373  degrees of freedom
## Residual deviance: 201471  on 220352  degrees of freedom
##   (91223 observations deleted due to missingness)
## AIC: 201515
## 
## Number of Fisher Scoring iterations: 4
## Tabela resumo completa
tbl_bin_7 <- gtsummary::tbl_regression(mod_bin_7, exponentiate = T) %>% 
  as_tibble()

write.table(tbl_bin_7, pipe("pbcopy"),
            sep = "\t", dec = ",", row.names = F)

## Obtenção do n usado no modelo
length(mod_bin_7$residuals)
## [1] 220374
## Construção de um gráfico

plot_model(mod_bin_7, title = "", axis.title = "Razão de chances (OR)",
           colors = "black", dot.size = 1.5, line.size = 0.5,
           vline.color = "grey50", transform = "exp",
           axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
                               "Região: Centro-sul<sup>1</sup>",
                               "Área: Interior<sup>2</sup>",
                               "Localização: Rural<sup>3</sup>",
                               "Dependência: Federal<sup>4</sup>",
                               "Dependência: Municipal<sup>4</sup>",
                               "Série: 5º ano EF<sup>5</sup>",
                               "Série: 3º ano EM<sup>5</sup>",
                               "Série: 3º ano EM Integrado<sup>5</sup>",
                               "Anos de docência: 1-2 anos<sup>6</sup>",
                               "Anos de docência: 3-5 anos<sup>6</sup>",
                               "Anos de docência: 6-10 anos<sup>6</sup>",
                               "Anos de docência: 11-15 anos<sup>6</sup>",
                               "Anos de docência: 16-20 anos<sup>6</sup>",
                               "Anos de docência: Mais de 20 anos<sup>6</sup>",
                               "Maior número de escolas<sup>7</sup>",
                               "Tipo de vínculo: Temporário<sup>8</sup>",
                               "Tipo de vínculo: CLT<sup>8</sup>",
                               "Tipo de vínculo: Terceirizado<sup>8</sup>",
                               "Tipo de vínculo: PJ<sup>8</sup>",
                               "Tipo de vínculo: Outras<sup>8</sup>"))) +
  scale_y_continuous(label = scales::number_format(accuracy = 0.1,
                                                   decimal.mark = ",")) +
  labs(caption = '1. Categoria de referência = "Amazônia"
       2. Categoria de referência = "Capital"
       3. Categoria de referência = "Urbano"
       4. Categoria de referência = "Estadual"
       5. Categoria de referência = "9 ano EF"
       6. Categoria de referência = "Primeiro ano"
       7. Categoria de referência = "Menor número de escolas"
       8. Categoria de referência = "Efetivo"') +
  theme_sjplot() +
  theme(plot.background = element_rect(fill = "white", color = "white"),
       axis.title.x = element_text(size = 10, color = "black"),
        axis.text.y = element_markdown(size = 10, color = "black"),
        plot.caption = element_text(size = 8, color = "black"),
        panel.spacing = unit(1, "lines"))
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

ggsave("Mod_Bin_7.png", dpi = 600, width = 16, height = 11, units = "cm")