if(!require(pacman)) intall.packages("pacman")
library(pacman)
pacman::p_load(dplyr, rstatix, psych, car, MASS, DescTools, QuantPsyc, ggplot2,
nnet, AER, lmtest, DescTools, gtsummary, reshape2, sjPlot, ggtext)
library(readr)
library(tidyverse)
library(HH)
library(brant)
library(stats)
library(cowplot)
library(knitr)
library(likert)
library(rmarkdown)
library(kableExtra)
library(plyr)
library(devtools)options(scipen=999) # Evitando a notação científica
theme_gtsummary_language(
"pt", big.mark = ".", decimal.mark = ",",
ci.sep = "; ", set_theme = T) # Adequando às formatações brasileiras## Setting theme `language: pt`
show_col_types = FALSE# Ao carregar os dados criamos o banco "SD", para significar "Satisfação Docente". E depois criamos o SD2, com os filtros para os questionários considerados válidos pelo Inep e para as escolas públicas.
SD <- read_csv("D:/1_bases_originais/SAEB/Microdados_Saeb/DADOS/TS_PROFESSOR.csv")
SD2 <- filter(SD, IN_PREENCHIMENTO_QUESTIONARIO == "1")
SD2 <- filter(SD2, ID_DEPENDENCIA_ADM != "4")SD2$REGIAO <- factor(SD2$ID_REGIAO,
label = c("NORTE" ,
"NORDESTE",
"SUDESTE",
"SUL",
"CENTRO_OESTE"),
levels = c(1,
2,
3,
4,
5))
SD2$ESTADO <- factor(SD2$ID_UF,
label = c("RO",
"AC",
"AM",
"RR",
"PA",
"AP",
"TO",
"MA",
"PI",
"CE",
"RN",
"PB",
"PE",
"AL",
"SE",
"BA",
"MG",
"ES",
"RJ",
"SP",
"PR",
"SC",
"RS",
"MS",
"MT",
"GO",
"DF"),
levels = c(11,
12,
13,
14,
15,
16,
17,
21,
22,
23,
24,
25,
26,
27,
28,
29,
31,
32,
33,
35,
41,
42,
43,
50,
51,
52,
53))
SD2$AREA <- factor(SD2$ID_AREA,
label = c("CAPITAL",
"INTERIOR"),
levels = c(1,
2))
SD2$DEPENDENCIA <- factor(SD2$ID_DEPENDENCIA_ADM,
label = c("FEDERAL",
"ESTADUAL",
"MUNICIPAL"),
levels = c(1,2,3))
SD2$LOCALIZACAO <- factor(SD2$ID_LOCALIZACAO,
label = c("URBANA",
"RURAL"),
levels = c(1,2))
SD2$SERIE <- factor(SD2$ID_SERIE,
label = c("5_ANO_EF",
"9_ANO_EF",
"3_ANO_EM",
"3_ANO_EM_INTEGRADO"),
levels = c(5,9,12,13))
SD2$Q1_RACA <- factor(SD2$TX_RESP_Q001,
label = c("BRANCA",
"PRETA",
"PARDA",
"AMARELA",
"INDIGENA",
"NAO_DECLARAR"),
levels = c("A","B","C","D","E","F"))
SD2$Q2_ANOS_COMO_PROFESSOR <- factor(SD2$TX_RESP_Q002,
label = c("PRIMEIRO_ANO",
"DE_1_A_2",
"DE_3_A_5",
"DE_6_A_10",
"DE_11_A_15",
"DE_16_A_20",
"MAIS_DE_20"),
levels = c("A","B","C","D","E","F","G"))
SD2$Q4_QUANTAS_ESCOLAS_TRABALHA <- factor(SD2$TX_RESP_Q004,
label = c("APENAS_NESTA",
"EM_2",
"EM_3",
"EM_4_OU_MAIS"),
levels = c("A","B","C","D"))
SD2$Q5_TIPO_VINCULO <- factor(SD2$TX_RESP_Q005,
label = c("EFETIVO",
"TEMPORARIO",
"TERCEIRIZADO",
"CLT",
"PJ",
"OUTRA"),
levels = c("A","B","C","D","E","F"))
SD2$Q6_REALIZACAO_DE_SONHO <- factor(SD2$TX_RESP_Q006,
label = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"
),
levels = c("A","B","C","D"))
SD2$Q7_PROFISSAO_VALORIZADA <- factor(SD2$TX_RESP_Q007,
label = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"
),
levels = c("A","B","C","D"))
SD2$Q8_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(SD2$TX_RESP_Q008,
label = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"
),
levels = c("A","B","C","D"))
SD2$Q9_SATISFEITO <- factor(SD2$TX_RESP_Q009,
label = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"
),
levels = c("A","B","C","D"))SD2 <- SD2 %>%
mutate(IN_PREENCHIMENTO_QUESTIONARIO = NULL,
ID_SAEB = NULL,
ID_UF = NULL,
ID_MUNICIPIO = NULL,
ID_ESCOLA = NULL,
ID_TURMA = NULL,
CO_PROFESSOR = NULL,
ID_DEPENDENCIA_ADM = NULL,
ID_LOCALIZACAO = NULL,
ID_SERIE = NULL,
ID_AREA = NULL,
ID_REGIAO = NULL,
TX_RESP_Q001 = NULL,
TX_RESP_Q002 = NULL,
TX_RESP_Q003 = NULL,
TX_RESP_Q004 = NULL,
TX_RESP_Q005 = NULL,
TX_RESP_Q006 = NULL,
TX_RESP_Q007 = NULL,
TX_RESP_Q008 = NULL,
TX_RESP_Q009 = NULL,
TX_RESP_Q010 = NULL,
TX_RESP_Q011 = NULL,
TX_RESP_Q012 = NULL,
TX_RESP_Q013 = NULL,
TX_RESP_Q014 = NULL,
TX_RESP_Q015 = NULL,
TX_RESP_Q016 = NULL,
TX_RESP_Q017 = NULL,
TX_RESP_Q018 = NULL,
TX_RESP_Q019 = NULL,
TX_RESP_Q020 = NULL,
TX_RESP_Q021 = NULL,
TX_RESP_Q022 = NULL,
TX_RESP_Q023 = NULL,
TX_RESP_Q024 = NULL,
TX_RESP_Q025 = NULL,
TX_RESP_Q026 = NULL,
TX_RESP_Q027 = NULL,
TX_RESP_Q028 = NULL,
TX_RESP_Q029 = NULL,
TX_RESP_Q030 = NULL,
TX_RESP_Q031 = NULL,
TX_RESP_Q032 = NULL,
TX_RESP_Q033 = NULL,
TX_RESP_Q034 = NULL,
TX_RESP_Q035 = NULL,
TX_RESP_Q036 = NULL,
TX_RESP_Q037 = NULL,
TX_RESP_Q038 = NULL,
TX_RESP_Q039 = NULL,
TX_RESP_Q040 = NULL,
TX_RESP_Q041 = NULL,
TX_RESP_Q042 = NULL,
TX_RESP_Q043 = NULL,
TX_RESP_Q044 = NULL,
TX_RESP_Q045 = NULL,
TX_RESP_Q046 = NULL,
TX_RESP_Q047 = NULL,
TX_RESP_Q048 = NULL,
TX_RESP_Q049 = NULL,
TX_RESP_Q050 = NULL,
TX_RESP_Q051 = NULL,
TX_RESP_Q052 = NULL,
TX_RESP_Q053 = NULL,
TX_RESP_Q054 = NULL,
TX_RESP_Q055 = NULL,
TX_RESP_Q056 = NULL,
TX_RESP_Q057 = NULL,
TX_RESP_Q058 = NULL,
TX_RESP_Q059 = NULL,
TX_RESP_Q060 = NULL,
TX_RESP_Q061 = NULL,
TX_RESP_Q062 = NULL,
TX_RESP_Q063 = NULL,
TX_RESP_Q064 = NULL,
TX_RESP_Q065 = NULL,
TX_RESP_Q066 = NULL,
TX_RESP_Q067 = NULL,
TX_RESP_Q068 = NULL,
TX_RESP_Q069 = NULL,
TX_RESP_Q070 = NULL,
TX_RESP_Q071 = NULL,
TX_RESP_Q072 = NULL,
TX_RESP_Q073 = NULL,
TX_RESP_Q074 = NULL,
TX_RESP_Q075 = NULL,
TX_RESP_Q076 = NULL,
TX_RESP_Q077 = NULL,
TX_RESP_Q078 = NULL,
TX_RESP_Q079 = NULL,
TX_RESP_Q080 = NULL,
TX_RESP_Q081 = NULL,
TX_RESP_Q082 = NULL,
TX_RESP_Q083 = NULL,
TX_RESP_Q084 = NULL,
TX_RESP_Q085 = NULL,
TX_RESP_Q086 = NULL,
TX_RESP_Q087 = NULL,
TX_RESP_Q088 = NULL,
TX_RESP_Q089 = NULL,
TX_RESP_Q090 = NULL,
TX_RESP_Q091 = NULL,
TX_RESP_Q092 = NULL,
TX_RESP_Q093 = NULL,
TX_RESP_Q094 = NULL,
TX_RESP_Q095 = NULL,
TX_RESP_Q096 = NULL,
TX_RESP_Q097 = NULL,
TX_RESP_Q098 = NULL,
TX_RESP_Q099 = NULL,
TX_RESP_Q100 = NULL,
TX_RESP_Q101 = NULL,
TX_RESP_Q102 = NULL,
TX_RESP_Q103 = NULL,
TX_RESP_Q104 = NULL,
TX_RESP_Q105 = NULL,
TX_RESP_Q106 = NULL,
TX_RESP_Q107 = NULL,
TX_RESP_Q108 = NULL,
TX_RESP_Q109 = NULL,
TX_RESP_Q110 = NULL,
TX_RESP_Q111 = NULL,
TX_RESP_Q112 = NULL,
TX_RESP_Q113 = NULL,
TX_RESP_Q114 = NULL,
TX_RESP_Q115 = NULL,
TX_RESP_Q116 = NULL,
TX_RESP_Q117 = NULL,
TX_RESP_Q118 = NULL,
TX_RESP_Q119 = NULL,
TX_RESP_Q120 = NULL,
TX_RESP_Q121 = NULL,
TX_RESP_Q122 = NULL,
TX_RESP_Q123 = NULL,
TX_RESP_Q124 = NULL,
TX_RESP_Q125 = NULL,
TX_RESP_Q126 = NULL,
TX_RESP_Q127 = NULL,
TX_RESP_Q128 = NULL)SD2$GE_REGIAO <- factor(SD2$ESTADO,
label = c("AMAZONIA",
"AMAZONIA",
"AMAZONIA",
"AMAZONIA",
"AMAZONIA",
"AMAZONIA",
"AMAZONIA",
"AMAZONIA",
"NORDESTE",
"NORDESTE",
"NORDESTE",
"NORDESTE",
"NORDESTE",
"NORDESTE",
"NORDESTE",
"NORDESTE",
"CENTRO-SUL",
"CENTRO-SUL",
"CENTRO-SUL",
"CENTRO-SUL",
"CENTRO-SUL",
"CENTRO-SUL",
"CENTRO-SUL",
"CENTRO-SUL",
"AMAZONIA",
"CENTRO-SUL",
"CENTRO-SUL"),
levels = c("RO",
"AC",
"AM",
"RR",
"PA",
"AP",
"TO",
"MA",
"PI",
"CE",
"RN",
"PB",
"PE",
"AL",
"SE",
"BA",
"MG",
"ES",
"RJ",
"SP",
"PR",
"SC",
"RS",
"MS",
"MT",
"GO",
"DF"))SD2$Q6_2_REALIZACAO_DE_SONHO <- factor(SD2$Q6_REALIZACAO_DE_SONHO,
label = c("DISCORDO",
"DISCORDO",
"CONCORDO",
"CONCORDO"
),
levels = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"))
SD2$Q7_2_PROFISSAO_VALORIZADA <- factor(SD2$Q7_PROFISSAO_VALORIZADA,
label = c("DISCORDO",
"DISCORDO",
"CONCORDO",
"CONCORDO"
),
levels = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"))
SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(SD2$Q8_VANTAGENS_SUPERAM_DESVANTAGENS,
label = c("DISCORDO",
"DISCORDO",
"CONCORDO",
"CONCORDO"
),
levels = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"))
SD2$Q9_2_SATISFEITO <- factor(SD2$Q9_SATISFEITO,
label = c("DISCORDO",
"DISCORDO",
"CONCORDO",
"CONCORDO"
),
levels = c("DISCORDO_FORTEMENTE",
"DISCORDO",
"CONCORDO",
"CONCORDO_FORTEMENTE"))paged_table(SD2)write.csv(SD2,"SATISFACAO_DOCENTE_2.csv")# Para a análise exploratória trabalharemos com as variáveis originais, ou seja, não utilizaremos aquelas produzidas para o modelo binário.
AE <- as.data.frame(unclass(SD2), stringsAsFactors = TRUE)
glimpse(AE)## Rows: 311,597
## Columns: 19
## $ REGIAO <fct> NORTE, NORTE, NORTE, NORTE, NORTE,~
## $ ESTADO <fct> RO, RO, RO, RO, RO, RO, RO, RO, RO~
## $ AREA <fct> INTERIOR, INTERIOR, INTERIOR, INTE~
## $ DEPENDENCIA <fct> MUNICIPAL, ESTADUAL, ESTADUAL, EST~
## $ LOCALIZACAO <fct> RURAL, URBANA, URBANA, URBANA, URB~
## $ SERIE <fct> 5_ANO_EF, 5_ANO_EF, 5_ANO_EF, 5_AN~
## $ Q1_RACA <fct> PARDA, BRANCA, BRANCA, PRETA, BRAN~
## $ Q2_ANOS_COMO_PROFESSOR <fct> DE_16_A_20, MAIS_DE_20, MAIS_DE_20~
## $ Q4_QUANTAS_ESCOLAS_TRABALHA <fct> APENAS_NESTA, APENAS_NESTA, APENAS~
## $ Q5_TIPO_VINCULO <fct> EFETIVO, EFETIVO, EFETIVO, EFETIVO~
## $ Q6_REALIZACAO_DE_SONHO <fct> CONCORDO_FORTEMENTE, CONCORDO, CON~
## $ Q7_PROFISSAO_VALORIZADA <fct> DISCORDO, DISCORDO, DISCORDO, DISC~
## $ Q8_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q9_SATISFEITO <fct> CONCORDO_FORTEMENTE, CONCORDO, CON~
## $ GE_REGIAO <fct> AMAZONIA, AMAZONIA, AMAZONIA, AMAZ~
## $ Q6_2_REALIZACAO_DE_SONHO <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q7_2_PROFISSAO_VALORIZADA <fct> DISCORDO, DISCORDO, DISCORDO, DISC~
## $ Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q9_2_SATISFEITO <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
AE <- AE %>% select(REGIAO, GE_REGIAO, AREA, LOCALIZACAO, DEPENDENCIA, SERIE, Q2_ANOS_COMO_PROFESSOR, Q4_QUANTAS_ESCOLAS_TRABALHA, Q5_TIPO_VINCULO, Q6_REALIZACAO_DE_SONHO, Q7_PROFISSAO_VALORIZADA, Q8_VANTAGENS_SUPERAM_DESVANTAGENS, Q9_SATISFEITO)
glimpse(AE)## Rows: 311,597
## Columns: 13
## $ REGIAO <fct> NORTE, NORTE, NORTE, NORTE, NORTE, N~
## $ GE_REGIAO <fct> AMAZONIA, AMAZONIA, AMAZONIA, AMAZON~
## $ AREA <fct> INTERIOR, INTERIOR, INTERIOR, INTERI~
## $ LOCALIZACAO <fct> RURAL, URBANA, URBANA, URBANA, URBAN~
## $ DEPENDENCIA <fct> MUNICIPAL, ESTADUAL, ESTADUAL, ESTAD~
## $ SERIE <fct> 5_ANO_EF, 5_ANO_EF, 5_ANO_EF, 5_ANO_~
## $ Q2_ANOS_COMO_PROFESSOR <fct> DE_16_A_20, MAIS_DE_20, MAIS_DE_20, ~
## $ Q4_QUANTAS_ESCOLAS_TRABALHA <fct> APENAS_NESTA, APENAS_NESTA, APENAS_N~
## $ Q5_TIPO_VINCULO <fct> EFETIVO, EFETIVO, EFETIVO, EFETIVO, ~
## $ Q6_REALIZACAO_DE_SONHO <fct> CONCORDO_FORTEMENTE, CONCORDO, CONCO~
## $ Q7_PROFISSAO_VALORIZADA <fct> DISCORDO, DISCORDO, DISCORDO, DISCOR~
## $ Q8_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONCOR~
## $ Q9_SATISFEITO <fct> CONCORDO_FORTEMENTE, CONCORDO, CONCO~
levels(AE$REGIAO)## [1] "NORTE" "NORDESTE" "SUDESTE" "SUL" "CENTRO_OESTE"
levels(AE$GE_REGIAO) ## [1] "AMAZONIA" "NORDESTE" "CENTRO-SUL"
levels(AE$AREA)## [1] "CAPITAL" "INTERIOR"
levels(AE$LOCALIZACAO) ## [1] "URBANA" "RURAL"
levels(AE$DEPENDENCIA) ## [1] "FEDERAL" "ESTADUAL" "MUNICIPAL"
levels(AE$SERIE)## [1] "5_ANO_EF" "9_ANO_EF" "3_ANO_EM"
## [4] "3_ANO_EM_INTEGRADO"
levels(AE$Q2_ANOS_COMO_PROFESSOR) ## [1] "PRIMEIRO_ANO" "DE_1_A_2" "DE_3_A_5" "DE_6_A_10" "DE_11_A_15"
## [6] "DE_16_A_20" "MAIS_DE_20"
levels(AE$Q4_QUANTAS_ESCOLAS_TRABALHA) ## [1] "APENAS_NESTA" "EM_2" "EM_3" "EM_4_OU_MAIS"
levels(AE$Q5_TIPO_VINCULO) ## [1] "EFETIVO" "TEMPORARIO" "TERCEIRIZADO" "CLT" "PJ"
## [6] "OUTRA"
levels(AE$Q6_REALIZACAO_DE_SONHO) ## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q7_PROFISSAO_VALORIZADA) ## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS) ## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q9_SATISFEITO)## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
AE$GE_REGIAO <- factor(AE$GE_REGIAO,
levels = c("AMAZONIA", "NORDESTE", "CENTRO-SUL"))
AE$LOCALIZACAO <- factor(AE$LOCALIZACAO,
levels = c("URBANA", "RURAL"))
AE$SERIE <- factor(AE$SERIE,
levels = c("9_ANO_EF", "5_ANO_EF", "3_ANO_EM", "3_ANO_EM_INTEGRADO"))
AE$Q2_ANOS_COMO_PROFESSOR <- factor(AE$Q2_ANOS_COMO_PROFESSOR,
levels = c("PRIMEIRO_ANO", "DE_1_A_2", "DE_3_A_5", "DE_6_A_10", "DE_11_A_15", "DE_16_A_20", "MAIS_DE_20"))
AE$Q5_TIPO_VINCULO <- factor(AE$Q5_TIPO_VINCULO,
levels = c("EFETIVO", "TEMPORARIO", "CLT", "TERCEIRIZADO", "PJ", "OUTRA"))
AE$Q6_REALIZACAO_DE_SONHO <- factor(AE$Q6_REALIZACAO_DE_SONHO,
levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE"))
AE$Q7_PROFISSAO_VALORIZADA <- factor(AE$Q7_PROFISSAO_VALORIZADA,
levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE"))
AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS,
levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE"))
AE$Q9_SATISFEITO <- factor(AE$Q9_SATISFEITO,
levels = c("DISCORDO_FORTEMENTE", "DISCORDO", "CONCORDO", "CONCORDO_FORTEMENTE"))
levels(AE$GE_REGIAO) ## [1] "AMAZONIA" "NORDESTE" "CENTRO-SUL"
levels(AE$AREA)## [1] "CAPITAL" "INTERIOR"
levels(AE$LOCALIZACAO) ## [1] "URBANA" "RURAL"
levels(AE$DEPENDENCIA) ## [1] "FEDERAL" "ESTADUAL" "MUNICIPAL"
levels(AE$SERIE)## [1] "9_ANO_EF" "5_ANO_EF" "3_ANO_EM"
## [4] "3_ANO_EM_INTEGRADO"
levels(AE$Q2_ANOS_COMO_PROFESSOR) ## [1] "PRIMEIRO_ANO" "DE_1_A_2" "DE_3_A_5" "DE_6_A_10" "DE_11_A_15"
## [6] "DE_16_A_20" "MAIS_DE_20"
levels(AE$Q4_QUANTAS_ESCOLAS_TRABALHA) ## [1] "APENAS_NESTA" "EM_2" "EM_3" "EM_4_OU_MAIS"
levels(AE$Q5_TIPO_VINCULO) ## [1] "EFETIVO" "TEMPORARIO" "CLT" "TERCEIRIZADO" "PJ"
## [6] "OUTRA"
levels(AE$Q6_REALIZACAO_DE_SONHO) ## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q7_PROFISSAO_VALORIZADA) ## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS) ## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
levels(AE$Q9_SATISFEITO)## [1] "DISCORDO_FORTEMENTE" "DISCORDO" "CONCORDO"
## [4] "CONCORDO_FORTEMENTE"
Q6 <- round((prop.table(table(AE$Q6_REALIZACAO_DE_SONHO))*100),2)
Q6##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 1.72 9.06 52.98 36.24
Q7 <- round((prop.table(table(AE$Q7_PROFISSAO_VALORIZADA))*100),2)
Q7##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 27.81 56.65 13.97 1.56
Q8 <- round((prop.table(table(AE$Q8_VANTAGENS_SUPERAM_DESVANTAGENS))*100),2)
Q8##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 8.63 40.33 45.62 5.42
Q9 <- round((prop.table(table(AE$Q9_SATISFEITO))*100),2)
Q9##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 1.95 15.90 65.02 17.14
REGIÃO POLÍTICO-ADMINISTRATIVA
round((prop.table(Q6_X_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## NORTE 1.86 12.01 54.19 31.94
## NORDESTE 1.59 10.09 54.13 34.19
## SUDESTE 1.84 8.14 52.11 37.91
## SUL 1.59 6.77 51.13 40.51
## CENTRO_OESTE 1.71 9.40 54.21 34.68
REGIÃO GEOECONÔMICA
round((prop.table(Q6_X_GE_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## AMAZONIA 1.85 11.92 55.62 30.61
## NORDESTE 1.50 9.56 53.39 35.55
## CENTRO-SUL 1.77 7.91 51.93 38.39
ÁREA
round((prop.table(Q6_X_AREA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## CAPITAL 2.20 10.36 52.12 35.32
## INTERIOR 1.63 8.83 53.13 36.41
LOCALIZAÇÃO
round((prop.table(Q6_X_LOCALIZACAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## URBANA 1.79 9.11 52.98 36.11
## RURAL 1.33 8.80 52.95 36.92
DEPENDÊNCIA ADMINISTRATIVA
round((prop.table(Q6_X_DEPENDENCIA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## FEDERAL 2.29 11.65 44.96 41.10
## ESTADUAL 1.97 9.36 53.84 34.83
## MUNICIPAL 1.48 8.75 52.28 37.50
SÉRIE
round((prop.table(Q6_X_SERIE,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 9_ANO_EF 1.82 10.07 55.24 32.87
## 5_ANO_EF 1.35 7.28 49.96 41.41
## 3_ANO_EM 2.13 10.44 54.52 32.91
## 3_ANO_EM_INTEGRADO 2.56 9.99 52.07 35.39
ANOS COMO PROFESSOR
round((prop.table(Q6_X_Q2_ANOS_PROFESSOR,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## PRIMEIRO_ANO 1.76 7.50 48.21 42.53
## DE_1_A_2 1.27 7.41 50.74 40.59
## DE_3_A_5 1.26 7.74 53.02 37.98
## DE_6_A_10 1.57 8.90 54.39 35.14
## DE_11_A_15 1.89 9.93 54.39 33.78
## DE_16_A_20 1.75 10.26 54.96 33.02
## MAIS_DE_20 1.81 8.54 50.78 38.88
QUANTIDADE DE ESCOLAS EM QUE TRABALHA
round((prop.table(Q6_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## APENAS_NESTA 1.64 8.70 52.47 37.19
## EM_2 1.70 9.44 53.97 34.88
## EM_3 2.11 10.22 53.44 34.23
## EM_4_OU_MAIS 2.36 9.08 50.51 38.05
TIPO DE VÍNCULO
round((prop.table(Q6_X_Q5_TIPO_VINCULO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## EFETIVO 1.82 10.02 53.65 34.50
## TEMPORARIO 1.29 6.57 51.55 40.59
## CLT 2.33 6.74 49.43 41.50
## TERCEIRIZADO 8.50 16.64 45.21 29.66
## PJ 4.84 14.52 54.84 25.81
## OUTRA 2.46 9.35 51.77 36.42
REGIÃO POLÍTICO-ADMINISTRATIVA
round((prop.table(Q7_X_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## NORTE 25.74 55.47 16.33 2.46
## NORDESTE 23.58 58.30 16.38 1.74
## SUDESTE 31.24 55.71 11.74 1.32
## SUL 30.70 55.61 12.49 1.20
## CENTRO_OESTE 25.99 58.20 14.35 1.46
REGIÃO GEOECONÔMICA
round((prop.table(Q7_X_GE_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## AMAZONIA 24.57 57.16 16.13 2.13
## NORDESTE 23.60 58.19 16.46 1.75
## CENTRO-SUL 30.76 55.80 12.15 1.30
ÁREA
round((prop.table(Q7_X_AREA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## CAPITAL 35.72 52.58 10.01 1.70
## INTERIOR 26.38 57.39 14.69 1.54
LOCALIZAÇÃO
round((prop.table(Q7_X_LOCALIZACAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## URBANA 29.17 56.21 13.13 1.49
## RURAL 20.66 59.00 18.37 1.97
DEPENDÊNCIA ADMINISTRATIVA
round((prop.table(Q7_X_DEPENDENCIA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## FEDERAL 34.24 54.23 9.96 1.56
## ESTADUAL 29.94 55.09 13.42 1.55
## MUNICIPAL 25.75 58.14 14.53 1.58
SÉRIE
round((prop.table(Q7_X_SERIE,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 9_ANO_EF 28.62 56.27 13.55 1.55
## 5_ANO_EF 25.63 58.41 14.40 1.57
## 3_ANO_EM 30.17 54.26 14.01 1.56
## 3_ANO_EM_INTEGRADO 29.89 55.28 12.98 1.85
ANOS COMO PROFESSOR
round((prop.table(Q7_X_Q2_ANOS_PROFESSOR,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## PRIMEIRO_ANO 23.70 56.82 17.62 1.86
## DE_1_A_2 22.90 59.16 16.05 1.90
## DE_3_A_5 25.46 58.53 14.70 1.31
## DE_6_A_10 28.66 56.55 13.29 1.50
## DE_11_A_15 29.00 56.35 13.23 1.42
## DE_16_A_20 28.57 56.36 13.63 1.44
## MAIS_DE_20 27.59 56.33 14.33 1.75
QUANTIDADE DE ESCOLAS EM QUE TRABALHA
round((prop.table(Q7_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## APENAS_NESTA 27.17 57.14 14.13 1.56
## EM_2 28.57 56.55 13.46 1.42
## EM_3 29.49 54.36 14.38 1.77
## EM_4_OU_MAIS 28.27 52.82 16.11 2.79
TIPO DE VÍNCULO
##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## EFETIVO 29.73 56.18 12.69 1.40
## TEMPORARIO 23.05 57.93 17.13 1.90
## CLT 25.39 56.55 15.63 2.42
## TERCEIRIZADO 20.25 55.33 20.80 3.62
## PJ 17.74 56.45 22.58 3.23
## OUTRA 27.17 55.81 14.57 2.46
REGIÃO POLÍTICO-ADMINISTRATIVA
round((prop.table(Q7_X_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## NORTE 25.74 55.47 16.33 2.46
## NORDESTE 23.58 58.30 16.38 1.74
## SUDESTE 31.24 55.71 11.74 1.32
## SUL 30.70 55.61 12.49 1.20
## CENTRO_OESTE 25.99 58.20 14.35 1.46
REGIÃO GEOECONÔMICA AE
round((prop.table(Q8_X_GE_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## AMAZONIA 7.21 36.99 49.11 6.69
## NORDESTE 6.94 36.32 49.96 6.78
## CENTRO-SUL 9.85 43.23 42.53 4.39
ÁREA
round((prop.table(Q8_X_AREA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## CAPITAL 12.38 45.18 38.43 4.00
## INTERIOR 7.95 39.46 46.92 5.67
LOCALIZAÇÃO
round((prop.table(Q8_X_LOCALIZACAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## URBANA 9.20 41.57 44.28 4.94
## RURAL 5.61 33.82 52.65 7.92
DEPENDÊNCIA ADMINISTRATIVA
round((prop.table(Q8_X_DEPENDENCIA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## FEDERAL 8.33 38.84 45.35 7.48
## ESTADUAL 10.07 42.97 42.54 4.43
## MUNICIPAL 7.29 37.90 48.49 6.31
SÉRIE
round((prop.table(Q8_X_SERIE,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 9_ANO_EF 9.30 41.67 44.33 4.71
## 5_ANO_EF 7.04 37.84 48.48 6.64
## 3_ANO_EM 10.25 42.61 42.72 4.41
## 3_ANO_EM_INTEGRADO 9.50 38.80 45.53 6.17
ANOS COMO PROFESSOR
round((prop.table(Q8_X_Q2_ANOS_PROFESSOR,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## PRIMEIRO_ANO 6.54 35.86 51.05 6.56
## DE_1_A_2 6.37 38.01 48.92 6.69
## DE_3_A_5 7.63 39.93 46.71 5.73
## DE_6_A_10 8.91 41.96 43.92 5.20
## DE_11_A_15 9.36 41.96 43.99 4.69
## DE_16_A_20 9.05 40.83 45.13 4.99
## MAIS_DE_20 8.39 38.84 46.88 5.89
QUANTIDADE DE ESCOLAS EM QUE TRABALHA
round((prop.table(Q8_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## APENAS_NESTA 8.23 39.74 46.34 5.69
## EM_2 8.85 41.16 45.17 4.82
## EM_3 10.24 42.06 42.56 5.14
## EM_4_OU_MAIS 10.39 39.06 43.02 7.52
TIPO DE VÍNCULO
##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## EFETIVO 9.32 41.41 44.43 4.83
## TEMPORARIO 6.85 37.72 48.57 6.85
## CLT 8.17 38.01 47.56 6.27
## TERCEIRIZADO 7.61 34.78 48.91 8.70
## PJ 8.06 51.61 35.48 4.84
## OUTRA 9.36 38.23 45.81 6.60
REGIÃO POLÍTICO-ADMINISTRATIVA
round((prop.table(Q9_X_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## NORTE 1.92 14.94 63.25 19.88
## NORDESTE 1.42 14.13 64.98 19.47
## SUDESTE 2.20 16.75 65.68 15.38
## SUL 2.68 19.27 63.93 14.12
## CENTRO_OESTE 1.51 13.99 66.58 17.91
REGIÃO GEOECONÔMICA
round((prop.table(Q9_X_GE_REGIAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## AMAZONIA 1.71 15.08 64.23 18.98
## NORDESTE 1.40 13.81 64.95 19.84
## CENTRO-SUL 2.27 17.11 65.30 15.32
ÁREA
round((prop.table(Q9_X_AREA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## CAPITAL 2.85 19.93 63.23 13.99
## INTERIOR 1.78 15.17 65.34 17.71
LOCALIZAÇÃO
round((prop.table(Q9_X_LOCALIZACAO,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## URBANA 2.09 16.54 65.14 16.23
## RURAL 1.18 12.55 64.35 21.91
DEPENDÊNCIA ADMINISTRATIVA
round((prop.table(Q9_X_DEPENDENCIA,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## FEDERAL 0.72 9.62 59.75 29.91
## ESTADUAL 2.49 18.94 64.37 14.20
## MUNICIPAL 1.46 13.15 65.69 19.70
SÉRIE
round((prop.table(Q9_X_SERIE,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## 9_ANO_EF 2.25 18.26 65.06 14.43
## 5_ANO_EF 1.28 11.74 65.31 21.67
## 3_ANO_EM 2.63 19.39 64.67 13.31
## 3_ANO_EM_INTEGRADO 1.65 14.35 61.63 22.37
ANOS COMO PROFESSOR
round((prop.table(Q9_X_Q2_ANOS_PROFESSOR,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## PRIMEIRO_ANO 1.39 10.83 65.44 22.34
## DE_1_A_2 1.09 11.51 66.73 20.67
## DE_3_A_5 1.40 12.67 66.44 19.50
## DE_6_A_10 1.85 15.73 65.54 16.87
## DE_11_A_15 2.10 17.38 64.66 15.85
## DE_16_A_20 2.01 17.37 65.34 15.28
## MAIS_DE_20 2.12 15.90 64.18 17.80
QUANTIDADE DE ESCOLAS EM QUE TRABALHA
round((prop.table(Q9_X_Q4_QUANTAS_ESCOLAS,1)*100), 2)##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## APENAS_NESTA 1.83 15.20 64.86 18.11
## EM_2 1.95 16.54 65.88 15.64
## EM_3 2.73 18.48 63.56 15.23
## EM_4_OU_MAIS 2.66 16.79 60.74 19.81
TIPO DE VÍNCULO
##
## DISCORDO_FORTEMENTE DISCORDO CONCORDO CONCORDO_FORTEMENTE
## EFETIVO 2.14 17.14 65.31 15.42
## TEMPORARIO 1.44 12.78 64.38 21.39
## CLT 2.18 12.99 64.57 20.26
## TERCEIRIZADO 2.00 16.91 60.00 21.09
## PJ 1.61 22.58 62.90 12.90
## OUTRA 2.08 15.42 62.06 20.45
O bloco que questões denominado “Concepções” utiliza como comando a seguinte orientação: “Indique o quanto você concorda ou discorda em relação aos seguintes temas envolvendo o seu trabalho como professor(a) da Educação Básica:”
Para tanto, usa a escala Likert. A seguir utilizamos o gráfico Likert representar as respostas que foram coletadas:
AE_VD <- AE %>% select(Q6_REALIZACAO_DE_SONHO, Q7_PROFISSAO_VALORIZADA, Q8_VANTAGENS_SUPERAM_DESVANTAGENS, Q9_SATISFEITO)
likert_SD2_VD <- likert(AE_VD)
likert_SD2_VD## Item DISCORDO_FORTEMENTE DISCORDO CONCORDO
## 1 Q6_REALIZACAO_DE_SONHO 1.717675 9.061549 52.97729
## 2 Q7_PROFISSAO_VALORIZADA 27.813119 56.652420 13.96977
## 3 Q8_VANTAGENS_SUPERAM_DESVANTAGENS 8.629686 40.334148 45.61875
## 4 Q9_SATISFEITO 1.946359 15.899544 65.01641
## CONCORDO_FORTEMENTE
## 1 36.243488
## 2 1.564693
## 3 5.417415
## 4 17.137686
### modelo likert 1
likert.bar.plot(likert_SD2_VD,plot.percents=T,legend = "Legenda", low.color = "#D8B365", text.size=4) + ggtitle("") + labs( x = "Questões", y = "Porcentagem") + theme_minimal() + theme(legend.position = "bottom")# Planejamento da análise:
## Q6_2 a Q9_2 são dependentes
## Foram construindo quatro modelos, um para cada variável dependente. As variáveis independentes são as mesmas para todos os modelos. Para
### Modelo completo, com todas as outras VIs
BIN_SD2 <- SD2 %>% select(GE_REGIAO, AREA, LOCALIZACAO, DEPENDENCIA, SERIE, Q2_ANOS_COMO_PROFESSOR, Q4_QUANTAS_ESCOLAS_TRABALHA, Q5_TIPO_VINCULO, Q6_2_REALIZACAO_DE_SONHO, Q7_2_PROFISSAO_VALORIZADA, Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS, Q9_2_SATISFEITO)
glimpse(BIN_SD2)## Rows: 311,597
## Columns: 12
## $ GE_REGIAO <fct> AMAZONIA, AMAZONIA, AMAZONIA, AMAZ~
## $ AREA <fct> INTERIOR, INTERIOR, INTERIOR, INTE~
## $ LOCALIZACAO <fct> RURAL, URBANA, URBANA, URBANA, URB~
## $ DEPENDENCIA <fct> MUNICIPAL, ESTADUAL, ESTADUAL, EST~
## $ SERIE <fct> 5_ANO_EF, 5_ANO_EF, 5_ANO_EF, 5_AN~
## $ Q2_ANOS_COMO_PROFESSOR <fct> DE_16_A_20, MAIS_DE_20, MAIS_DE_20~
## $ Q4_QUANTAS_ESCOLAS_TRABALHA <fct> APENAS_NESTA, APENAS_NESTA, APENAS~
## $ Q5_TIPO_VINCULO <fct> EFETIVO, EFETIVO, EFETIVO, EFETIVO~
## $ Q6_2_REALIZACAO_DE_SONHO <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q7_2_PROFISSAO_VALORIZADA <fct> DISCORDO, DISCORDO, DISCORDO, DISC~
## $ Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
## $ Q9_2_SATISFEITO <fct> CONCORDO, CONCORDO, CONCORDO, CONC~
# Reorganizando os níveis das VIs e VDs:
levels(BIN_SD2$GE_REGIAO) ## [1] "AMAZONIA" "NORDESTE" "CENTRO-SUL"
levels(BIN_SD2$AREA)## [1] "CAPITAL" "INTERIOR"
levels(BIN_SD2$LOCALIZACAO) ## [1] "URBANA" "RURAL"
levels(BIN_SD2$DEPENDENCIA) ## [1] "FEDERAL" "ESTADUAL" "MUNICIPAL"
levels(BIN_SD2$SERIE)## [1] "5_ANO_EF" "9_ANO_EF" "3_ANO_EM"
## [4] "3_ANO_EM_INTEGRADO"
levels(BIN_SD2$Q2_ANOS_COMO_PROFESSOR) ## [1] "PRIMEIRO_ANO" "DE_1_A_2" "DE_3_A_5" "DE_6_A_10" "DE_11_A_15"
## [6] "DE_16_A_20" "MAIS_DE_20"
levels(BIN_SD2$Q4_QUANTAS_ESCOLAS_TRABALHA) ## [1] "APENAS_NESTA" "EM_2" "EM_3" "EM_4_OU_MAIS"
levels(BIN_SD2$Q5_TIPO_VINCULO) ## [1] "EFETIVO" "TEMPORARIO" "TERCEIRIZADO" "CLT" "PJ"
## [6] "OUTRA"
levels(BIN_SD2$Q6_2_REALIZACAO_DE_SONHO) ## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q7_2_PROFISSAO_VALORIZADA) ## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS) ## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q9_2_SATISFEITO)## [1] "DISCORDO" "CONCORDO"
BIN_SD2$GE_REGIAO <- factor(BIN_SD2$GE_REGIAO,
levels = c("AMAZONIA", "NORDESTE", "CENTRO-SUL"))
BIN_SD2$LOCALIZACAO <- factor(BIN_SD2$LOCALIZACAO,
levels = c("URBANA", "RURAL"))
BIN_SD2$SERIE <- factor(BIN_SD2$SERIE,
levels = c("9_ANO_EF", "5_ANO_EF", "3_ANO_EM", "3_ANO_EM_INTEGRADO"))
BIN_SD2$Q2_ANOS_COMO_PROFESSOR <- factor(BIN_SD2$Q2_ANOS_COMO_PROFESSOR,
levels = c("PRIMEIRO_ANO", "DE_1_A_2", "DE_3_A_5", "DE_6_A_10", "DE_11_A_15", "DE_16_A_20", "MAIS_DE_20"))
BIN_SD2$Q5_TIPO_VINCULO <- factor(BIN_SD2$Q5_TIPO_VINCULO,
levels = c("EFETIVO", "TEMPORARIO", "CLT", "TERCEIRIZADO", "PJ", "OUTRA"))
BIN_SD2$Q6_2_REALIZACAO_DE_SONHO <- factor(BIN_SD2$Q6_2_REALIZACAO_DE_SONHO,
levels = c("DISCORDO", "CONCORDO"))
BIN_SD2$Q7_2_PROFISSAO_VALORIZADA <- factor(BIN_SD2$Q7_2_PROFISSAO_VALORIZADA,
levels = c("DISCORDO", "CONCORDO"))
BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS <- factor(BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS,
levels = c("DISCORDO", "CONCORDO"))
BIN_SD2$Q9_2_SATISFEITO <- factor(BIN_SD2$Q9_2_SATISFEITO,
levels = c("DISCORDO", "CONCORDO"))
levels(BIN_SD2$GE_REGIAO) ## [1] "AMAZONIA" "NORDESTE" "CENTRO-SUL"
levels(BIN_SD2$AREA)## [1] "CAPITAL" "INTERIOR"
levels(BIN_SD2$LOCALIZACAO) ## [1] "URBANA" "RURAL"
levels(BIN_SD2$DEPENDENCIA) ## [1] "FEDERAL" "ESTADUAL" "MUNICIPAL"
levels(BIN_SD2$SERIE)## [1] "9_ANO_EF" "5_ANO_EF" "3_ANO_EM"
## [4] "3_ANO_EM_INTEGRADO"
levels(BIN_SD2$Q2_ANOS_COMO_PROFESSOR) ## [1] "PRIMEIRO_ANO" "DE_1_A_2" "DE_3_A_5" "DE_6_A_10" "DE_11_A_15"
## [6] "DE_16_A_20" "MAIS_DE_20"
levels(BIN_SD2$Q4_QUANTAS_ESCOLAS_TRABALHA) ## [1] "APENAS_NESTA" "EM_2" "EM_3" "EM_4_OU_MAIS"
levels(BIN_SD2$Q5_TIPO_VINCULO) ## [1] "EFETIVO" "TEMPORARIO" "CLT" "TERCEIRIZADO" "PJ"
## [6] "OUTRA"
levels(BIN_SD2$Q6_2_REALIZACAO_DE_SONHO) ## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q7_2_PROFISSAO_VALORIZADA) ## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS) ## [1] "DISCORDO" "CONCORDO"
levels(BIN_SD2$Q9_2_SATISFEITO)## [1] "DISCORDO" "CONCORDO"
##################### Modelos de regressão logística binária ########################
############# Modelo Q6 ######################################
## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_lin_Q6 <- lm(as.numeric(Q6_2_REALIZACAO_DE_SONHO) ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_lin_Q6)## GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO 1.163545 2 1.038594
## AREA 1.047089 1 1.023273
## LOCALIZACAO 1.174142 1 1.083579
## DEPENDENCIA 2.610307 2 1.271080
## SERIE 2.406874 3 1.157645
## Q2_ANOS_COMO_PROFESSOR 1.254857 6 1.019099
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022173 1 1.011026
## Q5_TIPO_VINCULO 1.302335 5 1.026768
### Os VIFs são inferiores a 5, indicando ausência de multicolinearidade
## Criação do modelo de regressão logística binária
mod_bin_Q6 <- glm(Q6_2_REALIZACAO_DE_SONHO ~ GE_REGIAO + AREA + LOCALIZACAO + DEPENDENCIA +
+ SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO,
data = BIN_SD2, family = "binomial"(link = "logit"))
## Overall effects
tbl_over_bin_Q6 <- Anova(mod_bin_Q6, type = 'II', test = "Wald")
write.table(tbl_over_bin_Q6, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = T)
tbl_over_bin_Q6## Analysis of Deviance Table (Type II tests)
##
## Response: Q6_2_REALIZACAO_DE_SONHO
## Df Chisq Pr(>Chisq)
## GE_REGIAO 2 554.1440 < 0.00000000000000022 ***
## AREA 1 79.6236 < 0.00000000000000022 ***
## LOCALIZACAO 1 31.5665 0.00000001927 ***
## DEPENDENCIA 2 5.0989 0.07812 .
## SERIE 3 553.7788 < 0.00000000000000022 ***
## Q2_ANOS_COMO_PROFESSOR 6 139.7542 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1 29.4929 0.00000005612 ***
## Q5_TIPO_VINCULO 5 826.1597 < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
length(mod_bin_Q6$residuals)## [1] 219980
#### Observação: apenas a variável "dependencia" apresentou o qui-quadrado maior que 0,5. Assim, no momento, deixaremos fora de nossa análise.
mod_bin_Q6_ajustado <- glm(Q6_2_REALIZACAO_DE_SONHO ~ GE_REGIAO + AREA + LOCALIZACAO +
+ SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO,
data = BIN_SD2, family = "binomial"(link = "logit"))
## Efeitos específicos
summary(mod_bin_Q6_ajustado)##
## Call:
## glm(formula = Q6_2_REALIZACAO_DE_SONHO ~ GE_REGIAO + AREA + LOCALIZACAO +
## +SERIE + Q2_ANOS_COMO_PROFESSOR + as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
## Q5_TIPO_VINCULO, family = binomial(link = "logit"), data = BIN_SD2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.5306 0.3911 0.4487 0.5157 1.0103
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) 1.415767 0.058518 24.194
## GE_REGIAONORDESTE 0.255262 0.020014 12.754
## GE_REGIAOCENTRO-SUL 0.429979 0.018025 23.854
## AREAINTERIOR 0.163061 0.018569 8.781
## LOCALIZACAORURAL 0.110348 0.020620 5.352
## SERIE5_ANO_EF 0.375109 0.016417 22.848
## SERIE3_ANO_EM -0.055181 0.017749 -3.109
## SERIE3_ANO_EM_INTEGRADO -0.042351 0.052610 -0.805
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 0.124659 0.068092 1.831
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 0.127005 0.057377 2.214
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 0.047942 0.054153 0.885
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 0.001166 0.054344 0.021
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 0.027550 0.054629 0.504
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 0.202805 0.054036 3.753
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) -0.051367 0.009404 -5.462
## Q5_TIPO_VINCULOTEMPORARIO 0.514736 0.018938 27.180
## Q5_TIPO_VINCULOCLT 0.250970 0.066875 3.753
## Q5_TIPO_VINCULOTERCEIRIZADO -0.851685 0.100871 -8.443
## Q5_TIPO_VINCULOPJ -0.478054 0.334961 -1.427
## Q5_TIPO_VINCULOOUTRA 0.026418 0.098826 0.267
## Pr(>|z|)
## (Intercept) < 0.0000000000000002 ***
## GE_REGIAONORDESTE < 0.0000000000000002 ***
## GE_REGIAOCENTRO-SUL < 0.0000000000000002 ***
## AREAINTERIOR < 0.0000000000000002 ***
## LOCALIZACAORURAL 0.0000000872 ***
## SERIE5_ANO_EF < 0.0000000000000002 ***
## SERIE3_ANO_EM 0.001878 **
## SERIE3_ANO_EM_INTEGRADO 0.420824
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 0.067138 .
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 0.026862 *
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 0.375988
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 0.982875
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 0.614046
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 0.000175 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 0.0000000471 ***
## Q5_TIPO_VINCULOTEMPORARIO < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT 0.000175 ***
## Q5_TIPO_VINCULOTERCEIRIZADO < 0.0000000000000002 ***
## Q5_TIPO_VINCULOPJ 0.153525
## Q5_TIPO_VINCULOOUTRA 0.789225
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 149975 on 219979 degrees of freedom
## Residual deviance: 147462 on 219960 degrees of freedom
## (91617 observations deleted due to missingness)
## AIC: 147502
##
## Number of Fisher Scoring iterations: 5
## Tabela resumo completa
tbl_bin_Q6 <- gtsummary::tbl_regression(mod_bin_Q6_ajustado, exponentiate = T) %>%
as_tibble()
write.table(tbl_bin_Q6, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = F)
tbl_bin_Q6## # A tibble: 31 x 4
## `**Características**` `**OR**` `**95% IC**` `**Valor p**`
## <chr> <chr> <chr> <chr>
## 1 GE_REGIAO <NA> <NA> <NA>
## 2 AMAZONIA <NA> <NA> <NA>
## 3 NORDESTE 1,29 1,24; 1,34 <0,001
## 4 CENTRO-SUL 1,54 1,48; 1,59 <0,001
## 5 AREA <NA> <NA> <NA>
## 6 CAPITAL <NA> <NA> <NA>
## 7 INTERIOR 1,18 1,13; 1,22 <0,001
## 8 LOCALIZACAO <NA> <NA> <NA>
## 9 URBANA <NA> <NA> <NA>
## 10 RURAL 1,12 1,07; 1,16 <0,001
## # ... with 21 more rows
## Obtenção do "n" usado no modelo
length(mod_bin_Q6_ajustado$residuals)## [1] 219980
## Construção de um gráfico
plot_model(mod_bin_Q6_ajustado, title = "", axis.title = "Razão de chances (OR)",
colors = "black", dot.size = 1.5, line.size = 0.5,
vline.color = "gray50", transform = "exp",
axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
"Região: Centro-sul<sup>1</sup>",
"Área: Interior<sup>2</sup>",
"Localização: Rural<sup>3</sup>",
"Série: 5º ano EF<sup>4</sup>",
"Série: 3º ano EM<sup>4</sup>",
"Série: 3º ano EM Integrado<sup>4</sup>",
"Anos de docência: 1-2 anos<sup>5</sup>",
"Anos de docência: 3-5 anos<sup>5</sup>",
"Anos de docência: 6-10 anos<sup>5</sup>",
"Anos de docência: 11-15 anos<sup>5</sup>",
"Anos de docência: 16-20 anos<sup>5</sup>",
"Anos de docência: Mais de 20 anos<sup>5</sup>",
"Maior número de escolas<sup>6</sup>",
"Tipo de vínculo: Temporário<sup>7</sup>",
"Tipo de vínculo: CLT<sup>7</sup>",
"Tipo de vínculo: Terceirizado<sup>7</sup>",
"Tipo de vínculo: PJ<sup>7</sup>",
"Tipo de vínculo: Outras<sup>7</sup>"))) +
scale_y_continuous(label = scales::number_format(accuracy = 0.1,
decimal.mark = ",")) +
labs(caption = '1. Categoria de referência = "Amazônia"
2. Categoria de referência = "Capital"
3. Categoria de referência = "Urbano"
4. Categoria de referência = "9 ano EF"
5. Categoria de referência = "Primeiro ano"
6. Categoria de referência = "Menor número de escolas"
7. Categoria de referência = "Efetivo"') +
theme_sjplot() +
theme(plot.background = element_rect(fill = "white", color = "white"),
axis.title.x = element_text(size = 10, color = "black"),
axis.text.y = element_markdown(size = 10, color = "black"),
plot.caption = element_text(size = 8, color = "black"),
panel.spacing = unit(1, "lines"))## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
ggsave("Mod_Bin_4.png", dpi = 600, width = 16, height = 11, units = "cm")
############# Modelo Q7 ######################################
## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_5 <- lm(as.numeric(Q7_2_PROFISSAO_VALORIZADA) ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_5)## GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO 1.163481 2 1.038580
## AREA 1.047025 1 1.023243
## LOCALIZACAO 1.174023 1 1.083523
## DEPENDENCIA 2.615510 2 1.271713
## SERIE 2.411293 3 1.157999
## Q2_ANOS_COMO_PROFESSOR 1.254849 6 1.019098
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022080 1 1.010980
## Q5_TIPO_VINCULO 1.302466 5 1.026778
### Os VIFs são inferiores a 5, indício de ausência de multicolinearidade
## Criação do modelo de regressão logística binária
mod_bin_5 <- glm(Q7_2_PROFISSAO_VALORIZADA ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO,
data = BIN_SD2, family = "binomial"(link = "logit"))
## Overall effects
tbl_over_bin_5 <- Anova(mod_bin_5, type = 'II', test = "Wald")
write.table(tbl_over_bin_5, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = T)
tbl_over_bin_5## Analysis of Deviance Table (Type II tests)
##
## Response: Q7_2_PROFISSAO_VALORIZADA
## Df Chisq Pr(>Chisq)
## GE_REGIAO 2 582.9195 < 0.00000000000000022 ***
## AREA 1 283.6639 < 0.00000000000000022 ***
## LOCALIZACAO 1 203.9311 < 0.00000000000000022 ***
## DEPENDENCIA 2 8.1583 0.016922 *
## SERIE 3 70.0651 0.000000000000004134 ***
## Q2_ANOS_COMO_PROFESSOR 6 281.3162 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1 8.2249 0.004132 **
## Q5_TIPO_VINCULO 5 749.9189 < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Efeitos específicos
summary(mod_bin_5)##
## Call:
## glm(formula = Q7_2_PROFISSAO_VALORIZADA ~ GE_REGIAO + AREA +
## LOCALIZACAO + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) + Q5_TIPO_VINCULO,
## family = binomial(link = "logit"), data = BIN_SD2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -0.9418 -0.6111 -0.5497 -0.4830 2.3233
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) -2.201630 0.102890 -21.398
## GE_REGIAONORDESTE -0.007207 0.017166 -0.420
## GE_REGIAOCENTRO-SUL -0.311820 0.016076 -19.397
## AREAINTERIOR 0.312332 0.018544 16.842
## LOCALIZACAORURAL 0.231467 0.016209 14.280
## DEPENDENCIAESTADUAL 0.243249 0.093092 2.613
## DEPENDENCIAMUNICIPAL 0.223688 0.094343 2.371
## SERIE5_ANO_EF 0.114530 0.014419 7.943
## SERIE3_ANO_EM 0.078410 0.018151 4.320
## SERIE3_ANO_EM_INTEGRADO 0.059127 0.056852 1.040
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 -0.097806 0.049847 -1.962
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 -0.206141 0.042485 -4.852
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 -0.221798 0.040215 -5.515
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 -0.162285 0.040613 -3.996
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 -0.087878 0.040921 -2.148
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 0.042806 0.040056 1.069
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 0.023291 0.008121 2.868
## Q5_TIPO_VINCULOTEMPORARIO 0.388055 0.014663 26.464
## Q5_TIPO_VINCULOCLT 0.381210 0.049620 7.683
## Q5_TIPO_VINCULOTERCEIRIZADO 0.663719 0.101801 6.520
## Q5_TIPO_VINCULOPJ 0.696645 0.298946 2.330
## Q5_TIPO_VINCULOOUTRA 0.190921 0.084672 2.255
## Pr(>|z|)
## (Intercept) < 0.0000000000000002 ***
## GE_REGIAONORDESTE 0.67463
## GE_REGIAOCENTRO-SUL < 0.0000000000000002 ***
## AREAINTERIOR < 0.0000000000000002 ***
## LOCALIZACAORURAL < 0.0000000000000002 ***
## DEPENDENCIAESTADUAL 0.00898 **
## DEPENDENCIAMUNICIPAL 0.01774 *
## SERIE5_ANO_EF 0.00000000000000198 ***
## SERIE3_ANO_EM 0.00001560614922242 ***
## SERIE3_ANO_EM_INTEGRADO 0.29834
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 0.04975 *
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 0.00000122191920151 ***
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 0.00000003480796407 ***
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 0.00006446055662882 ***
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 0.03175 *
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 0.28523
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 0.00413 **
## Q5_TIPO_VINCULOTEMPORARIO < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT 0.00000000000001559 ***
## Q5_TIPO_VINCULOTERCEIRIZADO 0.00000000007041205 ***
## Q5_TIPO_VINCULOPJ 0.01979 *
## Q5_TIPO_VINCULOOUTRA 0.02414 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 190203 on 220523 degrees of freedom
## Residual deviance: 187565 on 220502 degrees of freedom
## (91073 observations deleted due to missingness)
## AIC: 187609
##
## Number of Fisher Scoring iterations: 4
## Tabela resumo completa
tbl_bin_5 <- gtsummary::tbl_regression(mod_bin_5, exponentiate = T) %>%
as_tibble()
write.table(tbl_bin_5, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = F)
## Obtenção do n usado no modelo
length(mod_bin_5$residuals)## [1] 220524
## Construção de um gráfico
plot_model(mod_bin_5, title = "", axis.title = "Razão de chances (OR)",
colors = "black", dot.size = 1.5, line.size = 0.5,
vline.color = "grey50", transform = "exp",
axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
"Região: Centro-sul<sup>1</sup>",
"Área: Interior<sup>2</sup>",
"Localização: Rural<sup>3</sup>",
"Dependência: Federal<sup>4</sup>",
"Dependência: Municipal<sup>4</sup>",
"Série: 5º ano EF<sup>5</sup>",
"Série: 3º ano EM<sup>5</sup>",
"Série: 3º ano EM Integrado<sup>5</sup>",
"Anos de docência: 1-2 anos<sup>6</sup>",
"Anos de docência: 3-5 anos<sup>6</sup>",
"Anos de docência: 6-10 anos<sup>6</sup>",
"Anos de docência: 11-15 anos<sup>6</sup>",
"Anos de docência: 16-20 anos<sup>6</sup>",
"Anos de docência: Mais de 20 anos<sup>6</sup>",
"Maior número de escolas<sup>7</sup>",
"Tipo de vínculo: Temporário<sup>8</sup>",
"Tipo de vínculo: CLT<sup>8</sup>",
"Tipo de vínculo: Terceirizado<sup>8</sup>",
"Tipo de vínculo: PJ<sup>8</sup>",
"Tipo de vínculo: Outras<sup>8</sup>"))) +
scale_y_continuous(label = scales::number_format(accuracy = 0.1,
decimal.mark = ",")) +
labs(caption = '1. Categoria de referência = "Amazônia"
2. Categoria de referência = "Capital"
3. Categoria de referência = "Urbano"
4. Categoria de referência = "Estadual"
5. Categoria de referência = "9 ano EF"
6. Categoria de referência = "Primeiro ano"
7. Categoria de referência = "Menor número de escolas"
8. Categoria de referência = "Efetivo"') +
theme_sjplot() +
theme(plot.background = element_rect(fill = "white", color = "white"),
axis.title.x = element_text(size = 10, color = "black"),
axis.text.y = element_markdown(size = 10, color = "black"),
plot.caption = element_text(size = 8, color = "black"),
panel.spacing = unit(1, "lines"))## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
ggsave("Mod_Bin_5.png", dpi = 600, width = 16, height = 11, units = "cm")
############# Modelo 6: Q8 modelo completo ######################################
## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_6 <- lm(as.numeric(Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS) ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_6)## GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO 1.163550 2 1.038595
## AREA 1.047015 1 1.023237
## LOCALIZACAO 1.173909 1 1.083471
## DEPENDENCIA 2.616778 2 1.271867
## SERIE 2.412515 3 1.158097
## Q2_ANOS_COMO_PROFESSOR 1.254730 6 1.019090
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022076 1 1.010978
## Q5_TIPO_VINCULO 1.302441 5 1.026776
### Os VIFs são inferiores a 5, indício de ausência de multicolinearidade
## Criação do modelo de regressão logística binária
mod_bin_6 <- glm(Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO,
data = BIN_SD2, family = "binomial"(link = "logit"))
## Overall effects
tbl_over_bin_6 <- Anova(mod_bin_6, type = 'II', test = "Wald")
write.table(tbl_over_bin_6, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = T)
tbl_over_bin_6## Analysis of Deviance Table (Type II tests)
##
## Response: Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS
## Df Chisq Pr(>Chisq)
## GE_REGIAO 2 1081.153 < 0.00000000000000022 ***
## AREA 1 738.567 < 0.00000000000000022 ***
## LOCALIZACAO 1 349.417 < 0.00000000000000022 ***
## DEPENDENCIA 2 115.762 < 0.00000000000000022 ***
## SERIE 3 560.475 < 0.00000000000000022 ***
## Q2_ANOS_COMO_PROFESSOR 6 519.344 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1 40.788 0.0000000001696 ***
## Q5_TIPO_VINCULO 5 731.094 < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Efeitos específicos
summary(mod_bin_6)##
## Call:
## glm(formula = Q8_2_VANTAGENS_SUPERAM_DESVANTAGENS ~ GE_REGIAO +
## AREA + LOCALIZACAO + DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) + Q5_TIPO_VINCULO,
## family = binomial(link = "logit"), data = BIN_SD2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.6754 -1.1546 0.8716 1.1398 1.5948
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) 0.0318255 0.0704469 0.452
## GE_REGIAONORDESTE 0.0159616 0.0134122 1.190
## GE_REGIAOCENTRO-SUL -0.2965002 0.0120546 -24.597
## AREAINTERIOR 0.3347180 0.0123164 27.177
## LOCALIZACAORURAL 0.2410839 0.0128972 18.693
## DEPENDENCIAESTADUAL -0.2111664 0.0616830 -3.423
## DEPENDENCIAMUNICIPAL -0.0904843 0.0626204 -1.445
## SERIE5_ANO_EF 0.2488400 0.0105719 23.538
## SERIE3_ANO_EM 0.0376703 0.0129999 2.898
## SERIE3_ANO_EM_INTEGRADO 0.0958026 0.0414977 2.309
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 -0.0802957 0.0395369 -2.031
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 -0.1950477 0.0336268 -5.800
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 -0.2497614 0.0319707 -7.812
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 -0.2213036 0.0322414 -6.864
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 -0.1487478 0.0324661 -4.582
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 -0.0007627 0.0319270 -0.024
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) -0.0382493 0.0059890 -6.387
## Q5_TIPO_VINCULOTEMPORARIO 0.2930720 0.0110722 26.469
## Q5_TIPO_VINCULOCLT 0.2602510 0.0384838 6.763
## Q5_TIPO_VINCULOTERCEIRIZADO 0.3776980 0.0886753 4.259
## Q5_TIPO_VINCULOPJ -0.3896122 0.2646434 -1.472
## Q5_TIPO_VINCULOOUTRA 0.0852098 0.0640280 1.331
## Pr(>|z|)
## (Intercept) 0.651438
## GE_REGIAONORDESTE 0.234015
## GE_REGIAOCENTRO-SUL < 0.0000000000000002 ***
## AREAINTERIOR < 0.0000000000000002 ***
## LOCALIZACAORURAL < 0.0000000000000002 ***
## DEPENDENCIAESTADUAL 0.000618 ***
## DEPENDENCIAMUNICIPAL 0.148468
## SERIE5_ANO_EF < 0.0000000000000002 ***
## SERIE3_ANO_EM 0.003759 **
## SERIE3_ANO_EM_INTEGRADO 0.020964 *
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 0.042265 *
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 0.00000000661729695 ***
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 0.00000000000000562 ***
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 0.00000000000669830 ***
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 0.00000461362125443 ***
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 0.980942
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 0.00000000016962786 ***
## Q5_TIPO_VINCULOTEMPORARIO < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT 0.00000000001355342 ***
## Q5_TIPO_VINCULOTERCEIRIZADO 0.00002050353004226 ***
## Q5_TIPO_VINCULOPJ 0.140963
## Q5_TIPO_VINCULOOUTRA 0.183248
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 305428 on 220385 degrees of freedom
## Residual deviance: 299581 on 220364 degrees of freedom
## (91211 observations deleted due to missingness)
## AIC: 299625
##
## Number of Fisher Scoring iterations: 4
## Tabela resumo completa
tbl_bin_6 <- gtsummary::tbl_regression(mod_bin_6, exponentiate = T) %>%
as_tibble()
write.table(tbl_bin_6, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = F)
## Obtenção do n usado no modelo
length(mod_bin_6$residuals)## [1] 220386
## Construção de um gráfico
plot_model(mod_bin_6, title = "", axis.title = "Razão de chances (OR)",
colors = "black", dot.size = 1.5, line.size = 0.5,
vline.color = "grey50", transform = "exp",
axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
"Região: Centro-sul<sup>1</sup>",
"Área: Interior<sup>2</sup>",
"Localização: Rural<sup>3</sup>",
"Dependência: Federal<sup>4</sup>",
"Dependência: Municipal<sup>4</sup>",
"Série: 5º ano EF<sup>5</sup>",
"Série: 3º ano EM<sup>5</sup>",
"Série: 3º ano EM Integrado<sup>5</sup>",
"Anos de docência: 1-2 anos<sup>6</sup>",
"Anos de docência: 3-5 anos<sup>6</sup>",
"Anos de docência: 6-10 anos<sup>6</sup>",
"Anos de docência: 11-15 anos<sup>6</sup>",
"Anos de docência: 16-20 anos<sup>6</sup>",
"Anos de docência: Mais de 20 anos<sup>6</sup>",
"Maior número de escolas<sup>7</sup>",
"Tipo de vínculo: Temporário<sup>8</sup>",
"Tipo de vínculo: CLT<sup>8</sup>",
"Tipo de vínculo: Terceirizado<sup>8</sup>",
"Tipo de vínculo: PJ<sup>8</sup>",
"Tipo de vínculo: Outras<sup>8</sup>"))) +
scale_y_continuous(label = scales::number_format(accuracy = 0.1,
decimal.mark = ",")) +
labs(caption = '1. Categoria de referência = "Amazônia"
2. Categoria de referência = "Capital"
3. Categoria de referência = "Urbano"
4. Categoria de referência = "Estadual"
5. Categoria de referência = "9 ano EF"
6. Categoria de referência = "Primeiro ano"
7. Categoria de referência = "Menor número de escolas"
8. Categoria de referência = "Efetivo"') +
theme_sjplot() +
theme(plot.background = element_rect(fill = "white", color = "white"),
axis.title.x = element_text(size = 10, color = "black"),
axis.text.y = element_markdown(size = 10, color = "black"),
plot.caption = element_text(size = 8, color = "black"),
panel.spacing = unit(1, "lines"))## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
ggsave("Mod_Bin_6.png", dpi = 600, width = 16, height = 11, units = "cm")
############# Modelo 7: Q9 modelo completo ######################################
## Criação de um modelo de regressão linear (lm) para avaliar multicolinearidade
mod_7 <- lm(as.numeric(Q9_2_SATISFEITO) ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO, data = BIN_SD2)
car::vif(mod_7)## GVIF Df GVIF^(1/(2*Df))
## GE_REGIAO 1.163579 2 1.038602
## AREA 1.047044 1 1.023252
## LOCALIZACAO 1.173994 1 1.083510
## DEPENDENCIA 2.617607 2 1.271968
## SERIE 2.413272 3 1.158158
## Q2_ANOS_COMO_PROFESSOR 1.254751 6 1.019091
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1.022036 1 1.010958
## Q5_TIPO_VINCULO 1.302476 5 1.026779
### Os VIFs são inferiores a 5, indício de ausência de multicolinearidade
## Criação do modelo de regressão logística binária
mod_bin_7 <- glm(Q9_2_SATISFEITO ~ GE_REGIAO + AREA + LOCALIZACAO
+ DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR +
as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
Q5_TIPO_VINCULO,
data = BIN_SD2, family = "binomial"(link = "logit"))
## Overall effects
tbl_over_bin_7 <- Anova(mod_bin_7, type = 'II', test = "Wald")
write.table(tbl_over_bin_7, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = T)
tbl_over_bin_7## Analysis of Deviance Table (Type II tests)
##
## Response: Q9_2_SATISFEITO
## Df Chisq Pr(>Chisq)
## GE_REGIAO 2 233.781 < 0.00000000000000022 ***
## AREA 1 423.760 < 0.00000000000000022 ***
## LOCALIZACAO 1 56.072 0.00000000000006986 ***
## DEPENDENCIA 2 308.863 < 0.00000000000000022 ***
## SERIE 3 1324.875 < 0.00000000000000022 ***
## Q2_ANOS_COMO_PROFESSOR 6 243.282 < 0.00000000000000022 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 1 54.757 0.00000000000013642 ***
## Q5_TIPO_VINCULO 5 610.766 < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Efeitos específicos
summary(mod_bin_7)##
## Call:
## glm(formula = Q9_2_SATISFEITO ~ GE_REGIAO + AREA + LOCALIZACAO +
## DEPENDENCIA + SERIE + Q2_ANOS_COMO_PROFESSOR + as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) +
## Q5_TIPO_VINCULO, family = binomial(link = "logit"), data = BIN_SD2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.4634 0.4672 0.5638 0.6748 0.9815
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) 2.134676 0.106149 20.110
## GE_REGIAONORDESTE 0.094040 0.018128 5.188
## GE_REGIAOCENTRO-SUL -0.123519 0.015807 -7.814
## AREAINTERIOR 0.305577 0.014844 20.585
## LOCALIZACAORURAL 0.135035 0.018033 7.488
## DEPENDENCIAESTADUAL -0.864408 0.093984 -9.197
## DEPENDENCIAMUNICIPAL -0.636567 0.095022 -6.699
## SERIE5_ANO_EF 0.517544 0.014293 36.209
## SERIE3_ANO_EM 0.056848 0.015679 3.626
## SERIE3_ANO_EM_INTEGRADO 0.140794 0.053108 2.651
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 -0.014448 0.059192 -0.244
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 -0.125793 0.050036 -2.514
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 -0.306470 0.047402 -6.465
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 -0.378131 0.047598 -7.944
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 -0.357440 0.047856 -7.469
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 -0.241019 0.047321 -5.093
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) -0.056440 0.007627 -7.400
## Q5_TIPO_VINCULOTEMPORARIO 0.366139 0.015015 24.384
## Q5_TIPO_VINCULOCLT 0.292768 0.053469 5.475
## Q5_TIPO_VINCULOTERCEIRIZADO 0.024193 0.112560 0.215
## Q5_TIPO_VINCULOPJ -0.299330 0.301412 -0.993
## Q5_TIPO_VINCULOOUTRA 0.049306 0.084559 0.583
## Pr(>|z|)
## (Intercept) < 0.0000000000000002 ***
## GE_REGIAONORDESTE 0.00000021304807565 ***
## GE_REGIAOCENTRO-SUL 0.00000000000000553 ***
## AREAINTERIOR < 0.0000000000000002 ***
## LOCALIZACAORURAL 0.00000000000006986 ***
## DEPENDENCIAESTADUAL < 0.0000000000000002 ***
## DEPENDENCIAMUNICIPAL 0.00000000002096661 ***
## SERIE5_ANO_EF < 0.0000000000000002 ***
## SERIE3_ANO_EM 0.000288 ***
## SERIE3_ANO_EM_INTEGRADO 0.008024 **
## Q2_ANOS_COMO_PROFESSORDE_1_A_2 0.807170
## Q2_ANOS_COMO_PROFESSORDE_3_A_5 0.011935 *
## Q2_ANOS_COMO_PROFESSORDE_6_A_10 0.00000000010103192 ***
## Q2_ANOS_COMO_PROFESSORDE_11_A_15 0.00000000000000195 ***
## Q2_ANOS_COMO_PROFESSORDE_16_A_20 0.00000000000008076 ***
## Q2_ANOS_COMO_PROFESSORMAIS_DE_20 0.00000035197824206 ***
## as.numeric(Q4_QUANTAS_ESCOLAS_TRABALHA) 0.00000000000013642 ***
## Q5_TIPO_VINCULOTEMPORARIO < 0.0000000000000002 ***
## Q5_TIPO_VINCULOCLT 0.00000004363995252 ***
## Q5_TIPO_VINCULOTERCEIRIZADO 0.829817
## Q5_TIPO_VINCULOPJ 0.320664
## Q5_TIPO_VINCULOOUTRA 0.559829
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 206712 on 220373 degrees of freedom
## Residual deviance: 201471 on 220352 degrees of freedom
## (91223 observations deleted due to missingness)
## AIC: 201515
##
## Number of Fisher Scoring iterations: 4
## Tabela resumo completa
tbl_bin_7 <- gtsummary::tbl_regression(mod_bin_7, exponentiate = T) %>%
as_tibble()
write.table(tbl_bin_7, pipe("pbcopy"),
sep = "\t", dec = ",", row.names = F)
## Obtenção do n usado no modelo
length(mod_bin_7$residuals)## [1] 220374
## Construção de um gráfico
plot_model(mod_bin_7, title = "", axis.title = "Razão de chances (OR)",
colors = "black", dot.size = 1.5, line.size = 0.5,
vline.color = "grey50", transform = "exp",
axis.labels = rev(c("Região: Nordeste<sup>1</sup>",
"Região: Centro-sul<sup>1</sup>",
"Área: Interior<sup>2</sup>",
"Localização: Rural<sup>3</sup>",
"Dependência: Federal<sup>4</sup>",
"Dependência: Municipal<sup>4</sup>",
"Série: 5º ano EF<sup>5</sup>",
"Série: 3º ano EM<sup>5</sup>",
"Série: 3º ano EM Integrado<sup>5</sup>",
"Anos de docência: 1-2 anos<sup>6</sup>",
"Anos de docência: 3-5 anos<sup>6</sup>",
"Anos de docência: 6-10 anos<sup>6</sup>",
"Anos de docência: 11-15 anos<sup>6</sup>",
"Anos de docência: 16-20 anos<sup>6</sup>",
"Anos de docência: Mais de 20 anos<sup>6</sup>",
"Maior número de escolas<sup>7</sup>",
"Tipo de vínculo: Temporário<sup>8</sup>",
"Tipo de vínculo: CLT<sup>8</sup>",
"Tipo de vínculo: Terceirizado<sup>8</sup>",
"Tipo de vínculo: PJ<sup>8</sup>",
"Tipo de vínculo: Outras<sup>8</sup>"))) +
scale_y_continuous(label = scales::number_format(accuracy = 0.1,
decimal.mark = ",")) +
labs(caption = '1. Categoria de referência = "Amazônia"
2. Categoria de referência = "Capital"
3. Categoria de referência = "Urbano"
4. Categoria de referência = "Estadual"
5. Categoria de referência = "9 ano EF"
6. Categoria de referência = "Primeiro ano"
7. Categoria de referência = "Menor número de escolas"
8. Categoria de referência = "Efetivo"') +
theme_sjplot() +
theme(plot.background = element_rect(fill = "white", color = "white"),
axis.title.x = element_text(size = 10, color = "black"),
axis.text.y = element_markdown(size = 10, color = "black"),
plot.caption = element_text(size = 8, color = "black"),
panel.spacing = unit(1, "lines"))## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
ggsave("Mod_Bin_7.png", dpi = 600, width = 16, height = 11, units = "cm")