R Markdown

2ª entrega do trabalho final de estatística (26/01/2023)

Ana Carolina Vilela (20221520044) -

Emilyn Machado (20221520053) -

Luisa Ferraro (20221520006) -

Maria Eduarda Rodrigues (20221520046) -

Objetivo geral

Estudar a desigualdade no que tange os desempenho dos estudantes no enem.

Objetivo específico

1 - A região geográfica influencia no desempenho.

2 - O número de matrículas por docente no ensino médio influencia no desempenho

Fonte dos dados:

INEP, 2018 apud Kaggle, 2022

Dicionário de dados:

Ano = ano em que a prova foi realizada

Região Geográfica = região em que a prova foi realizada

Unidade da Federação = Unidade da Federação em que a prova foi realizada

Área Territorial - km² = Área territorial em quilômetros quadrados das unidades federativas em que a prova foi realizada

Pop_estimada = População estimada

Inc_ENEM = Inscrições ENEM

MAT_Edu_Infantil = Matrículas na educação infantil

MAT_Ens_Fundamental = Matrículas no ensino fundamental

MAT_Educ_Prof_Técnica_Médio = Matrículas na Educação Profissional Técnica de Nível Médio

MAT_Educ_Profissional (FIC) = Matrículas na educação Profissional de Formação Inicial e Continua

MAT_EJA = Matrículas na Educação de Jovens e Adultos

MAT_Educ_Especial = Matrículas na Educação Especial

DOCENTE_Infantil = Docentes na educação infantil

DOCENTES_Fundamental = Docentes no ensino fundamental

DOCENTES_Médio = Docentes no ensino médio

DOCENTE_Profissional (FIC) = Docentes na educação profissional de formação inicial e continua

DOCENTE_EJA = Docentes na educação de Jovens e adultos

DOCENTE_Especial = Docente na educação especial

Mediana_CN = Mediana de ciências da natureza

Mediana_CH = Mediana de ciências humanas

Mediana_LN = Mediana de linguagens códigos e suas tecnologias

Mediana_MT = Mediana de matemática e suas tecnologias

Mediana_RD = Mediana de Redação

Número de observações: 27 observações

library(readr)
desempenho_ENEM <- read_delim("~/Base_de_dados-master/desempenho_ENEM.csv", 
                              delim = ";", escape_double = FALSE, trim_ws = TRUE)
View(desempenho_ENEM)

library(readxl)
library(flextable)
library(dplyr)
library(RColorBrewer)
library(geobr)
library(ggplot2)
library(leaflet)
#tabelas sem outliers
desempenho_ENEM_sem_outliers_CN=desempenho_ENEM %>% filter(Mediana_CN<=10000)
desempenho_ENEM_sem_outliers_CH=desempenho_ENEM %>% filter(Mediana_CH<=10000)
desempenho_ENEM_sem_outliers_LN=desempenho_ENEM %>% filter(Mediana_LN<=10000)
desempenho_ENEM_sem_outliers_MT=desempenho_ENEM %>% filter(Mediana_MT<=10000)
desempenho_ENEM_sem_outliers_RD=desempenho_ENEM %>% filter(Mediana_RD<=10000)

MAPA COM OUTLIER - DA MEDIANA DE CIÊNCIAS DA NATUREZA

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)


names(desempenho_ENEM)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "Unidade da Federação"        "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM)
## Joining, by = "name_state"
ggplot() +
  geom_sf(data=dados_para_mapa, aes(fill=Mediana_CN))+
  scale_fill_distiller(palette = "Oranges",direction = 1, name="CN", limits = c(0,60000))+labs(title="Mapa das medianas em Ciências da Natureza")

MAPA SEM OUTLIER - DA MEDIANA DE CIÊNCIAS DA NATUREZA

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)

names(desempenho_ENEM_sem_outliers_CN)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "Unidade da Federação"        "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM_sem_outliers_CN)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM_sem_outliers_CN)
## Joining, by = "name_state"
ggplot() + geom_sf(data=dados_para_mapa, aes(fill=Mediana_CN))+
  scale_fill_distiller(palette = "Oranges",direction = 1, name="CN", limits = c(0,60000))+labs(title="Mapa das medianas sem outliers em Ciências da Natureza")

MAPA COM OUTLIER - DA MEDIANA DE CIÊNCIAS HUMANAS

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)


names(desempenho_ENEM)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "name_state"                  "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM)
## Joining, by = "name_state"
ggplot() +
  geom_sf(data=dados_para_mapa, aes(fill=Mediana_CH))+
  scale_fill_distiller(palette = "Blues",direction = 1, name="CH", limits = c(0,60000))+labs(title="Mapa das medianas em Ciências Humanas")

MAPA SEM OUTLIER - DA MEDIANA DE CIÊNCIAS HUMANAS

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)

names(desempenho_ENEM_sem_outliers_CH)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "Unidade da Federação"        "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM_sem_outliers_CH)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM_sem_outliers_CH)
## Joining, by = "name_state"
ggplot() + geom_sf(data=dados_para_mapa, aes(fill=Mediana_CH))+
  scale_fill_distiller(palette = "Blues",direction = 1, name="CH", limits = c(0,60000))+labs(title="Mapa das medianas sem outliers em Ciências da Humanas")

MAPA COM OUTLIER - DA MEDIANA DE LINGUAGENS, CÓDIGOS E SUAS TECNOLOGIAS

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)


names(desempenho_ENEM)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "name_state"                  "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM)
## Joining, by = "name_state"
ggplot() +
  geom_sf(data=dados_para_mapa, aes(fill=Mediana_LN))+
  scale_fill_distiller(palette = "Greens",direction = 1, name="LN", limits = c(0,60000))+labs(title="Mapa das medianas em  Linguagens, Códigos e suas Tecnologias")

MAPA SEM OUTLIER - DA MEDIANA DE LINGUAGENS, CÓDIGOS E SUAS TECNOLOGIAS

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)

names(desempenho_ENEM_sem_outliers_LN)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "Unidade da Federação"        "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM_sem_outliers_LN)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM_sem_outliers_LN)
## Joining, by = "name_state"
ggplot() + geom_sf(data=dados_para_mapa, aes(fill=Mediana_LN))+
  scale_fill_distiller(palette = "Greens",direction = 1, name="LN", limits = c(0,60000))+labs(title="Mapa das medianas sem outliers em Linguagens, Códigos e suas Tecnologias")

MAPA COM OUTLIER - DA MEDIANA DE MATEMÁTICA E SUAS TECNOLOGIAS

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)


names(desempenho_ENEM)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "name_state"                  "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM)
## Joining, by = "name_state"
ggplot() +
  geom_sf(data=dados_para_mapa, aes(fill=Mediana_MT))+
  scale_fill_distiller(palette = "PuRd",direction = 1, name="MT", limits = c(0,60000))+labs(title="Mapa das medianas em Matemática e suas Tecnologias")

MAPA SEM OUTLIER - DA MEDIANA DE MATEMÁTICA E SUAS TECNOLOGIAS

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)

names(desempenho_ENEM_sem_outliers_MT)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "Unidade da Federação"        "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM_sem_outliers_MT)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM_sem_outliers_MT)
## Joining, by = "name_state"
ggplot() + geom_sf(data=dados_para_mapa, aes(fill=Mediana_MT))+
  scale_fill_distiller(palette = "PuRd",direction = 1, name="MT", limits = c(0,60000))+labs(title="Mapa das medianas sem outliers em Matemática e suas Tecnologias")

MAPA COM OUTLIER - DA MEDIANA DE REDAÇÃO

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)


names(desempenho_ENEM)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "name_state"                  "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM)
## Joining, by = "name_state"
ggplot() +
  geom_sf(data=dados_para_mapa, aes(fill=Mediana_RD))+
  scale_fill_distiller(palette = "Greys",direction = 1, name="RD", limits = c(0,60000))+labs(title="Mapa das medianas em Redação")

MAPA SEM OUTLIER - DA MEDIANA DE REDAÇÃO

estado=read_state(code_state="all",year=2019,showProgress=FALSE)
## Using year 2019
estado$name_state = gsub("Amazônas","Amazonas",estado$name_state)
estado$name_state = gsub(" Do "," do ",estado$name_state)
estado$name_state = gsub(" De "," de ",estado$name_state)

names(desempenho_ENEM_sem_outliers_RD)
##  [1] "ano"                         "Região Geográfica"          
##  [3] "Unidade da Federação"        "Área Territorial - km²"     
##  [5] "Pop_estimada"                "Inc_ENEM"                   
##  [7] "MAT_Edu_ Infantil"           "MAT_Ens_Fundamental"        
##  [9] "MAT_Ens_ Médio"              "MAT_Educ_Prof_Técnica_Médio"
## [11] "MAT_Educ_Profissional(FIC)"  "MAT_EJA"                    
## [13] "MAT_Educ_ Especial"          "QTD_Edu_ Infantil"          
## [15] "QTD_Ens_Fundamental"         "QTD_Ens_ Médio"             
## [17] "QTD_Educ_Prof_Técnica_Médio" "QTD_Educ_Profissional(FIC)" 
## [19] "QTD_EJA"                     "QTD_Educ_ Especial"         
## [21] "DOCENTE_ Infantil"           "DOCENTE_Fundamental"        
## [23] "DOCENTE_ Médio"              "DOCENTE_Prof_Técnica_Médio" 
## [25] "DOCENTE_Profissional(FIC)"   "DOCENTE_EJA"                
## [27] "DOCENTE_Especial"            "Mediana_CN"                 
## [29] "Mediana_CH"                  "Mediana_LN"                 
## [31] "Mediana_MT"                  "Mediana_RD"
names(estado)
## [1] "code_state"   "abbrev_state" "name_state"   "code_region"  "name_region" 
## [6] "geom"
colnames(desempenho_ENEM_sem_outliers_RD)[3] = 'name_state'

dados_para_mapa = estado %>% left_join(desempenho_ENEM_sem_outliers_RD)
## Joining, by = "name_state"
ggplot() + geom_sf(data=dados_para_mapa, aes(fill=Mediana_RD))+
  scale_fill_distiller(palette = "Greys",direction = 1, name="RD", limits = c(0,60000))+labs(title="Mapa das medianas sem outliers em Redação")

BOXPLOT COM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM CIÊNCIAS DA NATUREZA

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM$Mediana_CN~desempenho_ENEM$`Região Geográfica`,col=COR,ylim=c(0,50000),xlab="Região Geográfica",ylab="Mediana CN",main="Gráfico boxplot região geográfica por mediana em ciências da natureza")

BOXPLOT SEM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM CIÊNCIAS DA NATUREZA

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM_sem_outliers_CN$Mediana_CN~desempenho_ENEM_sem_outliers_CN$`Região Geográfica`,col=COR,ylim=c(0,20000),xlab="Região Geográfica",ylab="Mediana CN",main="Gráfico boxplot sem outliers região geográfica por mediana em ciências da natureza")

BOXPLOT COM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM CIÊNCIAS HUMANAS

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM$Mediana_CH~desempenho_ENEM$`Região Geográfica`,col=COR,ylim=c(0,60000),xlab="Região Geográfica",ylab="Mediana ciências humanas",main="Gráfico boxplot região geográfica por mediana em ciências humanas")

BOXPLOT SEM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM CIÊNCIAS HUMANAS

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM_sem_outliers_CH$Mediana_CH~desempenho_ENEM_sem_outliers_CH$`Região Geográfica`,col=COR,ylim=c(0,20000),xlab="Região Geográfica",ylab="Mediana ciências humanas",main="Gráfico boxplot sem outliers região geográfica por mediana em ciências humanas")

BOXPLOT COM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM LINGUAGEM, CÓDIGOS E SUAS TECNOLOGIAS

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM$Mediana_LN~desempenho_ENEM$`Região Geográfica`,col=COR,ylim=c(0,60000),xlab="Região Geográfica",ylab="Mediana de linguagens códigos e suas tecnologias",main="Gráfico boxplot região geográfica por mediana de linguagens códigos e suas tecnologias")

BOXPLOT SEM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM LINGUAGEM, CÓDIGOS E SUAS TECNOLOGIAS

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM_sem_outliers_LN$Mediana_LN~desempenho_ENEM_sem_outliers_LN$`Região Geográfica`,col=COR,ylim=c(0,20000),xlab="Região Geográfica",ylab="Mediana de linguagens códigos e suas tecnologias",main="Gráfico boxplot sem outliers região geográfica por mediana de linguagens códigos e suas tecnologias")

BOXPLOT COM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM MATEMÁTICA E SUAS TECNOLOGIAS

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM$Mediana_MT~desempenho_ENEM$`Região Geográfica`,col=COR,ylim=c(0,60000),xlab="Região Geográfica",ylab="Mediana de matemática e suas tecnologias",main="Gráfico boxplot região geográfica por mediana de matemática e suas tecnologias")

BOXPLOT SEM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM MATEMÁTICA E SUAS TECNOLOGIAS

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM_sem_outliers_MT$Mediana_MT~desempenho_ENEM_sem_outliers_MT$`Região Geográfica`,col=COR,ylim=c(0,20000),xlab="Região Geográfica",ylab="Mediana de matemática e suas tecnologias",main="Gráfico boxplot sem outliers região geográfica por mediana de matemática e suas tecnologias")

BOXPLOT COM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM REDAÇÃO

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM$Mediana_RD~desempenho_ENEM$`Região Geográfica`,col=COR,ylim=c(0,60000),xlab="Região Geográfica",ylab="Mediana de Redação",main="Gráfico boxplot região geográfica por mediana de redação")

BOXPLOT SEM OUTLIER - REGIÃO GEOGRÁFICA / MEDIANA EM REDAÇÃO

COR=brewer.pal(15,"Set3")
## Warning in brewer.pal(15, "Set3"): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors
COR
##  [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
##  [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.5)
boxplot(desempenho_ENEM$Mediana_RD~desempenho_ENEM_sem_outliers_RD$`Região Geográfica`,col=COR,ylim=c(0,20000),xlab="Região Geográfica",ylab="Mediana de Redação",main="Gráfico boxplot sem outliers região geográfica por mediana de redação")

Matrículas no ensino médio por docentes no ensino médio - alunos por professor

desempenho_ENEM$aluno_por_prof =  (desempenho_ENEM$`MAT_Ens_ Médio`/desempenho_ENEM$`DOCENTE_ Médio`)
summary(desempenho_ENEM$aluno_por_prof)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   14.43   15.49   17.09   18.66   20.90   28.57

Relação entre alunos por professor e desempenho em ciências da natureza

#Quantitativa x Quantitativa
plot(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_CN)

cor(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_CN)
## [1] 0.3208605

Relação entre alunos por professor e desempenho em ciências humanas

#Quantitativa x Quantitativa
plot(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_CH)

cor(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_CH)
## [1] -0.2382173

Relação entre alunos por professor e desempenho em linguagens, códigos e suas tecnologias

#Quantitativa x Quantitativa
plot(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_LN)

cor(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_LN)
## [1] -0.2579081

Relação entre alunos por professor e desempenho em matemática e suas tecnologias

#Quantitativa x Quantitativa
plot(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_MT)

cor(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_MT)
## [1] -0.4088898

Relação entre alunos por professor e desempenho em redação

#Quantitativa x Quantitativa
plot(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_RD)

cor(desempenho_ENEM$aluno_por_prof,desempenho_ENEM$Mediana_RD)
## [1] 0.217438

Relação entre a região geográfica e os alinos por professor

# Quantitativa x Qualitativa
boxplot(desempenho_ENEM$aluno_por_prof ~desempenho_ENEM$`Região Geográfica`,col=COR,ylim=c(0,30),xlab="Região Geográfica",ylab="Alunos por professor",main="Gráfico boxplot da quantidade de alunos por professor dentre as 5 região geográfica")