true

Maria Helena Balbino - 20191520037 - Matheus Alonso - 20231520028 - Isaac França - 20182520034 -

Sumário executivo

Trabalho de Conclusão da Disciplina de Estatística Aplicada às Ciências Sociais, apresentado como requisito parcial para a aprovação na matéria.

Fonte dos dados

A fonte de dados utilizada foi a base de dados do IDEB, que reúne informações referentes às regiões e estados, municípios e escolas, referentes ao ensino fundamental regular e ao ensino médio, com cobertura temporal de 2017. Porém, neste trabalho utilizamos a base de dados referente ao ensino médio com uma delimitação Estadual para o Rio de Janeiro, analisando os dados do ano 2017 Para o presente trabalho utilizamos as seguintes informações: Notas do IDEB 2017, Regiões, distância para a capital (km),população, PIB per capita e IDH.

Fontes:https://www.gov.br/inep/pt-br/areas-de-atuacao/pesquisas-estatisticas-e-indicadores/ideb/resultados

Introdução

Compreende-se que no Brasil temos inúmeros desafios que acarretam dificuldades para a aplicação do ensino educacional no Brasil, e que afetam a qualidade do ensino oferecido aos estudantes, sobretudo referente ao ensino público. Tem-se diversos avanços nas últimas décadas, porém ainda há uma grande disparidade entre diferentes regiões e grupos sociais.

O Índice de Desenvolvimento da Educação Básica (Ideb) foi criado em 2007 e reúne, em um só indicador, os resultados de dois conceitos igualmente importantes para a qualidade da educação: o fluxo escolar e as médias de desempenho nas avaliações. O Ideb é calculado a partir dos dados sobre aprovação escolar, obtidos no Censo Escolar, e das médias de desempenho no Sistema de Avaliação da Educação Básica (Saeb). O IDEB tem como objetivo medir a qualidade do aprendizado nacionalmente e estabelecer metas para a melhoria do ensino.

O Ideb é uma ferramenta importante para avaliar como está a educação básica no Brasil. A partir dos dados, é possível fazer comparações entre escolas, regiões e inclusive outros países. Sendo assim, com os dados disponibilizados pelo Ideb, é possível definir as estratégias de desenvolvimento de cada escola. Compreende-se que o Ideb impacta diretamente políticas públicas e gestões escolares, oferecendo um mapeamento importante para todas as instituições.

O levantamento do Índice de Desenvolvimento da Educação Básica (Ideb) é feito pelo INEP e é utilizado para monitorar o desempenho das escolas e redes de ensino. A nossa delimitação tem como foco analisar os dados referentes aos municípios localizados no Rio de Janeiro, especificamente as escolas de ensino médio da rede Estadual.

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep) é o responsável desta pesquisa, da qual tem a cobertura temporal do ano de 2017 a 2023. Porém, neste trabalho apresentaremos amostras apenas do ano de 2017.

Objetivos

Este trabalho tem como objetivo analisar os dados do Índice de Desenvolvimento da Educação Básica (IDEB) do estado do Rio de Janeiro, investigando como diferentes variáveis podem influenciar e determinar os fatores que impactam o desempenho das notas. A análise busca concluir de que maneira esses fatores são determinantes para o desenvolvimento das pontuações dos alunos do ensino médio no IDEB.

Marco Teórico

O indicador foi apresentado pela primeira vez à sociedade em 2007, na gestão do então ministro da Educação Fernando Haddad. Reynaldo Fernandes, pesquisador da USP, foi o responsável, como presidente do Inep na época, de propor um indicador sintético, que olhasse tanto para a aprendizagem dos alunos medida em testes padronizados quanto para as taxas de aprovação.

Na base de dados do IDEB e sua análise encontramos outros anos, metas, pontuação em disciplinas e etc. Porém, o foco deste trabalho é explorar a correlação entre diversos fatores e a nota do IDEB 2017 da educação no estado do Rio de Janeiro. Especificamente, buscaremos discutir como variáveis relacionadas à distância para a capital, população, PIB per capita e IDH podem impactar o desempenho educacional, influenciando o desenvolvimento do ensino médio. Através da análise dos dados do IDEB de 2017, pretendemos entender em que medida esses fatores contribuem para os resultados do índice e como eles se relacionam com a evolução da educação no estado.

Metodologia

  4.1. Escolha da Base de Dados 

Nesta etapa escolhemos a melhor base de acordo com o volume e aplicabilidade para análise estatística. Buscamos uma base com muitas variáveis e bem estruturada, priorizando a origem e confiabilidade das fontes utilizadas, garantido que os dados analisados sejam precisos, assegurando a robustez e a validade dos resultados apresentados.

Após realizarmos pesquisas decidimos analisar os fatores que influenciam as notas do IDEB na cidade do Rio de Janeiro, com foco nas escolas da rede Estadual.

Nessa base de dados podemos observar a mensuração direta da qualidade da educação a partir de indicadores selecionados em diferentes dimensões e componentes, definidos para avaliar o desempenho educacional, com foco nas escolas da rede estadual do Rio de Janeiro.

Essa base possibilita analisar o IDEB de diferentes regiões do Estado do Rio de Janeiro e assim entender o desenvolvimento educacional de seus habitantes. O objetivo é compreender como os resultados no IDEB estão correlacionados com fatores apresentados. Isso permite realizar um comparativo entre as regiões, analisando fatores como distância da capital, população, IDH e PIB per Capita impactam na qualidade da educação oferecida.

Nesta pesquisa temos uma base de dados robusta, com diversas informações, porem iremos utilizar as seguintes informações: A base de dados referente ao ensino médio, com uma delimitação Estadual para o Rio de Janeiro, analisando os dados dos anos 2017. Para o presente trabalho utilizamos as seguintes informações: Notas do IDEB 2017, distância para a capital (km),população, PIB per capita e IDH.

  4.2. Descrição da Base de Dados   

Tamanho da amostra: A base de dados utilizada para a análise possui 90 linhas e 14 colunas. Nessa base de dados temos 12 variáveis quantitativas e 2 qualitativas.

As Variáveis utilizadas no estudo são: IDEB2017 Distância para a capital (Km) População PIB per Capita Regiões IDH As Hipóteses utilizadas no estudo são: Hipótese sobre a relação entre Distância para a capital e as notas no IDEB Hipótese sobre a relação entre notas e o tamanho da população Hipótese sobre a relação do IDEB e o PIB Hipótese se o IDH é influenciado pelo IDEB

Utilizamos os seguintes métodos de análise: Mapa de calor do IBED 2017 - Rio de Janeiro Análise Descritiva das variáveis utilizadas (média, mediana e desvio padrão); Histograma do IBED 2017 - Rio de Janeiro Matriz de Correlação Diagrama de Dispersão Testes de Hipóteses Boxplot

Carregando as bases de dados

library(readxl)
IDEB_Ensino_Medio_2 <- read_excel("C:/Users/isaac/OneDrive/Isaac/Estatistica/IDEB Ensino Medio 3.xlsx")
View(IDEB_Ensino_Medio_2)

library(janitor)
## Warning: pacote 'janitor' foi compilado no R versão 4.4.2
## 
## Anexando pacote: 'janitor'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     chisq.test, fisher.test
library(readxl)
library(dplyr)
## Warning: pacote 'dplyr' foi compilado no R versão 4.4.2
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union

Limpeza de dados

nomes = c('UF','Codigo','Nome','Rede', 'Regiao','IDEB2017','IDEB2019','IDEB2021','IDEB2023','Distancia_capital_Km','Populacao','PIB_per_capita','IDH')
colnames(IDEB_Ensino_Medio_2) = nomes

IDEB_estadual = IDEB_Ensino_Medio_2 %>% filter(Rede=="Estadual")

str(IDEB_estadual)
## tibble [92 × 13] (S3: tbl_df/tbl/data.frame)
##  $ UF                  : chr [1:92] "RJ" "RJ" "RJ" "RJ" ...
##  $ Codigo              : num [1:92] 3300100 3300159 3300209 3300225 3300233 ...
##  $ Nome                : chr [1:92] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
##  $ Rede                : chr [1:92] "Estadual" "Estadual" "Estadual" "Estadual" ...
##  $ Regiao              : chr [1:92] "Medio Paraiba" "Noroeste" "Lagos" "Centro sul" ...
##  $ IDEB2017            : chr [1:92] "3.4" "3.9" "3.1" "3.8" ...
##  $ IDEB2019            : chr [1:92] "3.7" "4.7" "3.7" "4" ...
##  $ IDEB2021            : chr [1:92] "3.8" "4.3" "3.6" "3.9" ...
##  $ IDEB2023            : chr [1:92] "3.4" "4.5999999999999996" "3.5" "3.6" ...
##  $ Distancia_capital_Km: num [1:92] 156 268 118 109 176 165 122 132 35 165 ...
##  $ Populacao           : num [1:92] 167434 11034 129671 11828 40060 ...
##  $ PIB_per_capita      : num [1:92] 53262 20698 31109 33490 84721 ...
##  $ IDH                 : num [1:92] 0.724 0.692 0.718 0.684 0.728 0.733 0.733 0.729 0.684 0.66 ...

Convertendo o tipo dos valores / Removendo NA (valores ausentes)

IDEB_estadual$IDEB2017 <- as.numeric(IDEB_estadual$IDEB2017)
## Warning: NAs introduzidos por coerção
IDEB_estadual<- IDEB_estadual[!is.na(IDEB_estadual$IDEB2017), ] 

class(IDEB_estadual$IDEB2017)
## [1] "numeric"
unique(IDEB_estadual$IDEB2017)
##  [1] 3.4 3.9 3.1 3.8 3.2 4.4 3.7 3.5 3.6 4.3 4.7 4.0 3.0 4.5 3.3 5.2 2.8 4.2 4.6

Carregando mapa/Corrigindo sua base

library(sf)
## Linking to GEOS 3.12.1, GDAL 3.8.4, PROJ 9.3.1; sf_use_s2() is TRUE
mapa = sf::read_sf("C:/Users/isaac/OneDrive/Isaac/Estatistica/RJ_Municipios_2023.shp")

class(mapa$CD_MUN)
## [1] "character"
class(IDEB_estadual$Codigo)
## [1] "numeric"
mapa$Codigo = as.numeric(mapa$CD_MUN)

Unindo as bases de dados

mapa_ideb_est = mapa %>% left_join(IDEB_estadual)
## Joining with `by = join_by(Codigo)`
summary(mapa_ideb_est$IDEB2017)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   2.800   3.400   3.750   3.779   4.000   5.200       2
str(mapa_ideb_est)
## sf [92 × 27] (S3: sf/tbl_df/tbl/data.frame)
##  $ CD_MUN              : chr [1:92] "3300100" "3300159" "3300209" "3300225" ...
##  $ NM_MUN              : chr [1:92] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
##  $ CD_RGI              : chr [1:92] "330002" "330012" "330013" "330007" ...
##  $ NM_RGI              : chr [1:92] "Angra dos Reis" "Santo Antônio de Pádua" "Cabo Frio" "Petrópolis" ...
##  $ CD_RGINT            : chr [1:92] "3301" "3304" "3305" "3303" ...
##  $ NM_RGINT            : chr [1:92] "Rio de Janeiro" "Campos dos Goytacazes" "Macaé - Rio das Ostras - Cabo Frio" "Petrópolis" ...
##  $ CD_UF               : chr [1:92] "33" "33" "33" "33" ...
##  $ NM_UF               : chr [1:92] "Rio de Janeiro" "Rio de Janeiro" "Rio de Janeiro" "Rio de Janeiro" ...
##  $ CD_REGIAO           : chr [1:92] "3" "3" "3" "3" ...
##  $ NM_REGIAO           : chr [1:92] "Sudeste" "Sudeste" "Sudeste" "Sudeste" ...
##  $ CD_CONCURB          : chr [1:92] "3300100" NA "3300209" "3303906" ...
##  $ NM_CONCURB          : chr [1:92] "Angra dos Reis" NA "Araruama/RJ" "Petrópolis/RJ" ...
##  $ AREA_KM2            : num [1:92] 813.4 94.5 638.3 110.7 71 ...
##  $ geometry            :sfc_MULTIPOLYGON of length 92; first list element: List of 153
##   ..$ :List of 1
##   .. ..$ : num [1:68, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:8048, 1:2] -44.2 -44.2 -44.2 -44.2 -44.2 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:113, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:114, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:59, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:9, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:240, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:13, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:96, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:47, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:26, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:93, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:45, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:107, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:14, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:26, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:10320, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:114, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:32, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:29, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:90, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:12, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:53, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:32, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:66, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:29, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:26, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:59, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:900, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:83, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:7, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:48, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:21, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:11, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:29, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:35, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:42, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:21, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:14, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:28, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:21, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:95, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:62, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:192, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:68, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:134, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:25, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:82, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:44, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:14, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:10, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:32, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:12, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:9, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:17, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:48, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:91, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:27, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:44, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:129, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:13, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:12, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:35, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:28, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:43, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:36, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:86, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:80, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:40, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:17, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:13, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:23, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   .. [list output truncated]
##   ..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
##  $ Codigo              : num [1:92] 3300100 3300159 3300209 3300225 3300233 ...
##  $ UF                  : chr [1:92] "RJ" "RJ" "RJ" "RJ" ...
##  $ Nome                : chr [1:92] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
##  $ Rede                : chr [1:92] "Estadual" "Estadual" "Estadual" "Estadual" ...
##  $ Regiao              : chr [1:92] "Medio Paraiba" "Noroeste" "Lagos" "Centro sul" ...
##  $ IDEB2017            : num [1:92] 3.4 3.9 3.1 3.8 3.2 3.1 3.9 3.9 3.2 4.4 ...
##  $ IDEB2019            : chr [1:92] "3.7" "4.7" "3.7" "4" ...
##  $ IDEB2021            : chr [1:92] "3.8" "4.3" "3.6" "3.9" ...
##  $ IDEB2023            : chr [1:92] "3.4" "4.5999999999999996" "3.5" "3.6" ...
##  $ Distancia_capital_Km: num [1:92] 156 268 118 109 176 165 122 132 35 165 ...
##  $ Populacao           : num [1:92] 167434 11034 129671 11828 40060 ...
##  $ PIB_per_capita      : num [1:92] 53262 20698 31109 33490 84721 ...
##  $ IDH                 : num [1:92] 0.724 0.692 0.718 0.684 0.728 0.733 0.733 0.729 0.684 0.66 ...
##  - attr(*, "sf_column")= chr "geometry"
##  - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "names")= chr [1:26] "CD_MUN" "NM_MUN" "CD_RGI" "NM_RGI" ...
mapa_ideb_est <- st_as_sf(mapa_ideb_est)

Preparando Mapa

range(mapa_ideb_est$IDEB2017, na.rm = TRUE)
## [1] 2.8 5.2
library(ggplot2)
library(sf)

Mapa IDEB por Município

Pelo mapa, pode-se observar que os municípios mais distantes da capital, Rio de Janeiro, alcançaram maior desempenho (tom de vermelho escuro) no IDEB do ano de 2017, conforme índice à esquerda do mapa. Em contrapartida, municípios mais próximos a capital apresentam desempenho relativamente mais baixo (tom de vermelho claro) que os demais.

ggplot() +
  geom_sf(data = mapa_ideb_est, aes(fill = IDEB2017)) +
  scale_fill_distiller(palette = "Reds", direction = 1, 
                       name = "IDEB estadual 2017", 
                       limits = c(2.8,5.2)) +
  theme_minimal()

Mapa IDEB por Município

Uma outra forma de observar a relação existente entre o desempenho no IDEB de 2017 e a distância desses municípios para a capital, Rio de Janeiro.

str(mapa_ideb_est)
## sf [92 × 27] (S3: sf/tbl_df/tbl/data.frame)
##  $ CD_MUN              : chr [1:92] "3300100" "3300159" "3300209" "3300225" ...
##  $ NM_MUN              : chr [1:92] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
##  $ CD_RGI              : chr [1:92] "330002" "330012" "330013" "330007" ...
##  $ NM_RGI              : chr [1:92] "Angra dos Reis" "Santo Antônio de Pádua" "Cabo Frio" "Petrópolis" ...
##  $ CD_RGINT            : chr [1:92] "3301" "3304" "3305" "3303" ...
##  $ NM_RGINT            : chr [1:92] "Rio de Janeiro" "Campos dos Goytacazes" "Macaé - Rio das Ostras - Cabo Frio" "Petrópolis" ...
##  $ CD_UF               : chr [1:92] "33" "33" "33" "33" ...
##  $ NM_UF               : chr [1:92] "Rio de Janeiro" "Rio de Janeiro" "Rio de Janeiro" "Rio de Janeiro" ...
##  $ CD_REGIAO           : chr [1:92] "3" "3" "3" "3" ...
##  $ NM_REGIAO           : chr [1:92] "Sudeste" "Sudeste" "Sudeste" "Sudeste" ...
##  $ CD_CONCURB          : chr [1:92] "3300100" NA "3300209" "3303906" ...
##  $ NM_CONCURB          : chr [1:92] "Angra dos Reis" NA "Araruama/RJ" "Petrópolis/RJ" ...
##  $ AREA_KM2            : num [1:92] 813.4 94.5 638.3 110.7 71 ...
##  $ geometry            :sfc_MULTIPOLYGON of length 92; first list element: List of 153
##   ..$ :List of 1
##   .. ..$ : num [1:68, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:8048, 1:2] -44.2 -44.2 -44.2 -44.2 -44.2 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:113, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:114, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:59, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:9, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:240, 1:2] -44.5 -44.5 -44.5 -44.5 -44.5 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:13, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:96, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:47, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:26, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:93, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:45, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:107, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:14, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:26, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:10320, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:114, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:32, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:29, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:90, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:12, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:53, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:32, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:66, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:29, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:26, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:59, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:24, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:900, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:83, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:7, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:48, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:21, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:11, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:29, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:35, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:42, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:21, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:14, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:28, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:21, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:95, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:62, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:192, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:68, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:134, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:25, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:82, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:44, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:14, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:10, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:32, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:12, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:9, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:17, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:48, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:91, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:27, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:44, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:19, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:16, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:129, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:15, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:13, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:12, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:35, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:28, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:43, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:36, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:86, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.3 -44.3 -44.3 -44.3 -44.3 ...
##   ..$ :List of 1
##   .. ..$ : num [1:80, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:40, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:17, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:39, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:13, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   ..$ :List of 1
##   .. ..$ : num [1:23, 1:2] -44.4 -44.4 -44.4 -44.4 -44.4 ...
##   .. [list output truncated]
##   ..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
##  $ Codigo              : num [1:92] 3300100 3300159 3300209 3300225 3300233 ...
##  $ UF                  : chr [1:92] "RJ" "RJ" "RJ" "RJ" ...
##  $ Nome                : chr [1:92] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
##  $ Rede                : chr [1:92] "Estadual" "Estadual" "Estadual" "Estadual" ...
##  $ Regiao              : chr [1:92] "Medio Paraiba" "Noroeste" "Lagos" "Centro sul" ...
##  $ IDEB2017            : num [1:92] 3.4 3.9 3.1 3.8 3.2 3.1 3.9 3.9 3.2 4.4 ...
##  $ IDEB2019            : chr [1:92] "3.7" "4.7" "3.7" "4" ...
##  $ IDEB2021            : chr [1:92] "3.8" "4.3" "3.6" "3.9" ...
##  $ IDEB2023            : chr [1:92] "3.4" "4.5999999999999996" "3.5" "3.6" ...
##  $ Distancia_capital_Km: num [1:92] 156 268 118 109 176 165 122 132 35 165 ...
##  $ Populacao           : num [1:92] 167434 11034 129671 11828 40060 ...
##  $ PIB_per_capita      : num [1:92] 53262 20698 31109 33490 84721 ...
##  $ IDH                 : num [1:92] 0.724 0.692 0.718 0.684 0.728 0.733 0.733 0.729 0.684 0.66 ...
##  - attr(*, "sf_column")= chr "geometry"
##  - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA NA NA NA NA ...
##   ..- attr(*, "names")= chr [1:26] "CD_MUN" "NM_MUN" "CD_RGI" "NM_RGI" ...
summary(mapa_ideb_est$IDEB2017)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   2.800   3.400   3.750   3.779   4.000   5.200       2
library(leaflet)

st_geometry(mapa_ideb_est)  
## Geometry set for 92 features 
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: -44.88932 ymin: -23.36893 xmax: -40.95794 ymax: -20.76321
## Geodetic CRS:  SIRGAS 2000
## First 5 geometries:
## MULTIPOLYGON (((-44.51649 -23.03589, -44.51633 ...
## MULTIPOLYGON (((-42.11437 -21.61204, -42.11394 ...
## MULTIPOLYGON (((-42.28399 -22.93928, -42.28444 ...
## MULTIPOLYGON (((-43.09004 -22.23844, -43.09135 ...
## MULTIPOLYGON (((-41.88151 -22.74808, -41.88153 ...
mapa_ideb_est <- st_as_sf(mapa_ideb_est)
mapa_ideb_est <- st_transform(mapa_ideb_est, crs = 4326)

leaflet(mapa_ideb_est) %>%
  addPolygons(color = "#444444",
              fillColor = ~colorQuantile("Reds", IDEB2017)(IDEB2017),
              weight = 1,
              smoothFactor = 0.5,
              opacity = 1,
              fillOpacity = 0.7,
              popup = ~paste("IDEB 2017:", IDEB2017)) %>%
  addTiles() %>%
  addLegend(pal = colorQuantile("Reds", mapa_ideb_est$IDEB2017),
            values = mapa_ideb_est$IDEB2017,
            title = "IDEB 2017",
            opacity = 1)

Calculando Média/Mediana/Desvio Padrão

media_ideb2017 <- mean(IDEB_estadual$IDEB2017)
mediana_ideb_2017 <- median(IDEB_estadual$IDEB2017)
desvio_padrao_ideb_2017 <- sd(IDEB_estadual$IDEB2017)

Análise dos Resultados Calculando a média, mediana e desvio padrão da variável IDEB2017 Resultado obtido: Mediana: 3.778889 Média: 3.75 Desvio Padrão: 0.4736885 Com base nos resultados, podemos verificar que a mediana é levemente maior que a média, sendo assim a distribuição está pouco assimétrica, possuindo valores mais altos. Em relação a média, observa-se que as escolas do Rio de Janeiro tiveram um desempenho regular. Ademais, o valor do despad 0.47 indica que os valores não estão muito dispersos em torno da média.

Histograma

O histograma mostra a distribuição das notas do IDEB (Índice de Desenvolvimento da Educação Básica) para o Estado do Rio de Janeiro em 2017. Compreende-se que a distribuição não é perfeitamente simétrica, com uma concentração entre 3.5 e 4

hist(IDEB_estadual$IDEB2017,
     col = c("skyblue", "skyblue", "skyblue", "skyblue", "skyblue"),
     main = "Distribuição do IDEB 2017 - Rio de Janeiro",
     sub = "Com destaque para a média",
     labels = TRUE,
     xlab = "IDEB 2017",
     ylab = "Frequência",
     border = "white")

media_ideb2017 <- mean(IDEB_estadual$IDEB2017)
abline(v = media_ideb2017, col = "red", lwd = 2, lty = 2)
legend("topright", legend = "Média", lty = 1, col = "red")

Boxplot

boxplot(IDEB2017~Regiao, data=IDEB_estadual, col = c("orange",'red','purple','lightgreen','#F5DAD5','yellow','skyblue'),
        main = "Boxplot - IDEB em cada Região")

Correlação

De acordo com a matriz de correlação das variáveis: IDEB2017, Distância_capital_Km, Populacao, PIB_per_capita, IDH. As variáveis que possuem a correlação mais forte são IDEB2017 e Distância_capital_Km que possui uma correlação moderada positiva e o Distância_capital_Km tende a ficar maior o IDEB2017 tende a ficar maior

library(corrplot)
## corrplot 0.95 loaded
IDEB_estadual %>% select(IDEB2017,Distancia_capital_Km, Populacao, PIB_per_capita,IDH) %>% 
  cor() %>% corrplot(method = "circle")

Distância x IDEB

Correlação = 0.5637581

Positiva e moderada, ou seja, quando uma aumenta, a outra tende a subir também.

cor(IDEB_estadual$IDEB2017,IDEB_estadual$Distancia_capital_Km)
## [1] 0.5637581

População x IDEB

Correlação = -0.258997

Negativa fraca, ou seja , à medida que a população aumenta, o IDEB2017 tende a diminuir.

cor(IDEB_estadual$IDEB2017,IDEB_estadual$Populacao)
## [1] -0.2550957

PIB per Capita x IDEB

Correlação = -0.1094274

Quando o PIB per capita aumenta, o IDEB tende a diminuir ligeiramente, mas essa relação é fraca.

cor(IDEB_estadual$IDEB2017,IDEB_estadual$PIB_per_capita)
## [1] -0.1094274

IDEB x IDH

Correlação = -0.3357597

Quando o IDH aumenta, o IDEB2017 tende a diminuir, mas essa relação não é muito forte. É uma relação negativa fraca.

cor(IDEB_estadual$IDEB2017,IDEB_estadual$IDH)
## [1] -0.3357597

População x Distância p/ Capital

Correlação = -0.3047417

Temos uma correlação negativa fraca a moderada. Quanto maior a distância para a capital, menor tende a ser a população do município.

cor(IDEB_estadual$Distancia_capital_Km,IDEB_estadual$Populacao)
## [1] -0.3047417

PIB per Capita x Distância p/ Capital

Correlação = -0.07525028

À medida que a distância para a capital aumenta, o PIB per capita tende a diminuir levemente. É uma correlação negativa muito fraca

cor(IDEB_estadual$Distancia_capital_Km,IDEB_estadual$PIB_per_capita)
## [1] -0.07525028

IDH x Distância p/ Capital

Correlação = -0.3590785

À medida que a distância da capital aumenta, o IDH tende a diminuir. Temos uma correlação negativa fraca a moderada.

cor(IDEB_estadual$Distancia_capital_Km,IDEB_estadual$IDH)
## [1] -0.3590785

PIB per Capita x População

Correlação = -0.0003455212

A Correlação negativa é muito fraca, praticamente inexistente. Isso significa que o tamanho da população e o PIB per capita praticamente não têm relação entre si.

cor(IDEB_estadual$Populacao,IDEB_estadual$PIB_per_capita)
## [1] -0.0003455212

IDH x População

Correlação = 0.3322641

Positiva fraca

cor(IDEB_estadual$Populacao,IDEB_estadual$IDH)
## [1] 0.3322641

IDH x PIB per Capita

Correlação = 0.205504

Positiva Fraca

cor(IDEB_estadual$PIB_per_capita,IDEB_estadual$IDH)
## [1] 0.205504

Diagrama de Dispersão - Desempenho x Distância p/ capital

A partir da análise do diagrama de dispersão podemos concluir que as variáveis Desempenho x Distância p/ capital possuem uma relação positiva. Esse resultado sugere que escolas localizadas em municípios mais distantes da capital apresentam um desempenho ligeiramente melhor no IDEB 2017.

plot(IDEB_estadual$Distancia_capital_Km,IDEB_estadual$IDEB2017, 
     col="purple",
     pch=19,main="Diagrama de dispersão",
     xlab="Distância",
     ylab="IDEB2017")
abline(lsfit(IDEB_estadual$Distancia_capital_Km,IDEB_estadual$IDEB2017),
       col="black")

Diagrama de Dispersão - Desempenho x IDH

plot(IDEB_estadual$IDH,IDEB_estadual$IDEB2017, 
     col="purple",
     pch=19,main="Diagrama de dispersão",
     xlab="IDH",
     ylab="IDEB2017")
abline(lsfit(IDEB_estadual$IDH,IDEB_estadual$IDEB2017),
       col="black")

Teste de Hipóteses

1. A distância de um município para a capital do Estado influencia o desempenho no IDEB?

2. O tamanho da população do município influencia o desempenho no IDEB?

3. Municípios com maior PIB per capita tem melhor desempenho no IDEB?

4. O aumento do IDH está relacionado aos índices no IDEB?

5. O desempenho no IDEB é o mesmo em todas as regiões do Estado?

1. Hipótese sobre a variabilidade das notas

A distância para a capital influencia o desempenho no IDEB?

Quem mora longe tem desempenho inferior de quem mora perto da capital?

Avaliando Pressuposto de Normalidade

modelo1 = aov(IDEB2017~Distancia_capital_Km, data=IDEB_estadual)
residuos1 = residuals(modelo1)

H0: os dados seguem uma distribuição normal

H1: os dados Não seguem uma distribuição normal

alpha: 0,05

Se pvalor <= alpha, rejeita H0

Se pvalor > alpha, NÃO REJ H0 - segue uma distribução normal

shapiro.test(residuos1)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos1
## W = 0.98701, p-value = 0.5157

p-valor = 0.5157

Não rejeita H0

Segue a distribuição normal

Teste de Pearson

H0 = Os municípios têm desempenho no IDEB semelhante, independentemente da distância para a capital

H1 = Os municípios mais próximos a capital possuem melhor desempenho

cor.test(IDEB_estadual$IDEB2017,IDEB_estadual$Distancia_capital_Km, method = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  IDEB_estadual$IDEB2017 and IDEB_estadual$Distancia_capital_Km
## t = 6.403, df = 88, p-value = 7.228e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.4038118 0.6902617
## sample estimates:
##       cor 
## 0.5637581

pvalor = 7.228e-09

Rejeita H0 = correlação estatisticamente significativa

Correlação = 0.5637581

Sugere uma correlação moderada, isto é, quando uma variável aumenta a outra tende a aumentar.Quem mora mais longe da capital tende a ter melhor desempenho nas notas.

Hipótese 2 - Quem tem maior população tem melhores notas?

modelo2 = aov(IDEB2017~Populacao, data=IDEB_estadual) 
residuos2 = residuals(modelo2)

H0: os dados seguem uma distribuição normal

H1: os dados Não seguem uma distribuição normal

alpha: 0,05

Se p-valor <= alpha, REJ H0

Se p-valor > alpha, NÃO REJ H0 - segue uma distribução normal

shapiro.test(residuos2)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos2
## W = 0.98303, p-value = 0.2908

p-valor = 0.2908 > alpha

Não rejeita H0 - pressuposto da normalidade atingido

Teste de Person

H0 = O tamanho da população não influencia no desempenho no IDEB

H1 = Os municípios com maior população têm desempenho superior

alpha = 0,05

cor.test(IDEB_estadual$IDEB2017,IDEB_estadual$Populacao, method = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  IDEB_estadual$IDEB2017 and IDEB_estadual$Populacao
## t = -2.4749, df = 88, p-value = 0.01524
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.43899551 -0.05068199
## sample estimates:
##        cor 
## -0.2550957

p-valor = 0.01524

Rejeita H0 - correlação estatisticamente significativa

Correlação = -0.2550957

Sugere uma correlação fraca ou seja, quando uma variável aumenta, a outra tende a diminuir, porém essa relação fraca.Pela análise quanto menor a população, melhores são as notas,porém essa relação é bem fraca.

Hipótese 3 - Municípios com maior PIB per capita tem melhor IDEB?

modelo3 = aov(IDEB2017~PIB_per_capita, data=IDEB_estadual)
residuos3 = residuals(modelo3)

H0: os dados seguem uma distribuição normal

H1: os dados Não seguem uma distribuição normal

alpha: 0,05

Se pvalor <= alpha REJ H0

Se pvalor > alpha NÃO REJ H0 - segue uma distribução normal

shapiro.test(residuos3)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos3
## W = 0.98192, p-value = 0.2451

p-valor = 0.2451

Pressuposto da normalidade atingido

Não REJ H0

Teste de person

H0 = Os municípios têm mesmo desempenho, independentemente do PIB per capita

H1 = Municípios com maior PIB per capita têm melhor desempenho no IDEB

alpha = 0,05

cor.test(IDEB_estadual$IDEB2017,IDEB_estadual$PIB_per_capita, method = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  IDEB_estadual$IDEB2017 and IDEB_estadual$PIB_per_capita
## t = -1.0327, df = 88, p-value = 0.3046
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.3095047  0.0999282
## sample estimates:
##        cor 
## -0.1094274

p-value = 0.3046

Não REJ H0 - Não há evidências estatísticas suficientes para afirmar que existe

uma correlação linear significativa

Não há uma correlação estatisticamente positiva

correlação = -0.1094274

correlação fraca ou inexistente, as variáveis não estão diretamente relacionadas.Não há dados que comprovem que o aumento do PIB per capita influencia no aumento do desempenho das notas.

Hipótese 4 - O aumento do IDH está relacionado aos maiores índices no IDEB?

modelo4 = aov(IDH~IDEB2017, data=IDEB_estadual)
residuos4 = residuals(modelo4)

H0: os dados seguem uma distribuição normal

H1: os dados Não seguem uma distribuição normal

alpha: 0,05

Se p-valor <= alpha, REJ H0

Se p-valor > alpha, NÃO REJ H0 - segue uma distribução normal

shapiro.test(residuos4)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos4
## W = 0.98587, p-value = 0.4417

p-valor = 0.6451

NÃO REJ H0

Princípio da normalidade atingido

Teste de Person

H0 = O desempenho no IDEB não influencia no IDH dos municípios

H1 = Municípios com melhor desempenho no IDEB possuem maior IDH

alpha = 0,05

cor.test(IDEB_estadual$IDH,IDEB_estadual$IDEB2017, method = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  IDEB_estadual$IDH and IDEB_estadual$IDEB2017
## t = -3.3438, df = 88, p-value = 0.001215
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.5075588 -0.1382839
## sample estimates:
##        cor 
## -0.3357597

p-valor = 0.001215

REJ H0 - correlação estatisticamente negativa

Correlação = -0.3357597

Sugere que a correlação é fraca e moderada, ou seja, quanto maior o IDEB, mais tende o IDH a diminuir, porém essa relação é fraca.

Hipótese 5 - O desempenho no IDEB é o mesmo em todas as regiões do Estado?

modelo5 = aov(IDEB2017~Regiao, data=IDEB_estadual)
residuos5 = residuals(modelo5)

H0: os dados seguem uma distribuição normal

H1: os dados Não seguem uma distribuição normal

alpha: 0,05

Se p-valor <= alpha, REJ H0

Se p-valor > alpha, NÃO REJ H0 - segue uma distribução normal

shapiro.test(residuos5)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos5
## W = 0.9739, p-value = 0.06678

p-valor = 0.06678

NÃO REJ H0

Princípio da normalidade atingido

Teste de Bartlett

H0 = As variâncias podem ser consideradas homogêneas.

H1 = As variâncias não são homogêneas.

alpha = 0,05

bartlett.test(IDEB_estadual$IDEB2017,IDEB_estadual$Regiao, data = IDEB_estadual)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  IDEB_estadual$IDEB2017 and IDEB_estadual$Regiao
## Bartlett's K-squared = 11.231, df = 6, p-value = 0.08149

p-valor = 0.08149

Não REJ H0 - Não rejeitamos a hipótese nula, o que significa que não há

evidências suficientes para concluir que as variâncias dos grupos são diferentes. As variâncias podem ser consideradas homogêneas.

ideb_regiao <- aov(IDEB2017~Regiao, data = IDEB_estadual)
summary(ideb_regiao)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Regiao       6 10.873  1.8121   16.53 1.92e-12 ***
## Residuals   83  9.097  0.1096                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Teste de Tukey

TukeyHSD(ideb_regiao)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = IDEB2017 ~ Regiao, data = IDEB_estadual)
## 
## $Regiao
##                                    diff          lwr         upr     p adj
## Lagos-Centro sul            -0.45000000 -0.878361668 -0.02163833 0.0330491
## Medio Paraiba-Centro sul    -0.01875000 -0.422039176  0.38453918 0.9999993
## Metropolitana-Centro sul    -0.57500000 -0.978289176 -0.17171082 0.0008575
## Noroeste-Centro sul          0.37307692 -0.047729272  0.79388312 0.1166288
## Norte-Centro sul            -0.12777778 -0.587447003  0.33189145 0.9799162
## Serrana-Centro sul           0.34285714 -0.071363260  0.75707755 0.1723295
## Medio Paraiba-Lagos          0.43125000  0.049201688  0.81329831 0.0167058
## Metropolitana-Lagos         -0.12500000 -0.507048312  0.25704831 0.9551239
## Noroeste-Lagos               0.82307692  0.422581471  1.22357238 0.0000004
## Norte-Lagos                  0.32222222 -0.118929169  0.76337361 0.3030028
## Serrana-Lagos                0.79285714  0.399287206  1.18642708 0.0000007
## Metropolitana-Medio Paraiba -0.55625000 -0.909958006 -0.20254199 0.0001650
## Noroeste-Medio Paraiba       0.39182692  0.018269634  0.76538421 0.0334982
## Norte-Medio Paraiba         -0.10902778 -0.525876660  0.30782110 0.9853118
## Serrana-Medio Paraiba        0.36160714 -0.004515427  0.72772971 0.0551357
## Noroeste-Metropolitana       0.94807692  0.574519634  1.32163421 0.0000000
## Norte-Metropolitana          0.44722222  0.030373340  0.86407110 0.0273327
## Serrana-Metropolitana        0.91785714  0.551734573  1.28397971 0.0000000
## Norte-Noroeste              -0.50085470 -0.934673425 -0.06703598 0.0132132
## Serrana-Noroeste            -0.03021978 -0.415552663  0.35511310 0.9999844
## Serrana-Norte                0.47063492  0.043201448  0.89806839 0.0213861

Conclusão

O presente trabalho evidenciou algumas problemáticas relacionadas ao ensino educacional nos municípios do Rio de Janeiro. Sendo assim, iremos propor alternativas, para que haja uma melhoria e consequentemente alavancar as notas do Estado do Rio de Janeiro na próxima avaliação do IDEB. A partir da presente análise estatística, foi constatado que as variáveis distância para capital(Km), população, regiões e PIB per capita influenciam, de maneira diferente, o resultado do IDEB de 2017. Refletindo que as diferenças geográficas e socioeconômicas entre as regiões impactam no desempenho da escolaridade no Estado do Rio de Janeiro. Os dados analisados revelaram que as regiões mais distantes da capital tendem a possuir um IDEB mais elevado que as demais, o que pode estar associado a fatores sociais, como nível de violência menor em regiões mais afastadas da capital, menos oportunidades de acesso à educação e por consequência um IDEB proporcionalmente maior em áreas de menor índice populacional e monetário, como já confirmado pelas correlações inversamente proporcionais dessas variáveis com IDEB. O estudo ainda permitiu avaliar como a variável IDH foi impactada pelo IDEB de 2017, o que demonstrou ter uma influência relativamente fraca, esse fato pode ser explicado por uma série de fatores, dentre eles a migração de indivíduos em regiões bem desenvolvidas para outros locais em busca de mais oportunidades, ou até mesmo para fugir de determinados problemas urbanos originados pelo desenvolvimento humano. Além disso, é evidente que o Rio de Janeiro enfrenta uma crise no setor de segurança pública. No presente trabalho realizamos um teste de hipótese em relação IDEB 2017 X distância da capital, e surpreendentemente nos deparamos com o resultado que o IDEB na capital é mais baixo do que nos municípios mais distantes. Compreende-se que uma das causas para tal fenômeno se encontra na violência presente na capital do Rio de Janeiro, principalmente em regiões de baixo acesso por parte da segurança pública. Para enfrentar essa situação, propomos a implementação de políticas de segurança pública nas escolas, com medidas de segurança para professores e alunos. Entre as soluções sugeridas estão a instalação de câmeras de segurança no ambiente escolar e a realização de parcerias com polícias comunitárias, que poderiam garantir maior presença e apoio nas áreas de risco. Sugerimos, para estudos futuros, investigações mais aprofundadas sobre a migração em diferentes regiões, pois visualizamos que as regiões mais distantes da capital tendem a possuir o Índice de Desenvolvimento da Educação Básica (IDEB) mais elevado que as demais. Essa diferença pode estar relacionada a uma série de fatores sociais, políticos, econômicos e culturais, que merecem uma análise mais detalhada.

A migração é impulsionada por diversos fatores, tais como melhores oportunidades de emprego, melhoria na qualidade de vida e outras condições favoráveis. Sendo assim, seria interessante analisar como políticas públicas locais, investimentos em infraestrutura e no setor de empreendedorismo local podem impactar a decisão de migração da população.

Para estudos futuros, sugerimos investigações em relação a migração e o IDEB, considerando variáveis como quantidade de empregos, investimentos na segurança e iniciativas de desenvolvimento local, bem como incentivo ao empreendedorismo local.