O que foi feito por hoje.

Parte do trabalho (IDEB 2023)—————————————————

Arrumando a base de dados

library(readxl)
IDEB_Ensino_Medio_1_ <- read_excel("C:/Users/alons/Downloads/IDEB Ensino Medio (1).xlsx")

## New names:
## • `` -> `...10`

library(dplyr)

## 
## Anexando pacote: 'dplyr'
## 
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## 
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union

IDEB_estadual = IDEB_Ensino_Medio_1_ %>% filter(Rede=="Estadual")


nomes1 = c('UF',    'Codigo','Nome','Rede', 'IDEB2017','IDEB2019','IDEB2021','IDEB2023','meta2019','meta2021','Distancia','Populacao')
colnames(IDEB_estadual) = nomes1


IDEB_estadual$IDEB2017 <- as.numeric(IDEB_estadual$IDEB2017)

## Warning: NAs introduzidos por coerção

IDEB_estadual<- IDEB_estadual[!is.na(IDEB_estadual$IDEB2017), ]  

IDEB_estadual$IDEB2019 <- as.numeric(IDEB_estadual$IDEB2019)

## Warning: NAs introduzidos por coerção

IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$IDEB2019), ]  

IDEB_estadual$IDEB2021 <- as.numeric(IDEB_estadual$IDEB2021)

## Warning: NAs introduzidos por coerção

IDEB_estadual<- IDEB_estadual[!is.na(IDEB_estadual$IDEB2021), ]  

IDEB_estadual$IDEB2023 <- as.numeric(IDEB_estadual$IDEB2023)

## Warning: NAs introduzidos por coerção

IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$IDEB2023), ]  

IDEB_estadual$meta2019 <- as.numeric(IDEB_estadual$meta2019)
IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$meta2019), ]   

IDEB_estadual$meta2021 <- as.numeric(IDEB_estadual$meta2021)
IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$meta2021), ]   

str(IDEB_estadual)

## tibble [82 × 12] (S3: tbl_df/tbl/data.frame)
##  $ UF       : chr [1:82] "RJ" "RJ" "RJ" "RJ" ...
##  $ Codigo   : num [1:82] 3300100 3300159 3300209 3300225 3300258 ...
##  $ Nome     : chr [1:82] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
##  $ Rede     : chr [1:82] "Estadual" "Estadual" "Estadual" "Estadual" ...
##  $ IDEB2017 : num [1:82] 3.4 3.9 3.1 3.8 3.1 3.9 3.9 3.2 4.4 3.9 ...
##  $ IDEB2019 : num [1:82] 3.7 4.7 3.7 4 4.1 4 4.2 3.5 4.5 4.1 ...
##  $ IDEB2021 : num [1:82] 3.8 4.3 3.6 3.9 4.3 4.5 4.6 3.5 4.8 4.4 ...
##  $ IDEB2023 : num [1:82] 3.4 4.6 3.5 3.6 4.1 3.7 4.2 3.1 4.2 4.2 ...
##  $ meta2019 : num [1:82] 3.6 4.1 3.3 4 3.3 4.1 4.1 3.4 4.6 4.1 ...
##  $ meta2021 : num [1:82] 3.8 4.4 3.6 4.2 3.5 4.3 4.3 3.6 4.8 4.3 ...
##  $ Distancia: num [1:82] 156 268 118 109 165 122 132 35 165 334 ...
##  $ Populacao: chr [1:82] "167 434" "11 034" "129 671" "11 828" ...

IDEB_estadual$IDEB2023 <- as.numeric(IDEB_estadual$IDEB2023)

IDEB_estadual$IDEB2017 <- as.numeric(IDEB_estadual$IDEB2017)

IDEB_estadual$IDEB2021 <- as.numeric(IDEB_estadual$IDEB2021)

IDEB_estadual$IDEB2023 <- as.numeric(IDEB_estadual$IDEB2023)

IDEB_estadual$meta2019 <- as.numeric(IDEB_estadual$meta2019)
                                    
IDEB_estadual$meta2021 <- as.numeric(IDEB_estadual$meta2021)

Média das notas no ano de 2023/ Histograma

Histograma

hist(IDEB_estadual$IDEB2023,
     col = c("pink1", "pink1", "pink1", "pink1", "pink1"),
     main = "Distribuição do IDEB 2023 - Rio de Janeiro",
     sub = "Com destaque para a média",
     xlab = "IDEB 2023",
     ylab = "Frequência",
     border = "white")

media_ideb2023 <- mean(IDEB_estadual$IDEB2023)
abline(v = media_ideb2023, col = "black", lwd = 2, lty = 2)
legend("topright", legend = "Média", lty = 1, col = "black")

Boxplot do ano de 2023

median(IDEB_estadual$IDEB2023)

## [1] 3.8

boxplot(IDEB_estadual$IDEB2023, main = "Boxplot IDEB2023",
        col = "violet")

Diagrama de dispersão

 plot(IDEB_estadual$IDEB2023,IDEB_estadual$Distancia, col = "tomato3", pch = 21,
       main = "Gráfico 1 - Diagrama de dispersão",
       xlab = "IDEB2023",
       ylab = "Distancia")
abline(lsfit(IDEB_estadual$IDEB2023,IDEB_estadual$Distancia), 
       col = "purple", lwd = 3)

Correlação

cor(IDEB_estadual$IDEB2023,IDEB_estadual$Distancia)

## [1] 0.5969771

Elas tem correlação positiva e moderada, ou seja, conforme uma aumente a outra tende a aumentar tambem. Nesse caso quanto mas longe da capital, maiores são as notas. O valor da variável é proximo de +1.

Mapa

library(sf)

## Linking to GEOS 3.12.1, GDAL 3.8.4, PROJ 9.3.1; sf_use_s2() is TRUE

mapa = sf::read_sf('C:/Users/alons/Downloads/RJ_Municipios_2023/RJ_Municipios_2023.shp')

class(mapa$CD_MUN)

## [1] "character"

class(IDEB_estadual$Codigo)

## [1] "numeric"

mapa$Codigo = as.numeric(mapa$CD_MUN)

mapa_ideb_est = mapa %>% left_join(IDEB_estadual)

## Joining with `by = join_by(Codigo)`

summary(IDEB_estadual$IDEB2023)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   3.425   3.800   3.866   4.200   5.000

library(ggplot2)

ggplot() +
  geom_sf(data = mapa_ideb_est, aes(fill = IDEB2023)) +
  scale_fill_distiller(palette = "Purples", direction = 1, 
                       name = "IDEB estadual 2023", 
                       limits = c(3, 5)) +
  theme_minimal()