O que foi feito por hoje. |
library(readxl)
IDEB_Ensino_Medio_1_ <- read_excel("C:/Users/alons/Downloads/IDEB Ensino Medio (1).xlsx")
## New names:
## • `` -> `...10`
library(dplyr)
##
## Anexando pacote: 'dplyr'
##
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
##
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
IDEB_estadual = IDEB_Ensino_Medio_1_ %>% filter(Rede=="Estadual")
nomes1 = c('UF', 'Codigo','Nome','Rede', 'IDEB2017','IDEB2019','IDEB2021','IDEB2023','meta2019','meta2021','Distancia','Populacao')
colnames(IDEB_estadual) = nomes1
IDEB_estadual$IDEB2017 <- as.numeric(IDEB_estadual$IDEB2017)
## Warning: NAs introduzidos por coerção
IDEB_estadual<- IDEB_estadual[!is.na(IDEB_estadual$IDEB2017), ]
IDEB_estadual$IDEB2019 <- as.numeric(IDEB_estadual$IDEB2019)
## Warning: NAs introduzidos por coerção
IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$IDEB2019), ]
IDEB_estadual$IDEB2021 <- as.numeric(IDEB_estadual$IDEB2021)
## Warning: NAs introduzidos por coerção
IDEB_estadual<- IDEB_estadual[!is.na(IDEB_estadual$IDEB2021), ]
IDEB_estadual$IDEB2023 <- as.numeric(IDEB_estadual$IDEB2023)
## Warning: NAs introduzidos por coerção
IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$IDEB2023), ]
IDEB_estadual$meta2019 <- as.numeric(IDEB_estadual$meta2019)
IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$meta2019), ]
IDEB_estadual$meta2021 <- as.numeric(IDEB_estadual$meta2021)
IDEB_estadual <- IDEB_estadual[!is.na(IDEB_estadual$meta2021), ]
str(IDEB_estadual)
## tibble [82 × 12] (S3: tbl_df/tbl/data.frame)
## $ UF : chr [1:82] "RJ" "RJ" "RJ" "RJ" ...
## $ Codigo : num [1:82] 3300100 3300159 3300209 3300225 3300258 ...
## $ Nome : chr [1:82] "Angra dos Reis" "Aperibé" "Araruama" "Areal" ...
## $ Rede : chr [1:82] "Estadual" "Estadual" "Estadual" "Estadual" ...
## $ IDEB2017 : num [1:82] 3.4 3.9 3.1 3.8 3.1 3.9 3.9 3.2 4.4 3.9 ...
## $ IDEB2019 : num [1:82] 3.7 4.7 3.7 4 4.1 4 4.2 3.5 4.5 4.1 ...
## $ IDEB2021 : num [1:82] 3.8 4.3 3.6 3.9 4.3 4.5 4.6 3.5 4.8 4.4 ...
## $ IDEB2023 : num [1:82] 3.4 4.6 3.5 3.6 4.1 3.7 4.2 3.1 4.2 4.2 ...
## $ meta2019 : num [1:82] 3.6 4.1 3.3 4 3.3 4.1 4.1 3.4 4.6 4.1 ...
## $ meta2021 : num [1:82] 3.8 4.4 3.6 4.2 3.5 4.3 4.3 3.6 4.8 4.3 ...
## $ Distancia: num [1:82] 156 268 118 109 165 122 132 35 165 334 ...
## $ Populacao: chr [1:82] "167 434" "11 034" "129 671" "11 828" ...
IDEB_estadual$IDEB2023 <- as.numeric(IDEB_estadual$IDEB2023)
IDEB_estadual$IDEB2017 <- as.numeric(IDEB_estadual$IDEB2017)
IDEB_estadual$IDEB2021 <- as.numeric(IDEB_estadual$IDEB2021)
IDEB_estadual$IDEB2023 <- as.numeric(IDEB_estadual$IDEB2023)
IDEB_estadual$meta2019 <- as.numeric(IDEB_estadual$meta2019)
IDEB_estadual$meta2021 <- as.numeric(IDEB_estadual$meta2021)
hist(IDEB_estadual$IDEB2023,
col = c("pink1", "pink1", "pink1", "pink1", "pink1"),
main = "Distribuição do IDEB 2023 - Rio de Janeiro",
sub = "Com destaque para a média",
xlab = "IDEB 2023",
ylab = "Frequência",
border = "white")
media_ideb2023 <- mean(IDEB_estadual$IDEB2023)
abline(v = media_ideb2023, col = "black", lwd = 2, lty = 2)
legend("topright", legend = "Média", lty = 1, col = "black")
median(IDEB_estadual$IDEB2023)
## [1] 3.8
boxplot(IDEB_estadual$IDEB2023, main = "Boxplot IDEB2023",
col = "violet")
plot(IDEB_estadual$IDEB2023,IDEB_estadual$Distancia, col = "tomato3", pch = 21,
main = "Gráfico 1 - Diagrama de dispersão",
xlab = "IDEB2023",
ylab = "Distancia")
abline(lsfit(IDEB_estadual$IDEB2023,IDEB_estadual$Distancia),
col = "purple", lwd = 3)
cor(IDEB_estadual$IDEB2023,IDEB_estadual$Distancia)
## [1] 0.5969771
Elas tem correlação positiva e moderada, ou seja, conforme uma aumente a outra tende a aumentar tambem. Nesse caso quanto mas longe da capital, maiores são as notas. O valor da variável é proximo de +1.
library(sf)
## Linking to GEOS 3.12.1, GDAL 3.8.4, PROJ 9.3.1; sf_use_s2() is TRUE
mapa = sf::read_sf('C:/Users/alons/Downloads/RJ_Municipios_2023/RJ_Municipios_2023.shp')
class(mapa$CD_MUN)
## [1] "character"
class(IDEB_estadual$Codigo)
## [1] "numeric"
mapa$Codigo = as.numeric(mapa$CD_MUN)
mapa_ideb_est = mapa %>% left_join(IDEB_estadual)
## Joining with `by = join_by(Codigo)`
summary(IDEB_estadual$IDEB2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000 3.425 3.800 3.866 4.200 5.000
library(ggplot2)
ggplot() +
geom_sf(data = mapa_ideb_est, aes(fill = IDEB2023)) +
scale_fill_distiller(palette = "Purples", direction = 1,
name = "IDEB estadual 2023",
limits = c(3, 5)) +
theme_minimal()