library(readxl)
Censo_Séries_históricas <- read_excel("C:/Users/User/Downloads/Censo-Séries-históricas.xlsx",
col_types = c("text", "numeric", "numeric"))
#View(Censo_Séries_históricas)População RJ
Censo_Séries_históricas$Faixa_População<-cut(Censo_Séries_históricas$População, c(0, 130000, 3300000, 6700000))
Censo_Séries_históricas$Faixa_População
levels(Censo_Séries_históricas$Faixa_População)<-c("Até 130 mil", "De 130 mil a 3,3 bi", "De 3,30 bi a 6,7 bi")library(dplyr)
library(ggplot2)
Censo_Séries_históricas %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Localidade, fill = Faixa_População) +
geom_bar(position = "fill") +
scale_fill_manual(values = c(`Até 130 mil` = "#6093B1", `De 130 mil a 3,3 bi` = "#003755", `De 3,30 bi a 6,7 bi` = "#00202D"
)) +
labs(y = "Frequência absoluta", title = "População por Localidade") +
theme_minimal()shapiro.test(Censo_Séries_históricas$População)
# Não há normalidadekruskal.test(População~Localidade, data = Censo_Séries_históricas)
Kruskal-Wallis rank sum test
data: População by Localidade
Kruskal-Wallis chi-squared = 58.285, df = 9, p-value = 2.866e-09
library(DescTools)
DunnettTest(População~Localidade, data = Censo_Séries_históricas)
Dunnett's test for comparing several treatments with a control :
95% family-wise confidence level
$`Belford Roxo`
diff lwr.ci upr.ci pval
Campos dos Goytacazes-Belford Roxo -42160.600 -488514.01 404192.8 1.0000
Duque de Caxias-Belford Roxo 264763.257 -181590.15 711116.7 0.4460
Niterói-Belford Roxo -1337.886 -447691.30 445015.5 1.0000
Nova Iguaçu-Belford Roxo 413028.971 -33324.44 859382.4 0.0805 .
Petrópolis-Belford Roxo -175762.457 -622115.87 270591.0 0.8301
Rio de Janeiro-Belford Roxo 5231818.543 4785465.13 5678172.0 <2e-16 ***
São Gonçalo-Belford Roxo 362284.971 -84068.44 808638.4 0.1566
São João de Meriti-Belford Roxo -31548.886 -477902.30 414804.5 1.0000
Volta Redonda-Belford Roxo -222207.029 -668560.44 224146.4 0.6301
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Os municípios com valores de população mais distantes entre si são Rio de Janeiro e Belford Roxo, com diferença de cerca de 5,2 milhões pessoas.
chisq.test(Censo_Séries_históricas$Localidade, Censo_Séries_históricas$Faixa_População)
Pearson's Chi-squared test
data: Censo_Séries_históricas$Localidade and Censo_Séries_históricas$Faixa_População
X-squared = 76.743, df = 18, p-value = 3.163e-09
# Já que o valor-p é menor que 0,001, existe associação entre Localidade e População.library(summarytools)
ctable(Censo_Séries_históricas$Localidade, Censo_Séries_históricas$Faixa_População)Error : Can't find Censo_S
Error : Can't find Censo_S
Cross-Tabulation, Row Proportions
Censo_Séries_históricas$Localidade * Censo_Séries_históricas$Faixa_População
------------------------------------ ----------------------------------------- ------------- --------------------- --------------------- ------------ -------------
Censo_Séries_históricas$Faixa_População Até 130 mil De 130 mil a 3,3 bi De 3,30 bi a 6,7 bi <NA> Total
Censo_Séries_históricas$Localidade
Belford Roxo 0 ( 0.0%) 5 (62.5%) 0 ( 0.0%) 3 (37.5%) 8 (100.0%)
Campos dos Goytacazes 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Duque de Caxias 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Niterói 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Nova Iguaçu 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Petrópolis 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Rio de Janeiro 0 ( 0.0%) 0 ( 0.0%) 7 (87.5%) 1 (12.5%) 8 (100.0%)
São Gonçalo 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
São João de Meriti 0 ( 0.0%) 7 (87.5%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Volta Redonda 1 (12.5%) 6 (75.0%) 0 ( 0.0%) 1 (12.5%) 8 (100.0%)
Total 1 ( 1.2%) 60 (75.0%) 7 ( 8.8%) 12 (15.0%) 80 (100.0%)
------------------------------------ ----------------------------------------- ------------- --------------------- --------------------- ------------ -------------
rlog<-glm(População ~ ., data = Censo_Séries_históricas)
summary(rlog)#install.packages("effects")
library(effects)
plot(allEffects(rlog))library(dplyr)
library(ggplot2)
Censo_Séries_históricas %>%
filter(Localidade %in% "Belford Roxo") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População) +
geom_line(colour = "#112446") +
labs(title = "Belford Roxo") +
theme_minimal() +
theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "Volta Redonda") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "Volta Redonda") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "São João de Meriti") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "São João de Meriti") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "São Gonçalo") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "São Gonçalo") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "Rio de Janeiro") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "Rio de Janeiro") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "Duque de Caxias") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "Duque de Caxias") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "Campos dos Goytacazes") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "Campos dos Goytacazes") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "Niterói") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "Niterói") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))Censo_Séries_históricas %>%
filter(Localidade %in% "Petrópolis") %>%
filter(!is.na(População)) %>%
filter(!is.na(Faixa_População)) %>%
ggplot() +
aes(x = Ano, y = População, fill = Localidade) +
geom_line(colour = "#112446") +
scale_fill_hue(direction = 1) +
labs(title = "Petrópolis") +
theme_minimal() +
theme(plot.title = element_text(size = 14L,
face = "bold", hjust = 0.5))