População RJ

library(readxl)
Censo_Séries_históricas <- read_excel("C:/Users/User/Downloads/Censo-Séries-históricas.xlsx", 
    col_types = c("text", "numeric", "numeric"))
#View(Censo_Séries_históricas)
Censo_Séries_históricas$Faixa_População<-cut(Censo_Séries_históricas$População, c(0, 130000, 3300000, 6700000))
Censo_Séries_históricas$Faixa_População
levels(Censo_Séries_históricas$Faixa_População)<-c("Até 130 mil", "De 130 mil a 3,3 bi", "De 3,30 bi a 6,7 bi")
library(dplyr)
library(ggplot2)

Censo_Séries_históricas %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Localidade, fill = Faixa_População) +
 geom_bar(position = "fill") +
 scale_fill_manual(values = c(`Até 130 mil` = "#6093B1", `De 130 mil a 3,3 bi` = "#003755", `De 3,30 bi a 6,7 bi` = "#00202D"
 )) +
 labs(y = "Frequência absoluta", title = "População por Localidade") +
 theme_minimal()

shapiro.test(Censo_Séries_históricas$População)
# Não há normalidade
kruskal.test(População~Localidade, data = Censo_Séries_históricas)

    Kruskal-Wallis rank sum test

data:  População by Localidade
Kruskal-Wallis chi-squared = 58.285, df = 9, p-value = 2.866e-09
library(DescTools)
DunnettTest(População~Localidade, data = Censo_Séries_históricas)

  Dunnett's test for comparing several treatments with a control :  
    95% family-wise confidence level

$`Belford Roxo`
                                          diff     lwr.ci    upr.ci   pval    
Campos dos Goytacazes-Belford Roxo  -42160.600 -488514.01  404192.8 1.0000    
Duque de Caxias-Belford Roxo        264763.257 -181590.15  711116.7 0.4460    
Niterói-Belford Roxo                 -1337.886 -447691.30  445015.5 1.0000    
Nova Iguaçu-Belford Roxo            413028.971  -33324.44  859382.4 0.0805 .  
Petrópolis-Belford Roxo            -175762.457 -622115.87  270591.0 0.8301    
Rio de Janeiro-Belford Roxo        5231818.543 4785465.13 5678172.0 <2e-16 ***
São Gonçalo-Belford Roxo            362284.971  -84068.44  808638.4 0.1566    
São João de Meriti-Belford Roxo     -31548.886 -477902.30  414804.5 1.0000    
Volta Redonda-Belford Roxo         -222207.029 -668560.44  224146.4 0.6301    

---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Os municípios com valores de população mais distantes entre si são Rio de Janeiro e Belford Roxo, com diferença de cerca de 5,2 milhões pessoas.

chisq.test(Censo_Séries_históricas$Localidade, Censo_Séries_históricas$Faixa_População)

    Pearson's Chi-squared test

data:  Censo_Séries_históricas$Localidade and Censo_Séries_históricas$Faixa_População
X-squared = 76.743, df = 18, p-value = 3.163e-09
# Já que o valor-p é menor que 0,001, existe associação entre Localidade e População.
library(summarytools)
ctable(Censo_Séries_históricas$Localidade, Censo_Séries_históricas$Faixa_População)
Error : Can't find Censo_S
Error : Can't find Censo_S
Cross-Tabulation, Row Proportions  
Censo_Séries_históricas$Localidade * Censo_Séries_históricas$Faixa_População  

------------------------------------ ----------------------------------------- ------------- --------------------- --------------------- ------------ -------------
                                       Censo_Séries_históricas$Faixa_População   Até 130 mil   De 130 mil a 3,3 bi   De 3,30 bi a 6,7 bi         <NA>         Total
  Censo_Séries_históricas$Localidade                                                                                                                               
                        Belford Roxo                                               0 ( 0.0%)             5 (62.5%)             0 ( 0.0%)    3 (37.5%)    8 (100.0%)
               Campos dos Goytacazes                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                     Duque de Caxias                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                             Niterói                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                         Nova Iguaçu                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                          Petrópolis                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                      Rio de Janeiro                                               0 ( 0.0%)             0 ( 0.0%)             7 (87.5%)    1 (12.5%)    8 (100.0%)
                         São Gonçalo                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                  São João de Meriti                                               0 ( 0.0%)             7 (87.5%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                       Volta Redonda                                               1 (12.5%)             6 (75.0%)             0 ( 0.0%)    1 (12.5%)    8 (100.0%)
                               Total                                               1 ( 1.2%)            60 (75.0%)             7 ( 8.8%)   12 (15.0%)   80 (100.0%)
------------------------------------ ----------------------------------------- ------------- --------------------- --------------------- ------------ -------------
rlog<-glm(População ~ ., data = Censo_Séries_históricas)
summary(rlog)
#install.packages("effects")
library(effects)
plot(allEffects(rlog))

library(dplyr)
library(ggplot2)

Censo_Séries_históricas %>%
 filter(Localidade %in% "Belford Roxo") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População) +
 geom_line(colour = "#112446") +
 labs(title = "Belford Roxo") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "Volta Redonda") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "Volta Redonda") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "São João de Meriti") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "São João de Meriti") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "São Gonçalo") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "São Gonçalo") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "Rio de Janeiro") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "Rio de Janeiro") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "Duque de Caxias") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "Duque de Caxias") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "Campos dos Goytacazes") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "Campos dos Goytacazes") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "Niterói") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "Niterói") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))

Censo_Séries_históricas %>%
 filter(Localidade %in% "Petrópolis") %>%
 filter(!is.na(População)) %>%
 filter(!is.na(Faixa_População)) %>%
 ggplot() +
 aes(x = Ano, y = População, fill = Localidade) +
 geom_line(colour = "#112446") +
 scale_fill_hue(direction = 1) +
 labs(title = "Petrópolis") +
 theme_minimal() +
 theme(plot.title = element_text(size = 14L, 
 face = "bold", hjust = 0.5))