Saúde pública: taxa de natalidade e mortalidade nas regiões brasileiras

Author

Yngrid Antunes e Marcelo Souto

RESUMO

Neste presente trabalho, objetivou-se analisar as diferenças da taxa de natalidade e mortalidade em cada estado brasileiro, entre o período de 2019 a 2022, buscando assim verificar o crescimento populacional. Para seu desenvolvimento foi utilizado os dados do DATASUS e para análise e organização dos dados foi empregado a ferramenta software R.

Palavras-chaves: Taxa de natalidade; taxa de mortalidade; crescimento populacional.

INTRODUÇÃO

A compreensão da taxa de natalidade e mortalidade, bem como a diferença entre ambas, é de grande importância para os aspectos econômicos, sociais e de saúde, refletindo em diversos dados econômicos. Observando isso o presente trabalho buscou analisar os Estados brasileiros que tiveram maior crescimento populacional entre o período de 2019 a 2022, fazendo uma separação quantitativa, visando contribuir para uma compreensão mais abrangente do crescimento populacional durante o período citado em todos os Estado brasileiro.

OBJETIVO

Analisar as diferentes taxas de mortalidade e natalidade dos Estados brasileiros entre o período de 2019 a 2022;

Identificar tendências de crescimentos geográficos em todos os Estados brasileiros;

Contribuir para uma compreensão da dinâmica populacional brasileira, fornecendo dados relevantes sobre o crescimento populacional para elaboração de políticas públicas.

METODOLOGIA

Este trabalho se caracteriza por ser um estudo aplicado, com pesquisa documental de dados de fontes secundárias, utilizando a plataforma de dados do DATASUS, coletando os dados sobre natalidade e mortalidade. Na coleta de dados foi priorizado os dados relativos ao período entre 2019 e 2022, garantindo, assim, uma confiabilidade e integridade das informações.

Depois de coletado os dados foram realizada uma análise de dados através do software R, onde foram utilizados análise estatísticas e descritivas dos dados obtidos, buscando identificar diferenças significativas nas taxas de mortalidade e natalidade e crescimento populacional.

Pacotes utilizados

Installing package into 'C:/Users/yngri/AppData/Local/R/win-library/4.3'
(as 'lib' is unspecified)
package 'dplyr' successfully unpacked and MD5 sums checked
Warning: cannot remove prior installation of package 'dplyr'
Warning in file.copy(savedcopy, lib, recursive = TRUE): problem copying
C:\Users\yngri\AppData\Local\R\win-library\4.3\00LOCK\dplyr\libs\x64\dplyr.dll
to C:\Users\yngri\AppData\Local\R\win-library\4.3\dplyr\libs\x64\dplyr.dll:
Permission denied
Warning: restored 'dplyr'

The downloaded binary packages are in
    C:\Users\yngri\AppData\Local\Temp\Rtmpy0DMjz\downloaded_packages
Installing package into 'C:/Users/yngri/AppData/Local/R/win-library/4.3'
(as 'lib' is unspecified)
package 'remotes' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\yngri\AppData\Local\Temp\Rtmpy0DMjz\downloaded_packages
Installing package into 'C:/Users/yngri/AppData/Local/R/win-library/4.3'
(as 'lib' is unspecified)
package 'tidyverse' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\yngri\AppData\Local\Temp\Rtmpy0DMjz\downloaded_packages
Installing package into 'C:/Users/yngri/AppData/Local/R/win-library/4.3'
(as 'lib' is unspecified)
package 'geobr' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\yngri\AppData\Local\Temp\Rtmpy0DMjz\downloaded_packages
Installing package into 'C:/Users/yngri/AppData/Local/R/win-library/4.3'
(as 'lib' is unspecified)
package 'ggplot2' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\yngri\AppData\Local\Temp\Rtmpy0DMjz\downloaded_packages
Installing package into 'C:/Users/yngri/AppData/Local/R/win-library/4.3'
(as 'lib' is unspecified)
package 'ggthemes' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\yngri\AppData\Local\Temp\Rtmpy0DMjz\downloaded_packages
Warning: package 'dplyr' was built under R version 4.3.3

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
Warning: package 'remotes' was built under R version 4.3.3
Warning: package 'tidyverse' was built under R version 4.3.3
Warning: package 'ggplot2' was built under R version 4.3.3
Warning: package 'tidyr' was built under R version 4.3.3
Warning: package 'readr' was built under R version 4.3.3
Warning: package 'forcats' was built under R version 4.3.3
Warning: package 'lubridate' was built under R version 4.3.3
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ forcats   1.0.0     ✔ readr     2.1.5
✔ ggplot2   3.5.1     ✔ stringr   1.5.0
✔ lubridate 1.9.3     ✔ tibble    3.2.1
✔ purrr     1.0.2     ✔ tidyr     1.3.1
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Warning: package 'geobr' was built under R version 4.3.3
Loading required namespace: sf
Warning: package 'sf' was built under R version 4.3.3
Linking to GEOS 3.11.2, GDAL 3.8.2, PROJ 9.3.1; sf_use_s2() is TRUE
Warning: package 'ggthemes' was built under R version 4.3.3
library(dplyr)
library(remotes)
library(tidyverse)
library(geobr)
library(ggplot2)
library(sf)

Tratamento dos dados

NV <- left_join(NV2022, NV2021, by = "região") 


NV <- left_join(NV, NV2020, by = "região")

NV <- left_join(NV, NV2019, by = "região")


MT <- left_join(MT2022, MT2021, by = "região") 


MT <- left_join(MT, MT2020, by = "região")


MT <- left_join(MT, MT2019, by = "região")


MT <- MT %>%rename("ano_2022" := "numero.x")

MT <- MT %>%rename("ano_2021" := "numero.y")

MT <- MT %>%rename("ano_2020" := "numero.x.x")

MT <- MT %>%rename("ano_2019" := "numero.y.y")


NV <- NV %>%rename("ano_2022" := "numero.x")

NV <- NV %>%rename("ano_2021" := "numero.y")

NV <- NV %>%rename("ano_2020" := "numero.x.x")

NV <- NV %>%rename("ano_2019" := "numero.y.y")

Estatisticas descritivas das variaveis

summary(NV)
    região             ano_2022          ano_2021          ano_2020      
 Length:33          Min.   :  13056   Min.   :  13863   Min.   :  13738  
 Class :character   1st Qu.:  44591   1st Qu.:  48664   1st Qu.:  47865  
 Mode  :character   Median :  95898   Median :  96248   Median :  97754  
                    Mean   : 232902   Mean   : 243373   Mean   : 248195  
                    3rd Qu.: 180278   3rd Qu.: 189821   3rd Qu.: 199066  
                    Max.   :2561922   Max.   :2677101   Max.   :2730145  
    ano_2019      
 Min.   :  14586  
 1st Qu.:  49638  
 Median :  97775  
 Mean   : 259013  
 3rd Qu.: 207964  
 Max.   :2849146  
summary(MT)
    região             ano_2022          ano_2021          ano_2020      
 Length:33          Min.   :   3246   Min.   :   4306   Min.   :   3580  
 Class :character   1st Qu.:  20434   1st Qu.:  25090   1st Qu.:  23397  
 Mode  :character   Median :  45499   Median :  52166   Median :  46444  
                    Mean   : 140388   Mean   : 166605   Mean   : 141530  
                    3rd Qu.: 104096   3rd Qu.: 121354   3rd Qu.: 107194  
                    Max.   :1544266   Max.   :1832649   Max.   :1556824  
    ano_2019      
 Min.   :   2779  
 1st Qu.:  18327  
 Median :  40599  
 Mean   : 122709  
 3rd Qu.:  89238  
 Max.   :1349801  

Graficos de barras representando o número de nascidos vivos e mortalidade para todas as regiões barsileiras

library(ggplot2)

dados_NascidosVivos <- read.csv("C:/Users/yngri/Downloads/trabalho de R/NV2019.csv")
colnames(dados_NascidosVivos)<- c("região" , "nascidos_vivos")

ggplot(dados_NascidosVivos, aes(x= região, y= nascidos_vivos , fill= região)) +
  geom_bar(stat = "identity") + 
  labs(title = "numero de nascidos vivos por região no ano de 2019", 
       x= "regiao",
       y= "nascidos vivos") +
  theme_minimal() +
  theme(axis.text.x = element_blank(),  
        axis.ticks.y = element_blank(),  
        axis.text.y = element_blank())

Apenas para as regiões Nordeste, Sudeste, Sul e Norte do país

library(ggplot2)
library(dplyr)
options(scipen = 9999)
options(scipen = 100000)

dados_mortalidade <- read.csv("C:/Users/yngri/Downloads/trabalho de R/MT2019.csv")

colnames(dados_mortalidade) <- c("região", "mortalidade")



dados_mortalidade$mortalidade <- as.numeric(as.character(dados_mortalidade$mortalidade))
Warning: NAs introduzidos por coerção
dados_regionais <- dados_mortalidade %>% 
  filter(região %in% c("Região Sudeste", "Região Nordeste", "Região Sul", "Região Norte")) %>%
  
  arrange(desc(mortalidade))


ggplot(dados_regionais, aes(x = região, y = mortalidade, fill = região)) +
  geom_bar(stat = "identity") + 
  labs(title = "Mortalidade no ano de 2019", 
       x = "Região",
       y = "Mortalidade") +
  theme_minimal()

Warning: NAs introduzidos por coerção

Warning: NAs introduzidos por coerção

Warning: NAs introduzidos por coerção

Gráficos que mostram a evolução da natalidade e mortalidade por cada região brasileira

install.packages("tidyr")
Warning: package 'tidyr' is in use and will not be installed
library(tidyr)
dados_pivotados <- NV %>% 
  pivot_longer(cols = starts_with("ano"), names_to = "ano", values_to = "nascidos_vivos")

# Converter o ano para apenas números
dados_pivotados$ano <- as.numeric(gsub("\\D", "", dados_pivotados$ano))

# Filtrar os dados apenas para a região Nordeste
dados_nordeste <- dados_pivotados %>%
  filter(região == "Região Nordeste")

# Criar o gráfico com linha ascendente ou descendente
ggplot(dados_nordeste, aes(x = ano, y = nascidos_vivos)) +
  geom_path(color = "blue") +  # Usar geom_path() ou geom_line() para a linha
  labs(title = "Tendência do número de nascidos vivos na região Nordeste",
       x = "Ano",
       y = "Número de nascidos vivos") +
  theme_minimal()

Saldo positivo entre natalidade e mortalidade

Resultados

Através do que foi analisado entre os anos de 2019 e 2022, com a base de dados no Rstudio, pôde ser diagnosticado que a região com maior diferença numérica entre os nascidos vivos e os óbitos, foi o Estado de São Paulo, tendo entre os anos de 2019 e 2022 tido uma diferença de respectivamente, (2019 – 584.621); (2020-553.437); (2021-526.339) e (2022-513.879); chegando a superar Regiões como Sul e Norte. Esse Estado foi seguido respectivamente pelos Estados do Rio de Janeiro, Bahia, Paraná, sendo essa ordem mantida em todos os anos analisados. 

O Estado de Roraima apresentou a menor diferença entre os nascidos vivos e se apresentando assim: (2019-14.586); (2020-13.738); (2021-13.863) e (2022-13.056), ficando abaixo dos Estados do Amapá, Acre e Tocantins. 

Conclusão

Baseado nos dados analisados entre os anos de 2019 e 2022, pôde-se concluir que existe uma grande disparidade entre os Estados brasileiros e que essas disparidades afetam diversas áreas, tais como econômicas e de saúde, destacando a necessidade de elaboração de políticas públicas e econômicas específicas para cada Estado brasileiro.

The echo: false option disables the printing of code (only output is displayed).