title: “Relatório Estatística 2020.1- Dados sobre a Covid19 no estado de São Paulo” author: “Beatriz Torres e Victor Hugo” date: “18/01/2021” output: html_document: theme: journa toc: true toc_float: true code_folding: hide —

Introdução

O governador do estado de São Paulo, João Dória, tem ganhado destaque no cenário pandêmico da Covid-19, em razão de seus constantes atritos com o presidente da república, Jair Bolsonaro, tendo em vista as posições divergentes sobre lidar com o problema da Covid-19. No início da pandemia, durante uma reunião por videoconferência sobre a pandemia, entre presidente e governadores, Bolsonaro e Dória promoveram uma cena, na qual o tom da discussão tendia mais para desavenças políticas do que ideias sobre como frear o vírus. Esse não foi um caso isolado, pois de lá para cá, foram inúmeras as vezes em que ambos trocaram acusações e ofensas em tom pessoal. Mais recentemente, houve a desavença entre eles, que acabou com a vacina Coronavac no plano de imunização nacional. Dória firmou acordo com o laboratório chinês Sinovac Biotech para produzir a vacina contra o coronavírus, em São Paulo. Inicialmente, Bolsonaro se mostrou contrário à vacina, mas seu governo acabou por incluí-la num plano nacional. Bolsonaro tem intenção de concorrer a um segundo mandato como presidente e Dória também almeja o cargo, o que tem provocado a intensa disputa por atenção e méritos, nesse cenário de pandemia. Além dessa disputa política e do fato da iniciativa da única vacina adquirida pelo país ter sido resultado dos esforços de Dória, o estado de São Paulo, atualmente, é o estado com a maior concentração de contaminados (1.658.636) e de mortes pelo vírus (50.652). (Congresso em foco, 2021). Em razão desses pontos que colocam São Paulo em destaque no país e no mundo, o presente trabalho pretende analisar e destacar pontos divergentes e em comum entre os municípios mais afetados pelo vírus e os municípios menos afetados, a fim de observar se houve algum padrão ou relação entre as políticas adotadas e os números de infectados e óbitos, utilizando para isso, recursos estatísticos (como tabelas e gráficos), não estatísticos (como notícias sobre o tema em questão) e como principais variáveis: “Cidade” (uma variável qualitativa nominal) e “Pop_estimada” (uma variável quantitativa discreta).

Objetivo e Hipótese

Analisar dados estatísticos e não estatísticos para verificar se há alguma influência da postura política de Bolsonaro e Dória nas políticas de combate à pandemia adotadas nas cidades do estado de São Paulo, e, consequentemente, nos índices de contaminação e morte.

Metodologia

A metodologia a ser adotada será estatística e documental, sendo analisadas as variáveis das bases de dados Covid 19 e Isolamento, bem como sites e notícias sobre o tema. Tendo em vista o alto número de municípios, optou-se por extrair duas bases de dados menores, das bases mencionadas. Usando como referência a variável “Confirmados por 100 mil habitantes”, formou-se duas bases de dados da base Covid19, das quais foram selecionadas as cidades com os 30 menores números e as cidades com os 30 maiores números. Da base Isolamento, a referência foi a variável “Índice de isolamento”. Como a variável possui observações com informações diárias de março a dezembro, também selecionou-se duas datas específicas para formar as bases mais enxutas: uma do mês de março e outra do mês de dezembro. As bases da Covid19 possuem 30 observações e 8 variáveis, enquanto as de Isolamento possuem 105 observações e 6 variáveis. Para a análise estatística, usar-se-á as variáveis “Cidade” e “Pop estimada”, da base Covid19, como principais e as variáveis “Confirmados”, “Mortes”, “Índice de mortalidade” como secundárias, cruzando-as com as primárias. Da base Isolamento, usar-se-á apenas a variável “Índice de isolamento’’. A análise documental será realizada a partir de sites oficiais e notícias on-line da imprensa, a fim de complementar informações e interpretações que não estão explícitas na estatística.

library(readr)
covid19 <- read_csv("covid19.csv")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   date = col_date(format = ""),
##   state = col_character(),
##   city = col_character(),
##   place_type = col_character(),
##   confirmed = col_double(),
##   deaths = col_double(),
##   is_last = col_logical(),
##   estimated_population = col_double(),
##   city_ibge_code = col_double(),
##   confirmed_per_100k_inhabitants = col_double(),
##   death_rate = col_double()
## )
covid19$date <- NULL
head(covid19)
## # A tibble: 6 x 10
##   state city  place_type confirmed deaths is_last estimated_popul…
##   <chr> <chr> <chr>          <dbl>  <dbl> <lgl>              <dbl>
## 1 SP    Adam… city             589     16 TRUE               35111
## 2 SP    Adol… city             141      5 TRUE                3554
## 3 SP    Aguaí city             502     10 TRUE               36648
## 4 SP    Água… city              86      5 TRUE                8221
## 5 SP    Água… city             277      8 TRUE               18808
## 6 SP    Água… city              44      1 TRUE                6109
## # … with 3 more variables: city_ibge_code <dbl>,
## #   confirmed_per_100k_inhabitants <dbl>, death_rate <dbl>
covid19$place_type <- NULL
head(covid19)
## # A tibble: 6 x 9
##   state city  confirmed deaths is_last estimated_popul… city_ibge_code
##   <chr> <chr>     <dbl>  <dbl> <lgl>              <dbl>          <dbl>
## 1 SP    Adam…       589     16 TRUE               35111        3500105
## 2 SP    Adol…       141      5 TRUE                3554        3500204
## 3 SP    Aguaí       502     10 TRUE               36648        3500303
## 4 SP    Água…        86      5 TRUE                8221        3500402
## 5 SP    Água…       277      8 TRUE               18808        3500501
## 6 SP    Água…        44      1 TRUE                6109        3500550
## # … with 2 more variables: confirmed_per_100k_inhabitants <dbl>,
## #   death_rate <dbl>
covid19$is_last <- NULL
head(covid19)
## # A tibble: 6 x 8
##   state city  confirmed deaths estimated_popul… city_ibge_code confirmed_per_1…
##   <chr> <chr>     <dbl>  <dbl>            <dbl>          <dbl>            <dbl>
## 1 SP    Adam…       589     16            35111        3500105            1678.
## 2 SP    Adol…       141      5             3554        3500204            3967.
## 3 SP    Aguaí       502     10            36648        3500303            1370.
## 4 SP    Água…        86      5             8221        3500402            1046.
## 5 SP    Água…       277      8            18808        3500501            1473.
## 6 SP    Água…        44      1             6109        3500550             720.
## # … with 1 more variable: death_rate <dbl>
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
covid19 <-covid19 %>% rename(Estado = state)
covid19 <-covid19 %>% rename(Cidade = city)
covid19 <-covid19 %>% rename(Confirmados = confirmed)
covid19 <-covid19 %>% rename(Mortes = deaths)
covid19 <-covid19 %>% rename(Pop_estimada = estimated_population)
covid19 <-covid19 %>% rename(Cod_IBGE_Cidd = city_ibge_code)
covid19 <-covid19 %>% rename(Conf_por_100_hab = confirmed_per_100k_inhabitants)
covid19 <-covid19 %>% rename(Índice_mortal = death_rate)
covid19 <- na.omit(covid19)
covid_31_menor <- covid19[covid19$Conf_por_100_hab < 850.4747, ]
covid_31_maior <- covid19[covid19$Conf_por_100_hab > 5348.333, ]
covid_31_menor <- slice(covid_31_menor, c(-31))
covid_31_maior <- slice(covid_31_maior, c(-31))
covid_31_menor <- na.omit(covid_31_menor)
covid_31_maior <- na.omit(covid_31_maior)
library(DT)
datatable((covid19), class = 'cell-border stripe', caption = 'Tabela1- Dados da Covid 19')
datatable((covid_31_menor), class = 'cell-border stripe', caption = 'Tabela2- 30 cidades com menor número de casos por 100 habitantes')
datatable((covid_31_maior), class = 'cell-border stripe', caption = 'Tabela3- 30 cidades com maior número de casos por 100 habitantes')
isolamento <- read.csv2("/cloud/project/isolamento.csv", header=FALSE, comment.char="#")

isolamento <-isolamento %>% rename(Municipio = V1)
isolamento <-isolamento %>% rename(Cod_IBGE = V2)
isolamento <-isolamento %>% rename(Pop_estim = V3)
isolamento <-isolamento %>% rename(UF = V4)
isolamento <-isolamento %>% rename(Data = V5)
isolamento <-isolamento %>% rename(Med_Ind_Isolam = V6)

  
isolamento <- slice(isolamento, c(-1))

isolamento_22_03 <- isolamento %>% filter(Data=="domingo, 22/03")
isolamento_20_12 <- isolamento %>% filter(Data=="domingo, 20/12")
library(DT)
datatable((isolamento), class = 'cell-border stripe', caption = 'Tabela4- Índice de isolamento de março a dezembro')
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
datatable((isolamento_22_03), class = 'cell-border stripe', caption = 'Tabela5- Índice de isolamento de 22/03')
datatable((isolamento_20_12), class = 'cell-border stripe', caption = 'Tabela6- Índice de isolamento de 20/12')

Gráficos

Refinamento das variáveis por menores casos por 100 mil habitantes
library(ggplot2)
library(forcats)

covid_31_menor %>%
  ggplot( aes(x=Cidade, y=Pop_estimada)) +
    geom_bar(stat="identity", fill="blue", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('População estimada por cidade')

covid_31_menor %>%
  ggplot( aes(x=Cidade, y=Confirmados)) +
    geom_bar(stat="identity", fill="red", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw() + ggtitle('Casos confirmados por cidade')

covid_31_menor %>%
  ggplot( aes(x=Cidade, y=Mortes)) +
    geom_bar(stat="identity", fill="green", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('Mortes por cidade')

covid_31_menor %>%
  ggplot( aes(x=Cidade, y=Índice_mortal)) +
    geom_bar(stat="identity", fill="brown", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('Índice de mortalidade por cidade')

Nos gráficos acima, destacam-se entre os municípios com baixa população estimada, menor número de casos confirmados, mortes zero e, consequentemente, índice de mortalidade também, São João do Pau d’Alho, Óleo e Lutécia.

plot(covid_31_menor$Pop_estimada, covid_31_menor$Confirmados, 
     col = "blue",
     xlab = "Pop estimada",
     ylab = "Confirmados",
     main = "População estimada por caso confirmado", pch=10)

plot(covid_31_menor$Pop_estimada, covid_31_menor$Mortes,
     col = "red",
     xlab = "Pop estimada",
     ylab = "Mortes",
     main = "População estimada por mortes", pch=10)

plot(covid_31_menor$Pop_estimada, covid_31_menor$Índice_mortal,
     col = "purple",
     xlab = "Pop estimada",
     ylab = "Índice mortalidade",
     main = "População estimada por índice de mortalidade", pch=10)

Quando analisados os casos confirmados e as mortes por população, percebe-se a tendência dos gráficos a aumentarem, à medida que o número de população aumenta. O índice de mortalidade se concentra entre as menores população, bem como os outros dois gráficos, ainda que ocorram outliers em todos eles.

Refinamento das variáveis por maiores casos por 100 mil habitantes

covid_31_maior %>%
  ggplot( aes(x=Cidade, y=Pop_estimada)) +
    geom_bar(stat="identity", fill="blue", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('População estimada por cidade')

covid_31_maior %>%
  ggplot( aes(x=Cidade, y=Confirmados)) +
    geom_bar(stat="identity", fill="red", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('Casos confirmados por cidade')

covid_31_maior %>%
  ggplot( aes(x=Cidade, y=Mortes)) +
    geom_bar(stat="identity", fill="green", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('Mortes por cidade')

covid_31_maior %>%
  ggplot( aes(x=Cidade, y=Índice_mortal)) +
    geom_bar(stat="identity", fill="brown", alpha=.6, width=.4) +
    coord_flip() +
    xlab("Cidades") +
    theme_bw()+ ggtitle('Índice de mortalidade por cidade')

Entre os municípios com maior número de população estimada, maiores casos confirmados, maior número de mortes e alto índice de mortalidade, destacam-se São José do Rio Preto, Santos e Cubatão.

plot(covid_31_maior$Pop_estimada, covid_31_maior$Confirmados, 
     col = "blue",
     xlab = "Pop estimada",
     ylab = "Confirmados",
     main = "População estimada por casos confirmados", pch=10)

plot(covid_31_maior$Pop_estimada, covid_31_maior$Mortes,
     col = "red",
     xlab = "Pop estimada",
     ylab = "Mortes",
     main = "População estimada por mortes", pch=10)

plot(covid_31_maior$Pop_estimada, covid_31_maior$Índice_mortal,
     col = "purple",
     xlab = "Pop estimada",
     ylab = "Índice mortalidade",
     main = "População estimada por índice de mortalidade", pch=10)

Sobre o comportamento dos gráficos acima, os resultados são bem similares aos mesmos gráficos aplicados na primeira base de dados sobre a Covid19.

Índice de isolamento dos meses de março e dezembro em escala crescente
isolamento_22_03 <- with(isolamento_22_03, isolamento_22_03[order(Med_Ind_Isolam, Municipio, decreasing=FALSE), ])
head(isolamento_22_03)
##              Municipio Cod_IBGE Pop_estim UF           Data Med_Ind_Isolam
## 24           CATANDUVA  3511102    122497 SP domingo, 22/03            49%
## 74 PRESIDENTE PRUDENTE  3541406    230371 SP domingo, 22/03            49%
## 56             LIMEIRA  3526902    308482 SP domingo, 22/03            50%
## 3         ARA\xc7ATUBA  3502804    198129 SP domingo, 22/03            51%
## 4           ARARAQUARA  3503208    238339 SP domingo, 22/03            51%
## 11             BARUERI  3505708    276982 SP domingo, 22/03            51%
isolamento_20_12 <- with(isolamento_20_12, isolamento_20_12[order(Med_Ind_Isolam, Municipio, decreasing=FALSE), ])
head(isolamento_20_12)
##          Municipio Cod_IBGE Pop_estim UF           Data Med_Ind_Isolam
## 32          FRANCA  3516200    355901 SP domingo, 20/12            37%
## 52         JANDIRA  3525003    126356 SP domingo, 20/12            37%
## 54      JUNDIA\xcd  3525904    423006 SP domingo, 20/12            37%
## 38  HORTOL\xc2NDIA  3519071    234259 SP domingo, 20/12            38%
## 47 ITAQUAQUECETUBA  3523107    375011 SP domingo, 20/12            38%
## 62         MAU\xc1  3529401    477552 SP domingo, 20/12            38%

Há uma redução de 12,7% do índice de isolamento, se for extrair a diferença das médias dos 6 municípios expostos nas duas tabelas, uma do começo do ano e outra do final, que representam os municípios com menor índice de isolamento, o que pode ser consequência da flexibilização das medidas restritivas, desgaste dessas medidas ou as duas coisas, dentre outros fatores.

Índice de isolamento dos meses de março e dezembro em escala decrescente
isolamento_22_03 <- with(isolamento_22_03, isolamento_22_03[order(Med_Ind_Isolam, Municipio, decreasing=TRUE), ])
head(isolamento_22_03)
##               Municipio Cod_IBGE Pop_estim UF           Data Med_Ind_Isolam
## 91  S\xc3O SEBASTI\xc3O  3550704     90328 SP domingo, 22/03            73%
## 100             UBATUBA  3555406     91824 SP domingo, 22/03            70%
## 13            BEBEDOURO  3506102     77555 SP domingo, 22/03            67%
## 39            IBI\xdaNA  3519709     79479 SP domingo, 22/03            66%
## 58               LORENA  3527207     89125 SP domingo, 22/03            65%
## 22        CARAGUATATUBA  3510500    123389 SP domingo, 22/03            65%
isolamento_20_12 <- with(isolamento_20_12, isolamento_20_12[order(Med_Ind_Isolam, Municipio, decreasing=TRUE), ])
head(isolamento_20_12)
##                       Municipio Cod_IBGE Pop_estim UF           Data
## 91          S\xc3O SEBASTI\xc3O  3550704     90328 SP domingo, 20/12
## 13                    BEBEDOURO  3506102     77555 SP domingo, 20/12
## 86  S\xc3O JO\xc3O DA BOA VISTA  3549102     91771 SP domingo, 20/12
## 100                     UBATUBA  3555406     91824 SP domingo, 20/12
## 80       SANTANA DE PARNA\xcdBA  3547304    142301 SP domingo, 20/12
## 65                   MOGI MIRIM  3530805     93650 SP domingo, 20/12
##     Med_Ind_Isolam
## 91             55%
## 13             54%
## 86             51%
## 100            49%
## 80             49%
## 65             49%

Também houve a tendência de redução de isolamento, entre as cidades com maior índice de isolamento, havendo a diferença mé dia de 16,5% de redução.

Análise dos Dados

As cidades do primeiro grupo são de interior e sua população estimada é menor; enquanto as cidades do segundo grupo pertencem ao meio urbano e possuem população estimada maior, fatores relativamente importantes para entender o comportamento do vírus, que pode se espalhar melhor em locais com concentração e fluxo maior de gente, como são os meios urbanos. O vírus também encontra campo fértil nas divergências políticas entre autoridades. O governador de São Paulo tem adotado medidas restritivas que tentam controlar o fluxo de gente e manter a economia aberta ao mesmo tempo. Para tanto, ele estabeleceu fases da quarentena ( Fase 1-vemelha, Fase 2-laranja, Fase 3-amarela, Fase 4-verde e Fase 5-azul). Assim, talvez seja possível controlar o vírus sem precisar parar o estado. Ainda, o governo estadual se baseia nos seguintes critérios para determinar a fase: capacidade de resposta do sistema de saúde, composto pelos seguintes indicadores: taxa de ocupação de leitos hospitalares destinados ao tratamento intensivo de pacientes com COVID-19 e quantidade de leitos hospitalares destinados ao tratamento intensivo de pacientes com COVID-19 por 100 mil habitantes; Evolução da epidemia, composto por três resultados: taxa de contaminação, taxa de internação e taxa de óbitos. Contudo, nem todos os prefeitos aderem a essas medidas ou as furam, como foi o caso de algumas cidades litorâneas, nas festas de último final de ano. Uma pesquisa recente também apontou que os lugares com maior intensidade de contaminação são os que possuem maior IHD, pois as pessoas voltaram a sair e frequentar festas e bares, por exemplo. (Ferreira; Sobrinho; Brito, 2021)

Considerações Finais

Fatores como geográfico e populacional, como demonstram as estatísticas, podem apresentar influência sobre o número de contaminados e de mortes. Em se tratando de fatores implícitos, estão as divergências políticas e pouca adesão de municípios a um plano estadual. Ainda que o governo Dória esteja adotando medidas para equilibrar restrições e não fechamento total de comércios, ele não pode impor determinadas medidas a prefeitos, uma vez que os municípios têm sua autonomia. O plano de determinar níveis e estágios de isolamento pode ser razoável, mas precisa ser adotado pela maioria para surtir algum efeito.

Referências

https://congressoemfoco.uol.com.br/covid19/index.html

https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2020/12/12/governo-federal-inclui-coronavac-como-candidata-em-plano-de-imunizacao.htm

https://www.em.com.br/app/noticia/internacional/2020/06/11/interna_internacional,1155888/covid-19-brasil-fecha-parceria-para-produzir-vacina-chinesa.shtml

https://diariodotransporte.com.br/2020/08/28/doria-nao-mexe-na-classificacao-das-cidades-nas-fases-da-quarentena-pela-primeira-vez/#:~:text=CRIT%C3%89RIOS%20CALIBRADOS%3A&text=Na%20pr%C3%A1tica%2C%20vai%20ficar%20mais,Verde%20e%20Fase%205%2DAzul.

https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2021/01/14/coletiva-prefeitura-sp-coronavirus.htm

https://github.com/seade-R/dados-covid-sp

https://www.seade.gov.br/coronavirus/