As questões respondidas foram a 2 e a 3.

library(tidyverse)
library(here)
theme_set(theme_bw())
# SEMPRE read_csv NUNCA read.csv
clima_tudo = read_csv(
    here("data/tempo-jp-cg-pt.csv"),
    col_types = cols(
        .default = col_double(),
        cidade = col_character(),
        semana = col_date(format = ""),
        ano = col_integer(),
        mes = col_integer()
    )
)

# glimpse(clima_tudo)

Considerando apenas as semanas no período de Janeiro e Fevereiro (pico do verão), como foi o calor das 3 cidades nos últimos anos?

O calor será representado pelas temperaturas médias das semanas. No gráfico abaixo, temos as temperaturas médias das semanas de Janeiro e Fevereiro das 3 cidades, nos anos de 2017 a 2020.

No pico do verão, as semanas mais quentes em Campina Grande foram próximas de 27,5 ºC. Por outro lado, essa mesma temperatura é menor que as temperaturas das semanas mais frias em Patos e João Pessoa. Também é possível notar que quase todas das semanas de João Pessoa ficaram abaixo de 30 ºC, enquanto que aproximadamente metade das semanas em Patos superaram essa marca.

Outra observação é que a temperatura em João pessoa varia em uma faixa de valores bem menor que as demais cidades.

temp_recente <-
  clima_tudo %>% 
  filter(ano >= 2017, ano <= 2020) %>% 
  mutate(summer = mes < 3)

temp_recente %>% 
  filter(summer) %>%
  ggplot() +
  geom_jitter(aes(x = temp_media, y = cidade), height = 0.1, alpha = 0.3, color = "red") +
  labs(title = "Temperaturas médias dos picos de verão (2017-2020)", x = "Temperatura média (ºC)", y = "")
## Warning: Removed 1 rows containing missing values (geom_point).

Outra pergunta que podemos fazer é: quão mais quentes são os picos de verão em relação as outras semanas? A visualização a seguir acrescenta as semanas do período de Março a Dezembro dos anos analisados (2017 a 2020).

Em João Pessoa, as semanas no pico do verão estão concentradas próximas às temperaturas mais elevadas da cidade. Já em Campina Grande e Patos estão mais espalhadas. Dessa forma, é mais fácil para um morador de João Pessoa sentir que está no pico do verão do que um morador de Patos.

temp_recente %>% 
  ggplot() +
  geom_jitter(aes(x = temp_media, y = cidade, color = summer), height = 0.3, alpha = 0.3) +
  scale_color_manual(labels = c("Outras semanas", "Pico do verão"), values=c("grey85", "red")) +
  labs(title = "Temperaturas médias dos picos de verão vs restante dos meses \n(2017-2020)", x = "Temperatura média (ºC)", y = "", color = "") 
## Warning: Removed 43 rows containing missing values (geom_point).

Ainda olhando para o período de 2017 a 2020, podemos dizer que os verões ficaram mais quentes com o passar do tempo?

No gráfico abaixo, é possível notar que de 2017 para 2018 houve uma queda na temperatura nas 3 cidades.

A partir de 2018 os verões de Campina Grande ficaram mais quentes. Isso também aconteceu em João Pessoa, mas de forma mais sutil. Já em Patos a temperatura se manteve constante.

temp_recente %>%
  filter(summer) %>% 
  ggplot() +
  geom_point(aes(x = ano, y = temp_media, color = cidade), alpha = 0.5) + 
  facet_wrap(~cidade) +
  labs(title = "Temperaturas médias dos picos de verão por cidade \n(2017-2020)", x = "Ano", y = "Temperatura média (ºC)", color = "")
## Warning: Removed 1 rows containing missing values (geom_point).

Como a umidade das 3 cidades varia ao longo do ano?

Para essa análise será utilizada a umidade das semanas de cada cidade no período de 2019, já que em 2020 há muitos dados faltantes.

João Pessoa é a cidade onde a umidade menos varia ao longo do ano. A umidade da maior parte das semanas varia entre 65% e 90%. Já em Patos essa faixa é bem maior, a maior parte das semanas varia entre 40% e 75%.

No histograma, é possível notar que a umidade em Patos é mais espalhada na faixa de valores, enquanto que em João Pessoa e Campina Grande há pontos de maior concentração.

umidade_2019 <-
  clima_tudo %>%
  filter(ano == 2019)

umidade_2019 %>%
  ggplot() +
  geom_jitter(aes(y = cidade, x = umidade), height = 0.1, alpha = 0.5, color = "steelblue") +
  labs(title = "Umidades em 2019", x = "Umidade (%)", y = "")

umidade_2019 <-
  clima_tudo %>%
  filter(ano == 2019)

umidade_2019 %>% 
  ggplot(aes(x = umidade)) +
  geom_histogram(aes(fill = cidade), color = "black") +
  geom_rug() +
  facet_wrap(~cidade, dir = "v") +
  labs(title = "Histograma das umidades em 2019",x = "Umidade (%)", y = "Contagem", color = "")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.