library(tidyverse)
library(here)
theme_set(theme_bw())
# SEMPRE read_csv NUNCA read.csv
clima_tudo = read_csv(
here("data/tempo-jp-cg-pt.csv"),
col_types = cols(
.default = col_double(),
cidade = col_character(),
semana = col_date(format = ""),
ano = col_integer(),
mes = col_integer()
)
)
## ============================== QUESTÕES ESCOLHIDAS: 2, 3.
Nesta análise vamos explorar dados de clima das cidades paraíbanas Campina Grande, João Pessoa, e Patos. A primeira coisa que vamos observar vai ser a temperatura média nessas cidades nos meses de Janeiro e Fevereiro, que são os picos do verão. A hipótese inicial é que a cidade de Patos tenha o verão mais intenso, pois é uma cidade do interior nordestino; em seguida seria João Pessoa, e por fim Campina Grande que fica na Serra da Borborema e, pela altitude, provavelmente será a que tem o verão mais suave em comparação às outras.
Mas antes de tentar verificar a hipótese, vamos checar como estão os dados que vamos utilizar agora, cidade, e temperatura média. Vamos remover possíveis dados faltantes, e filtrar os dados para exibir apenas os dos últimos anos, de 2016 a 2020. 2021 tem muitos dados faltantes para Patos, o que impacta negativamente na nossa comparação para esse ano, e por isso, ele foi excluído.
clima_tudo %>%
filter(ano > 2015, ano < 2021) %>%
count(is.na(temp_media), is.na(cidade))
## # A tibble: 2 x 3
## `is.na(temp_media)` `is.na(cidade)` n
## <lgl> <lgl> <int>
## 1 FALSE FALSE 739
## 2 TRUE FALSE 44
44 semanas têm temperatura média faltando, e todas as observações possuem um valor para cidade.
clima_fev_jan = clima_tudo %>%
filter(mes < 3, mes > 0, !is.na(temp_media), ano > 2015, ano < 2021)
clima_fev_jan %>%
ggplot(mapping = aes(x = temp_media, y = cidade)) +
geom_point() +
labs(
x = "Temperatura Média (C)",
y = "Cidade"
) +
ggtitle("Temperatura Média das Semanas de Janeiro a Fevereiro (2016-2021)")
Notamos pelo gráfico acima, que a amplitude da temperatura de Patos e Campina Grande é maior que a de João Pessoa. A variação da temperatura média no verão de João Pessoa é menor que o observado para as outras duas cidades nesse período. Porém para ter uma melhor noção de onde o verão é mais severo, temos que usar uma visualização melhor que a do gráfico acima, já que não conseguimos ver de forma clara a distribuição dos pontos. Mas antes, vamos visualizar a temperatura média das semanas de Janeiro e Fevereiro ao longo do tempo.
clima_fev_jan %>%
ggplot(mapping = aes(x = temp_media, y = semana, color = cidade)) +
geom_point()
Aqui podemos ver claramente que no geral, os verões em Campina Grande de fato são mais amenos que Patos e João Pessoa, e Patos parece ser a cidade mais quente no verão.
clima_fev_jan %>%
ggplot(mapping = aes(x = temp_media, color = cidade, fill = cidade)) +
facet_wrap(~ ano, ncol = 1) +
geom_density()
É interessante perceber que a concentração das temperaturas médias em Campina Grande parece andar à direita no gráfico ano após ano, o verão está cada vez mais intenso por lá, porém ainda mais frio que nas outras. Patos parece de fato ser mais quente que João Pessoa, apenas no ano de 2020 essas cidades tiveram um verão quase igual, mas nos anos anteriores, Patos parece ser a campãe do calor, confirmando assim nossa hipótese.
Agora vamos observar como a umidade se comporta ao longo do ano de 2019 nessas cidades. A hipótese dessa vez é que João Pessoa seja a cidade de maior umidade ao longo do ano, pois é uma cidade de praia, em seguida Campina Grande, e por fim Patos, já que patos é mais quente, e de interior, não tendo muitos dias de chuva.
Em 2019, todas as observações possuem valor para a variável umidade.
clima2019 = clima_tudo %>%
filter(ano == 2019)
clima2019 %>%
count(is.na(umidade))
## # A tibble: 1 x 2
## `is.na(umidade)` n
## <lgl> <int>
## 1 FALSE 156
clima2019 %>%
ggplot(mapping = aes(x = semana, y = umidade, color = cidade)) +
geom_point() +
labs(
title = "Umidade por Cidade ao Longo do Ano de 2019"
)
Patos de fato é a cidade mais seca, em especial no verão, o que faz bastante sentido já que lá chove muito pouco no verão. Campina Grande e João Pessoa parecem ser bem similares nesse aspecto, só em ~dezembro João Pessoa parece apresentar maior umidade em relação à Campina Grande.
clima2019 %>%
ggplot(mapping = aes(x = umidade, color = cidade, fill = cidade)) +
facet_wrap(~ cidade, ncol = 1) +
geom_histogram(binwidth = 5)
A distribuição dos valores de umidade em João Pessoa são bem concentrados entre ~68 e ~82%. Em Patos e Campina Grande os valores estão mais dispersos. É possível notar também, que de fato Patos tem uma frequência maior de valores baixos de umidade em comparação as outras cidades, e raramente a umidade é maior que 70%.
clima2019 %>%
ggplot(mapping = aes(x = umidade, color = cidade, fill = cidade)) +
facet_wrap(~ cidade, ncol = 1) +
geom_density()
Nesse gráfico de densidade, porém, fica mais claro que no ano de 2019, Campina Grande parece ter sido levemente mais úmida que João Pessoa, o que invalida nossa hipótese. Para o ano analisado, Campina Grande foi a cidade mais úmida, seguida por João Pessoa, e por último Patos.