library(tidyverse)
library(here)
library(knitr) # For knitting document and include_graphics function
library(ggplot2) # For plotting
library(png) # For grabbing the dimensions of png files
theme_set(theme_bw())
Esta analise implica na resposta de algumas perguntas acerca do clima em algumas cidades da paraíba.
A análise tem como foco compreender e responder as seguintes perguntas:
# SEMPRE read_csv NUNCA read.csv
clima_tudo = read_csv(
here("data/tempo-jp-cg-pt.csv"),
col_types = cols(
.default = col_double(),
cidade = col_character(),
semana = col_date(format = ""),
ano = col_integer(),
mes = col_integer()
)
)
glimpse(clima_tudo)
## Rows: 1,803
## Columns: 11
## $ cidade <chr> "Campina Grande", "Campina Grande", "Campina Grande", "Cam…
## $ semana <date> 2009-12-27, 2010-01-03, 2010-01-10, 2010-01-17, 2010-01-2…
## $ temp_max <dbl> 29.9, 31.4, 32.1, 31.0, 31.2, 32.1, 32.2, 31.3, 32.9, 34.1…
## $ temp_media <dbl> 25.90000, 25.53333, 25.60952, 24.20952, 26.06190, 26.02381…
## $ temp_min <dbl> 21.9, 21.2, 21.3, 20.5, 21.2, 21.4, 20.4, 21.5, 22.1, 22.0…
## $ vento_medio <dbl> 3.960000, 4.080952, 3.952381, 2.860000, 3.690476, 3.971429…
## $ vento_max <dbl> 5.0, 5.3, 6.6, 5.0, 5.5, 6.5, 6.3, 5.5, 5.5, 4.0, 5.0, 7.8…
## $ umidade <dbl> 76.00000, 76.23810, 75.95238, 85.33333, 77.80952, 76.04762…
## $ chuva <dbl> 0.0, 4.7, 0.2, 69.3, 3.8, 1.2, 10.9, 2.5, 0.0, 0.0, 0.0, 0…
## $ ano <int> 2009, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010, 2010…
## $ mes <int> 12, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, …
Para essas analises usaremos dados obtidos do BDMEP. A partir disso, extraimos os dados das 3 cidades durante o periodo de 2010 até atualidade.
Alguns dados extraídos que iremos referenciar durante a análise são:
Cidade: cidade da medição feita.
Semana: O primeiro dia da semana à qual a medição se refere.
Temperatura Média: A média das temperaturas médias diárias da semana, em Celsius.
Umidade: Média da umidade diária na semana, em %.
No intuito de fazer um estudo sobre o clima paraibano, selecionamos dados de 3 cidades paraibanas:
Inicialmete, queremos entender como funciona a umidade das 3 cidades e como ela varia durante o ano? para isso faremos uma analise dos dados extraidos da BDMEP e tentaremos compreender esses aspectos.
clima_tudo %>%
filter(cidade == "Campina Grande", ano > 2009, ano < 2021) %>%
ggplot(aes(x = mes, y = umidade)) +
facet_wrap(~ ano)+
geom_point(color = "coral") +
labs(title = "Umidade Média mensal durante os anos de 2010-2020 em Campina Grande")
## Warning: Removed 3 rows containing missing values (geom_point).
Ao observamos os graficos feitos detectamos que na maioria do tempo os picos de umidade são nos meses de junho e julho, o que se dá de encontro com a chegada do inverno. Durante esses meses, em geral, a umidade ultrapassa os 90%
clima_tudo %>%
filter(cidade == "Patos", ano > 2009, ano < 2021) %>%
ggplot(aes(x = mes, y = umidade)) +
facet_wrap(~ ano)+
geom_point(color = "blue") +
labs(title = "Umidade Média mensal durante os anos de 2010-2020 em Patos")
## Warning: Removed 41 rows containing missing values (geom_point).
Diferente de Campina Grande, a umidade de Patos tem seus picos no começo do ano, variando, no geral, no intervalo de janeiro até abril. Seus picos ultrapassam o valor de 80%, mas não ultrapassa a umidade Campinense que chega aos 90%.
clima_tudo %>%
filter(cidade == "João Pessoa", ano > 2009, ano < 2021) %>%
ggplot(aes(x = mes, y = umidade)) +
facet_wrap(~ ano)+
geom_point(color="green") +
labs(title = "Umidade Média mensal durante os anos de 2010-2020 em João Pessoa")
Similar a Campina Grande, João pessoa tem seus picos de umidade nos meses de Junho e Julho, onde também alcança seus 90% de umidade, porém sua umidade minima durante os anos analisados decaiu até 65% enquanto Campina Grande se chegou aos 60%. Isso pode se dar ao fato de que João Pessoa é uma cidade litorânea.
clima = clima_tudo %>%
filter(ano == 2011)
clima_tudo %>%
filter(ano > 2009, ano < 2021) %>%
ggplot(aes(x=mes, y=umidade, color=cidade)) +
facet_wrap(~ ano)+
geom_point() +
labs(title = "Umidade Média mensal durante os anos de 2010-2020")
## Warning: Removed 44 rows containing missing values (geom_point).
Ao analisarmos esse grafico podemos concluir que:
Focando agora apenas no segundo ponto abordado, sabendo que esse periodo de Junho e Julho é um momento especial para as cidades da Paraiba, pois nesse tempo é comemorado o São João, vamos nos desprender de uma analise Geral e focar uma analise nesse bloco.
Com uma analise geral da umidade das 3 cidades, vimos que os picos de umidade de João pessoa e Campina grande estão presentes nos meses de junho e julho, e como esses meses coincidem com o São João, A partir dai ficamos com um questionamento sobre como é o clima dessas 3 cidades durante o periodo de São João? com isso vamos nos aprofundar em analisar os dados desses meses em outro aspecto climatico, a temperatura.
Para iniciarmos essa analise, vamos começar com uma comparação da temperatura no mês de junho entre as 3 cidades:
clima_tudo %>%
filter(mes == 6) %>%
ggplot(aes(x=ano, y=temp_media, color=cidade)) +
geom_point() +
labs(title = "Temperatura Média no mês de junho durante os anos de 2010-2020")
## Warning: Removed 8 rows containing missing values (geom_point).
Ao analisar o grafico, percebemos que ,na maioria dos anos, no mês de junho Campina Grande mantém a menor temperatura entre as 3 cidades da analise. Enquanto Patos e João Pessoa variam sua temperatura ano a ano entre as mais quentes do periodo.
Agora vamos fazer uma comparação com o mês de julho:
clima_tudo %>%
filter(mes == 7) %>%
ggplot(aes(x=ano, y=temp_media, color=cidade)) +
geom_point() +
labs(title = "Temperatura Média no mês de julho durante os anos de 2010-2020")
## Warning: Removed 4 rows containing missing values (geom_point).
Com a visualização do grafico de julho, observamos que Campina ainda possui a menor temperatura, Porém, Patos se destaca com uma temperatura maior que as outras cidades, diferindo do mês de junho no qual Patos possuia uma liderança alternada com João Pessoa.
clima_tudo %>%
filter(mes > 5, mes < 8) %>%
ggplot(mapping = aes(y = cidade, x = temp_media)) +
# geom_point(alpha = 0.3) +
geom_jitter(height = .1, alpha = .6, color = "blue") +
labs(
title = "Temperatura Média Semanal nos meses de junho e julho",
y = "",
x = "Temperatura Média Semanal (C)"
)
## Warning: Removed 12 rows containing missing values (geom_point).
A partir desses dados, podemos tirar algumas conclusões:
Por fim, com a analise da temperatura e da umidade das 3 cidades, conseguimos diferi-las para que cada pessoa consiga aproveitar o São João com o seu clima ideal:
José Amândio.