library(tidyverse)
library(here)
theme_set(theme_bw())
# SEMPRE read_csv NUNCA read.csv
clima_tudo = read_csv(
here("data/tempo-jp-cg-pt.csv"),
col_types = cols(
.default = col_double(),
cidade = col_character(),
semana = col_date(format = ""),
ano = col_integer(),
mes = col_integer()
)
)
clima = clima_tudo %>%
filter(ano == 2019)
clima %>%
slice(1:8)
## # A tibble: 8 x 11
## cidade semana temp_max temp_media temp_min vento_medio vento_max umidade
## <chr> <date> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Campina… 2019-01-06 32.1 25.6 19.6 3.57 4.6 74.9
## 2 Campina… 2019-01-13 33.5 27.1 20 3.29 4.5 69
## 3 Campina… 2019-01-20 33.3 26.7 19.6 4.01 6.5 72.5
## 4 Campina… 2019-01-27 32.4 26.4 19.6 3.53 5 75.0
## 5 Campina… 2019-02-03 32.2 25.3 19.5 2.95 4.8 83
## 6 Campina… 2019-02-10 31.1 25.6 20.1 3.17 5 84.1
## 7 Campina… 2019-02-17 31.6 25.9 20.5 2.89 4.1 79.2
## 8 Campina… 2019-02-24 31.1 25.9 20.5 3.63 4.8 76.8
## # … with 3 more variables: chuva <dbl>, ano <int>, mes <int>
pergunta1 = clima %>%
filter(cidade == "Campina Grande") %>%
mutate(ferias = mes %in% c(12,1,2,7))
pergunta1$ferias[pergunta1$ferias == TRUE] <- "Férias"
pergunta1$ferias[pergunta1$ferias == FALSE] <- "Aulas"
pergunta1 %>%
ggplot(aes(x = temp_media, y = "")) +
geom_jitter(height = .2,alpha=.5, color="tomato")+
facet_wrap(~ ferias, ncol = 1) +
stat_summary(aes(shape="Media"), geom="point", fun=mean, size=2.5)+
stat_summary(aes(shape="Mediana"), geom = "point", fun=median, size=2.5)+
ggtitle("Relação da Temperatura Média Semanal (°C) durante os periodos
de ferias e de aula") +
theme(legend.position="top") +
theme(legend.title = element_blank()) +
theme(plot.title = element_blank()) +
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "",
x = "Temperatura Média Semanal (C)"
)
Diante do grafico acima é visto que em Campina Grande, a media da temperatura nas ferias é maior do que no periodo de aulas. Sua mediana se comporta da mesma maneira. Porem, existem pontos extremos a esqueda, que significam valores mais baixos que acaba fazendo com que a media de valores de temperatua seja diminuida.
pergunta1 %>%
ggplot(aes(x = chuva, y = "")) +
geom_jitter(height = .2,alpha=.5, color="tomato")+
facet_wrap(~ ferias, ncol = 1) +
stat_summary(aes(shape="Media"), geom="point", fun=mean, size=2.5)+
stat_summary(aes(shape="Mediana"), geom = "point", fun=median, size=2.5)+
ggtitle("Relação entre Quantidade de chuvas durante os periodos de ferias e aula") +
theme(legend.position="top") +
theme(legend.title = element_blank()) +
theme(plot.title = element_blank()) +
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "",
x = "Quantidade de chuvas em mm"
)
Ao analisarmos o grafico acima, é visto que existe uma assimetria com uma cauda a direita, principalmente no periodo de férias, onde se observa que os valores mais altos para chuva estão muito distantes da media e da mediana. Podemos ver uq e media ficou maior no periodo de ferias por causa dos pontos extremos a direita da media alavancando seu resultado.
Pelos valores vistos, é possivel afimar que durante as ferias, a media da temperatura é maior, mesmo com semanas onde a temperatura foram bem abaixo do esperado para a epoca das ferias. A quantidade de chuvas nesses periodos também se comportam de maneira semelhante, se observarmos a mediana dos valores. Durante as ferias, existe mais semanas onde se chove pouco ou não chove (mediana mais proxima de 0) indicando tempos mais quentes e abafados. Concluimos que o periodo de melhor clima é durantes as aulas.
clima %>%
mutate(choveu = chuva == 0) %>%
ggplot(aes(x=semana, y = chuva, color = !choveu)) +
facet_wrap(~cidade, ncol = 1) +
geom_point(show.legend = FALSE)+
ggtitle("Distribuição de chuvas nas 3 cidades ao longo do ano de 2019") +
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "Quantidade de chuvas em mm",
x = ""
)
Em vermelho são as semanas que não choveu, enquanto em azul foram as semanas que choveu
Agora veremos a distribuição de chuvas nas cidades desconsiderando as semanas.
clima %>%
ggplot(aes(x = chuva, y = "")) +
geom_jitter(height = .2,alpha=.5, color="tomato")+
facet_wrap(~ cidade, ncol = 1) +
stat_summary(aes(shape="Media"), geom="point", fun=mean, size=2.5)+
stat_summary(aes(shape="Mediana"), geom = "point", fun=median, size=2.5)+
ggtitle("Distribuição de chuvas nas 3 cidades ao longo do ano de 2019") +
theme(legend.position="top") +
theme(legend.title = element_blank()) +
theme(plot.title = element_blank()) +
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "",
x = "Chuva em mm"
)
Vemos que ha uma boa concentração das chuvas em valores menores de 100 mm, com isso vejamos num histograma seu comportamento.
clima %>%
ggplot(aes(x = chuva)) +
facet_wrap(~ cidade, ncol=1)+
geom_histogram(binwidth=20, fill="coral", color="black")+
geom_rug()+
ggtitle("Histograma das chuvas nas 3 cidades ao longo do ano de 2019") +
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "",
x = "Chuva em mm"
)
É possivel observar que em todos as cidades existe uma maior contentração de chuvas tendo pouca ou nenhuma incidencia de chuvas, principalmente em Patos, o que não é observado em João pessoa, na qual existe uma variação nas intensidades até 100 mm e com alguns casos extremos acima de 100 mm. Campina grande está no meio termo: não possui muita concentração nos valores perto de 0 ,como Patos, e sua variação até 100 mm é menor que João pessoa, não ocorrendo pontos extremos. Podemos observar que ao longo do ano:
retiramos dados com valores faltantes
clima_tudo %>%
filter(is.na(temp_media)) %>%
filter(ano >= 2015, ano <= 2019)
## # A tibble: 3 x 11
## cidade semana temp_max temp_media temp_min vento_medio vento_max umidade
## <chr> <date> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Campina… 2016-12-25 NA NA NA NA NA NA
## 2 Campina… 2017-01-01 NA NA NA NA NA NA
## 3 Campina… 2017-12-24 NA NA NA NA NA NA
## # … with 3 more variables: chuva <dbl>, ano <int>, mes <int>
pergunta3 = clima_tudo %>%
filter(ano >= 2015, ano <= 2019, !is.na(temp_media)) %>%
mutate(ferias = mes %in% c(12,1,2,7))
pergunta3 %>%
filter(ferias == TRUE) %>%
ggplot(aes(x=umidade, y = temp_media, color = cidade))+
facet_grid(~ ano) +
geom_point() +
ggtitle("Relação da umidade (em mm) e temperatura média\n(em ºC) nos anos de 2015 a 2019 no périodo de férias") +
theme(legend.title = element_blank())+
theme(legend.position="top")+
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "Umidade de chuva (mm)",
x = "Temperatura media (°C)"
)
pergunta3 %>%
filter(ferias == FALSE) %>%
ggplot(aes(x=umidade, y = temp_media, color = cidade))+
facet_grid(~ ano) +
geom_point() +
ggtitle("Relação da umidade (em mm) e temperatura média\n(em ºC) nos anos de 2015 a 2019 no périodo de aulas") +
theme(legend.title = element_blank())+
theme(legend.position="top")+
theme(plot.title = element_text(hjust = 0.5))+
labs(
y = "Umidade de chuva (mm)",
x = "Temperatura media (°C)"
)
Podemos ver uma possivel relação existente entre umidade e temperatura media , onde para valores maiores de temperatura, a umidade é menor. Nos anos analisados, podemos ver que tal comportamento se repete, independente da cidade em questão. Existe uma relação inversa entre temperatura media e umidade de chuva.