library(tidyverse)
library(here)
theme_set(theme_bw())
# SEMPRE read_csv NUNCA read.csv
clima_tudo = read_csv(
    here("data/tempo-jp-cg-pt.csv"),
    col_types = cols(
        .default = col_double(),
        cidade = col_character(),
        semana = col_date(format = ""),
        ano = col_integer(),
        mes = col_integer()
    )
)

clima = clima_tudo %>% 
    filter(ano == 2019)

clima %>% 
    slice(1:8)
## # A tibble: 8 x 11
##   cidade   semana     temp_max temp_media temp_min vento_medio vento_max umidade
##   <chr>    <date>        <dbl>      <dbl>    <dbl>       <dbl>     <dbl>   <dbl>
## 1 Campina… 2019-01-06     32.1       25.6     19.6        3.57       4.6    74.9
## 2 Campina… 2019-01-13     33.5       27.1     20          3.29       4.5    69  
## 3 Campina… 2019-01-20     33.3       26.7     19.6        4.01       6.5    72.5
## 4 Campina… 2019-01-27     32.4       26.4     19.6        3.53       5      75.0
## 5 Campina… 2019-02-03     32.2       25.3     19.5        2.95       4.8    83  
## 6 Campina… 2019-02-10     31.1       25.6     20.1        3.17       5      84.1
## 7 Campina… 2019-02-17     31.6       25.9     20.5        2.89       4.1    79.2
## 8 Campina… 2019-02-24     31.1       25.9     20.5        3.63       4.8    76.8
## # … with 3 more variables: chuva <dbl>, ano <int>, mes <int>

PERGUNTA 1: Considerando os meses de férias normais da UFCG e escolhendo uma das cidades (a mais próxima de onde você passa férias), quais as semelhanças e diferenças entre a temperatura e as chuvas nos meses de férias e nos meses de aula? Quando o clima é melhor?

pergunta1 = clima %>%
  filter(cidade == "Campina Grande") %>% 
  mutate(ferias = mes %in% c(12,1,2,7))

pergunta1$ferias[pergunta1$ferias == TRUE] <- "Férias"
pergunta1$ferias[pergunta1$ferias == FALSE] <- "Aulas"

pergunta1 %>%
  ggplot(aes(x = temp_media, y = "")) +
  geom_jitter(height = .2,alpha=.5, color="tomato")+
  facet_wrap(~ ferias, ncol = 1) +
  stat_summary(aes(shape="Media"), geom="point", fun=mean, size=2.5)+
  stat_summary(aes(shape="Mediana"), geom = "point", fun=median, size=2.5)+
  ggtitle("Relação da Temperatura Média Semanal (°C) durante os periodos 
        de ferias e de aula") +
  theme(legend.position="top") +
  theme(legend.title = element_blank()) +
  theme(plot.title = element_blank()) +
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
         y = "", 
         x = "Temperatura Média Semanal (C)"
    )

Diante do grafico acima é visto que em Campina Grande, a media da temperatura nas ferias é maior do que no periodo de aulas. Sua mediana se comporta da mesma maneira. Porem, existem pontos extremos a esqueda, que significam valores mais baixos que acaba fazendo com que a media de valores de temperatua seja diminuida.

pergunta1 %>%
  ggplot(aes(x = chuva, y = "")) +
  geom_jitter(height = .2,alpha=.5, color="tomato")+
  facet_wrap(~ ferias, ncol = 1) +
  stat_summary(aes(shape="Media"), geom="point", fun=mean, size=2.5)+
  stat_summary(aes(shape="Mediana"), geom = "point", fun=median, size=2.5)+
  ggtitle("Relação entre Quantidade de chuvas durante os periodos de ferias e aula") +
  theme(legend.position="top") +
  theme(legend.title = element_blank()) +
  theme(plot.title = element_blank()) +
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
         y = "", 
         x = "Quantidade de chuvas em mm"
    )

Ao analisarmos o grafico acima, é visto que existe uma assimetria com uma cauda a direita, principalmente no periodo de férias, onde se observa que os valores mais altos para chuva estão muito distantes da media e da mediana. Podemos ver uq e media ficou maior no periodo de ferias por causa dos pontos extremos a direita da media alavancando seu resultado.

Pelos valores vistos, é possivel afimar que durante as ferias, a media da temperatura é maior, mesmo com semanas onde a temperatura foram bem abaixo do esperado para a epoca das ferias. A quantidade de chuvas nesses periodos também se comportam de maneira semelhante, se observarmos a mediana dos valores. Durante as ferias, existe mais semanas onde se chove pouco ou não chove (mediana mais proxima de 0) indicando tempos mais quentes e abafados. Concluimos que o periodo de melhor clima é durantes as aulas.

PERGUNTA 2: Compare a distribuição de chuvas nas 3 cidades, comparando tanto como são as semanas de muita chuva quanto com que frequência as cidades passam a semanas sem chuva.

clima %>% 
  mutate(choveu = chuva == 0) %>%
  ggplot(aes(x=semana, y = chuva, color = !choveu)) +
  facet_wrap(~cidade, ncol = 1) + 
  geom_point(show.legend = FALSE)+
  ggtitle("Distribuição de chuvas nas 3 cidades ao longo do ano de 2019") +
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
         y = "Quantidade de chuvas em mm", 
         x = ""
    )

Em vermelho são as semanas que não choveu, enquanto em azul foram as semanas que choveu

Agora veremos a distribuição de chuvas nas cidades desconsiderando as semanas.

clima %>% 
  ggplot(aes(x = chuva, y = "")) +
  geom_jitter(height = .2,alpha=.5, color="tomato")+
  facet_wrap(~ cidade, ncol = 1) +
  stat_summary(aes(shape="Media"), geom="point", fun=mean, size=2.5)+
  stat_summary(aes(shape="Mediana"), geom = "point", fun=median, size=2.5)+
  ggtitle("Distribuição de chuvas nas 3 cidades ao longo do ano de 2019") +
  theme(legend.position="top") +
  theme(legend.title = element_blank()) +
  theme(plot.title = element_blank()) +
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
         y = "", 
         x = "Chuva em mm"
    )

Vemos que ha uma boa concentração das chuvas em valores menores de 100 mm, com isso vejamos num histograma seu comportamento.

clima %>% 
  ggplot(aes(x = chuva)) +
  facet_wrap(~ cidade, ncol=1)+
  geom_histogram(binwidth=20, fill="coral", color="black")+
  geom_rug()+
  ggtitle("Histograma das chuvas nas 3 cidades ao longo do ano de 2019") +
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
         y = "", 
         x = "Chuva em mm"
    )

É possivel observar que em todos as cidades existe uma maior contentração de chuvas tendo pouca ou nenhuma incidencia de chuvas, principalmente em Patos, o que não é observado em João pessoa, na qual existe uma variação nas intensidades até 100 mm e com alguns casos extremos acima de 100 mm. Campina grande está no meio termo: não possui muita concentração nos valores perto de 0 ,como Patos, e sua variação até 100 mm é menor que João pessoa, não ocorrendo pontos extremos. Podemos observar que ao longo do ano:

PERGUNTA 3: Como se da a relação da temperatura média e umidade para as 3 cidades nos ultimos 5 anos tanto para o périodo de ferias quanto para o periodo de aulas?

retiramos dados com valores faltantes

clima_tudo %>%
  filter(is.na(temp_media)) %>% 
  filter(ano >= 2015, ano <= 2019)
## # A tibble: 3 x 11
##   cidade   semana     temp_max temp_media temp_min vento_medio vento_max umidade
##   <chr>    <date>        <dbl>      <dbl>    <dbl>       <dbl>     <dbl>   <dbl>
## 1 Campina… 2016-12-25       NA         NA       NA          NA        NA      NA
## 2 Campina… 2017-01-01       NA         NA       NA          NA        NA      NA
## 3 Campina… 2017-12-24       NA         NA       NA          NA        NA      NA
## # … with 3 more variables: chuva <dbl>, ano <int>, mes <int>
pergunta3 = clima_tudo %>%
  filter(ano >= 2015, ano <= 2019, !is.na(temp_media)) %>%
  mutate(ferias = mes %in% c(12,1,2,7))

pergunta3 %>% 
  filter(ferias == TRUE) %>%
  ggplot(aes(x=umidade, y = temp_media, color = cidade))+
  facet_grid(~ ano) +
  geom_point() +
  ggtitle("Relação da umidade (em mm) e temperatura média\n(em ºC) nos anos de 2015 a 2019 no périodo de férias") +
  theme(legend.title = element_blank())+
  theme(legend.position="top")+
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
     y = "Umidade de chuva (mm)", 
     x = "Temperatura media (°C)"
  )

pergunta3 %>% 
  filter(ferias == FALSE) %>%
  ggplot(aes(x=umidade, y = temp_media, color = cidade))+
  facet_grid(~ ano) +
  geom_point() +
  ggtitle("Relação da umidade (em mm) e temperatura média\n(em ºC) nos anos de 2015 a 2019 no périodo de aulas") +
  theme(legend.title = element_blank())+
  theme(legend.position="top")+
  theme(plot.title = element_text(hjust = 0.5))+
  labs(
     y = "Umidade de chuva (mm)", 
     x = "Temperatura media (°C)"
  )

Podemos ver uma possivel relação existente entre umidade e temperatura media , onde para valores maiores de temperatura, a umidade é menor. Nos anos analisados, podemos ver que tal comportamento se repete, independente da cidade em questão. Existe uma relação inversa entre temperatura media e umidade de chuva.