Foi realizado uma análise exploratória a partir de um conjunto de dados do Instituto Nacional de meteorologia fornecido pela disciplina de FPCC2 (Fundamentos de Pesquisa em Ciências da Computação 2). O conjunto de dados contém informações climáticas das cidades de João Pessoa localizada na zona da mata Paraibana, Campina Grande fica no Agreste Paraibano e Patos no Sertão. A análise foi feita para responder as seguintes perguntas:

Para responder as perguntas usando conjunto de dados que foi filtrado por unidades de medidas meteorológicas. Além disso, foi realizado transformações nos dados fazendo uso de sumarização. Os gráficos a seguir possibilitaram responder as perguntas.

library(tidyverse)
library(here)
library(ggplot2)
library(hrbrthemes)
library(dplyr)
library(tidyr)
library(viridis)
library(gapminder)
library(gt)
theme_set(theme_bw())
# SEMPRE read_csv NUNCA read.csv
clima_tudo = read_csv(
    here("data/tempo-jp-cg-pt.csv"),
    col_types = cols(
        .default = col_double(),
        cidade = col_character(),
        semana = col_date(format = ""),
        ano = col_integer(),
        mes = col_integer()
    )
)

clima_10 = clima_tudo %>% 
    filter(ano >= 2010, ano <=2019, !is.na(temp_max), !is.na(temp_min))
sumarios = clima_10 %>% 
    group_by(cidade, mes) %>% 
    summarise(temp_max_mensal_1 = max(temp_max), 
              temp_min_mensal_1 = min(temp_max),
              temp_max_mensal_2 = max(temp_min), 
              temp_min_mensal_2 = min(temp_min),
              temp_metade_1 = median(temp_max),
              temp_metade_2 = median(temp_min),
              chuva_max = max(chuva), 
              chuva_mediana = median(chuva), 
              chuva_min = min(chuva),
              chuva_90perc = quantile(chuva, .9),
              .groups = "drop")

Compare o quanto essas cidades tem meses claramente quentes/frios. Em qual delas há mais espocas diferentes?

clima_10 %>% 
  filter(!is.na(temp_max)) %>% 
    ggplot(aes(x = mes, y = temp_max)) +
    facet_wrap(~ cidade) +
    geom_point(alpha = .75, size = .9, color = "grey") + 
    geom_point(data = sumarios, aes(y = temp_max_mensal_1)) + 
    geom_point(data = sumarios, aes(y = temp_min_mensal_1)) + 
    geom_point(data = sumarios, aes(y = temp_metade_1), color = "red") + 
    labs(
        y = "Calor",
        x = "Mês",
        title = "Gráfico 1 - Distribuição da temperatura máxima registrada por mês, em Celsius"
    )

variacao = clima_10 %>% 
    group_by(cidade, mes) %>% 
    summarise(amplitude = max(temp_max, na.rm = TRUE) - min(temp_max, na.rm = TRUE), 
              #interquartil = IQR(temp_max,  na.rm = TRUE),
              .groups = "drop")
variacao %>% 
    ggplot(aes(x = mes, y = amplitude, color = cidade)) + 
    geom_point() + 
    geom_line()+
      labs(
        y = "Aplitude",
        x = "Mês",
        title = "Gráfico 2- Aplitude da temperatura máxima, em Celsius"
    )

tabela_varianca_desivio_max = clima_10 %>%
  filter(!is.na(temp_max)) %>% 
  group_by(cidade) %>% 
  summarise(variancia = sum(((temp_max )- mean(temp_max))**2) / n(), 
            desvio_padrao = sqrt(variancia))
tabela_varianca_desivio_max %>% 
  DT::datatable(caption = "Tabela 1 - Variância e desvio padrão das temperaturas máxima")

Durante os 10 anos em análise (gráfico 1), foi possível observar que João Pessoa tem a faixa de variação de temperatura máxima mais concentrada que as outras cidades, pois as distâncias entre os pontos de temperaturas entre máximas e mínimas de Patos e Campina grande é maior do que em João Pessoa.

A cidade de Patos apresentou períodos mais quente que as outras cidades, com distribuição de temperatura máxima concentrado entre 35 e 39 graus Celsius, ênfase para os de meses outubro a dezembro.

Os valores da amplitude térmica mensal de Campina grande na maioria das vezes são maiores que João Pessoa e Patos, ou seja, a cidade localizada no Agreste Paraibano, tem valores de calor maior, seguindo por Patos e depois Campina Grande. O desvio padrão e variância mostram que Campina Grande tem pontos mais dispersos que variam em 4.02°C (desvio padrão de 2°C), seguido por Patos com variação de 2,66°C (desvio padrão de 1.63°C) e depois João Pessoa com menor dispersão (1.12°C) (desvio padrão 1.06°C) (Gráfico 2 e a tabela 1).

clima_10 %>% 
  filter(!is.na(temp_min)) %>% 
  ggplot(aes(x = mes, y = temp_min)) +
  facet_wrap(~ cidade) +
  geom_point(alpha = .75, size = .9, color = "grey") + 
  geom_point(data = sumarios, aes(y = temp_max_mensal_2)) + 
  geom_point(data = sumarios, aes(y = temp_min_mensal_2)) + 
  geom_point(data = sumarios, aes(y = temp_metade_2), color = "red")  + 
  labs(
    y = "Calor",
    x = "",
    title = "Gráfico 3 - Distribuição da temperatura mínima registrada por mês, em Celsius"
    )

variacao_min = clima_10 %>% 
    group_by(cidade, mes) %>% 
    summarise(amplitude = max(temp_min, na.rm = TRUE) - min(temp_min, na.rm = TRUE), 
              #interquartil = IQR(temp_min,  na.rm = TRUE),
              .groups = "drop")
variacao_min %>% 
  ggplot(aes(x = mes, y = amplitude, color = cidade)) + 
  geom_point() + 
  geom_line()+
      labs(
        y = "Aplitude",
        x = "Mês",
        title = "Gráfico 4- Aplitude da temperatura mínima, em Celsius"
    )

tabela_varianca_desivio_min = clima_10 %>% 
  filter(!is.na(temp_min)) %>% 
  group_by(cidade) %>% 
  summarise(variancia = sum(((temp_min )- mean(temp_min))**2) / n(), 
            desvio_padrao = sqrt(variancia))
tabela_varianca_desivio_min %>% 
  DT::datatable(caption = "Tabela 2 - Variância e desvio padrão das temperaturas mínimas")

No gráfico 3, Campina Grande apresentou uma faixa de variação de temperatura mínimas mais concentrada em relação as outras cidades em análise. A distribuição de Patos e Joáo Pessoa mostrou similaridade, sendo que Patos um pouco mais disperso. Em Campina Grande os meses mais frios foram os junho e julho, porém, a cidade Patos teve pontos de temperatura mínima mais baixo que Campina Grande.

O gráfico 4 mostra a amplitude mensal das temperaturas mínimas três cidades, onde a temperatura de Campina Grande tem amplitude menor que as outras cidades, com a variância de 1.92°C, seguido por Patos (variância de 2.69°C) e depois Campina Grande (com desvio 2.62°C) (tabela 2).

Compara a distruuição de chuva das três cidades em estudo, considerando as semanas de muitas chuvas com a frequência que as cidades passam sem chuvas.

clima_10 %>% 
    ggplot(aes(x = mes, y = chuva)) +
    facet_wrap(~ cidade) +
    geom_point(alpha = .5, size = .9, color = "gray") + 
    geom_point(data = sumarios, aes(y = chuva_max), color = "black") + 
    geom_point(data = sumarios, aes(y = chuva_min), color = "black") + 
    geom_point(data = sumarios, aes(y = chuva_mediana), color = "red") + 
  labs(
    y = "Chuva",
    x = "Mês",
    title = "Gráfico 5 - Distribuição da precipitação por mês, em mm"
    )

clima_10 %>% 
    ggplot(aes(x = chuva,  group=cidade, color=cidade))+
    geom_freqpoly(bins = 10)+
    #theme_ipsum()+
    facet_wrap(~ mes)+
        labs(
        x = "Calor",
        y = "",
        title = "Gráfico 6 - Densidade da temperatura média mensal (°C)"
    )

O Gráfico 5 mostra a densidade da chuva por mês das três cidades, João Pessoa apresenta maior precipitação com ênfase para as semanas dos meses de abril a junho, com um pouco mais de 200 mm e, no mês de julho teve um ponto extremo com 400mm volume de chuva. A mediana da cidade de João Pessoa é a que mais se afasta de zero, significa que João Pessoa teve mais semanas de chuva que as outras cidades. Já Patos, cidade do sertão, onde costuma ter menos precipitação, teve o ponto da mediana se afastando do zero nos meses de fevereiro a abril. Além disso, esse gráfico mostrou que a cidade de Patos teve cinco meses (de julho a novembro) com precipitação abaixo de 50mm. Os meses de abril a julho de cidade de Campina Grande foram os que se afastaram do zero, com um ponto extremo de 150mm. O gráfico de densidade de chuvas mostra que a distribuição da precipitação das cidades é assimétrica, com calda a direita. Os pontos máximos são sensíveis as semanas de precipitação. A cidade de __Patos teve períodos mais longos de secas, a maior parte dos valores da distribuição da precipitação se aproximando de 0mm. João Pessoa é a cidade com maior frequência de chuvas (Gráfico 6).