Programa de Pós-Graduação em Ciência da Computação da Universidade Federal de Campina Grande (PPGCC/UFCG)

Disciplina: Fundamentos de Pesquisa em Ciência da Computação II (FPCC II)

Professor: Fábio Jorge Almeida Morais

Aluno: Felipe Torres Leite

Tarefa: Laboratório 2: Campina Grande X João Pessoa

Data: 08/05/2023

Carregamento dos dados

Carregando dados sobre o clima de CG e JP. Serão usados dados do INMET, agregados por semana. Os dados originais vêm do Banco de Dados Meteorológicos para Ensino e Pesquisa (BDMEP) que tem como objetivo apoiar as atividades de ensino e pesquisa e outras aplicações em meteorologia, hidrologia, recursos hídricos, saúde pública, meio ambiente, etc.

OBS: É válido salientar que este é um estudo feito com base em informações sobre apenas temperatura e quantidade de chuvas. Portanto, as análises realizadas não podem ser consideradas como afirmações categóricas universais, e sim, como apontamentos baseados nos dados de entrada utilizados.

climas = read_csv(here::here("data/clima_cg_jp-semanal.csv"), 
                  col_types = "cTdddddd")

glimpse(climas)
Rows: 2,748
Columns: 8
$ cidade <chr> "Campina Grande", "Campina Grande", "Campina Grande", "Campina Grande", "Campina Grande", "Campina Gr…
$ semana <dttm> 1992-12-27, 1993-01-03, 1993-01-10, 1993-01-31, 1993-02-07, 1993-02-14, 1993-02-21, 1993-02-28, 1993…
$ tmedia <dbl> 26.13333, 26.11905, 25.76667, 25.74000, 26.31429, 26.28571, 26.47143, 26.56667, 25.76667, 25.22857, 2…
$ tmax   <dbl> 30.4, 32.4, 32.2, 32.0, 32.7, 32.7, 32.3, 32.3, 32.1, 31.2, 32.2, 31.7, 32.7, 31.5, 31.9, 32.4, 32.6,…
$ tmin   <dbl> 20.7, 19.3, 19.7, 19.9, 19.6, 20.0, 20.4, 21.2, 19.0, 19.0, 19.3, 19.9, 19.9, 20.0, 20.0, 20.0, 20.2,…
$ chuva  <dbl> 0.0, 0.0, 0.0, 0.4, 0.3, 0.0, 4.9, 0.0, 0.0, 6.1, 0.4, 1.2, 0.0, 1.6, 0.0, 1.8, 0.8, 8.3, 2.4, 6.2, 1…
$ mes    <dbl> 12, 1, 1, 1, 2, 2, 2, 2, 10, 11, 11, 11, 11, 12, 12, 12, 12, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4…
$ ano    <dbl> 1992, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993, 1993,…
climas = climas %>% 
  #mutate(temp_anterior = lag(temp_media, n = 1))
   mutate(temp_anterior = lag(tmedia, n = 1)) 

Alterando a tabela adicionando uma coluna com a temperatura da semana anterior em cada linha.

paged_table(climas)

É importante salientar que a base de dados utilizada mostra uma variação de dados ao longo de meses iniciando em 1987 e finalizando em 2019. Porém, é possível verificar que existem meses e/ou anos onde há ausências nas medições em ambas as cidades investigadas. Isto pode gerar uma influência negativa na análise geral, uma vez que comparar um ano com dados referente a 12 meses com outro(s) com uma quantidade inferior a isto tornará a análise enviesada e, portanto, implicar em resultados, interpretações errôneas e ameaçar a validade da pesquisa. Logo, é necessário descobrir em quais anos as informações estão incompletas para que sejam descartadas.

Verificando os dados sobre CG:

cg = climas %>% 
    filter(cidade == "Campina Grande") 

meses_por_anoCG <- aggregate(cg$mes, by = list(cg$ano), FUN = function(x) length(unique(x)))
names(meses_por_anoCG) <- c("ano", "meses_com_dados")
meses_por_anoCG$meses_faltantes <- 12 - meses_por_anoCG$meses_com_dados

paged_table(meses_por_anoCG)

Pode-se verificar que os dados para Campina Grande iniciam em 1992 e terminam em 2019, porém, os anos de 1992 a 1994, 2000, 2001 e 2019 estão incompletos. Portanto, serão descartados da análise.

Verificando os dados sobre JP:

jp = climas %>% 
    filter(cidade == "João Pessoa")

meses_por_anoJP <- aggregate(jp$mes, by = list(jp$ano), FUN = function(x) length(unique(x)))
names(meses_por_anoJP) <- c("ano", "meses_com_dados")
meses_por_anoJP$meses_faltantes <- 12 - meses_por_anoJP$meses_com_dados

paged_table(meses_por_anoJP)

Pode-se verificar que os dados para João Pessoa iniciam em 1987 e terminam em 2019, porém, os anos de 1987 a 1990, 1994 e 2019 estão incompletos. Portanto, serão descartados da análise.

Logo, os anos válidos para a investigação estão compreendidos entre 1995 a 2018, com exceção de 2000 e 2001, uma vez que contêm dados sobre os 12 meses de cada ano para ambas as cidades.

Recriando a tabela ‘climas’ com o conjunto válido de dados:

climas = climas %>% 
    filter(ano > 1994 & ano < 2019 & ano != 2000 & ano != 2001)

cg = climas %>% 
    filter(cidade == "Campina Grande")

jp = climas %>% 
    filter(cidade == "João Pessoa")

paged_table(climas)

Questões

Q1: Qual a cidade é mais quente? Isso muda se considerarmos apenas o período de janeiro e fevereiro (pico do verão)?

  • Investigando a cidade mais quente:

Observando o comportamento da temperatura nas duas cidades:

  1. Plotando histograma, gráfico de densidade, bloxplot e apresentando sumários sobre a temperatura média das duas cidades
# histograma
hist_temperaturaCG = cg %>% 
    ggplot(aes(x = tmedia)) +
    geom_histogram(binwidth = .5, color = "#FCC8C5", fill = "#FCC8C5") +
    labs(x = "Temperatura Média (ºC)", y = "Frequência") 

hist_temperaturaJP = jp %>% 
    ggplot(aes(x = tmedia)) + 
    geom_histogram(binwidth = .5, color = "#99E5E7", fill = "#99E5E7") +
    labs(x = "Temperatura Média (ºC)", y = "Frequência")

grid.arrange(hist_temperaturaCG, hist_temperaturaJP, ncol = 2)


# densidade
dens_temperaturaCG = cg %>% 
    ggplot(aes(x = tmedia)) + 
    geom_density(fill = "#FCC8C5") +
    labs(x = "Temperatura Média (ºC)", y = "Densidade")  

dens_temperaturaJP = jp %>% 
    ggplot(aes(x = tmedia)) + 
    geom_density(fill = "#99E5E7") +
    labs(x = "Temperatura Média (ºC)", y = "Densidade") 

grid.arrange(dens_temperaturaCG, dens_temperaturaJP, ncol = 2)


# boxplot
box_temperaturaCG = cg %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)")

box_temperaturaJP = jp %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)")

grid.arrange(box_temperaturaCG, box_temperaturaJP, ncol = 2)

  • Histograma: É mostrado que existe uma frequência maior de temperaturas médias para Campina Grande entre 25ºC e 26C. Já para João Pessoa, entre 28ºC e 29ºC. Em ambas, existe uma tendência de suas temperaturas mais frequentes serem menores que os respectivos valores apontados como mais frequentes.

  • Densidade: Confirma a informação mostrada no histograma.

  • Boxplot: Para Campina Grande, 75% das medições para a temperatura média estão abaixo de 25,82ºC. Para João Pessoa, 75% das medições para a temperatura média estão abaixo de 28,64ºC.

Sumário para temperatura média de Campina Grande:

summary(cg$tmedia)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  20.77   23.36   24.91   24.62   25.82   28.15 

Para Campina Grande, há uma variação de temperaturas médias de 20ºC a 28ºC, aproximadamente, com mediana e média em aproximadamente 25ºC.

Sumário para temperatura média de João Pessoa:

summary(jp$tmedia)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  23.99   26.85   27.91   27.73   28.64   30.11 

Para João Pessoa, há uma variação de temperaturas médias de 24ºC a 30ºC, aproximadamente, com mediana e média em aproximadamente 28ºC.

Isto indica que Campina Grande tem uma temperatura média mais frequentemente menor que João Pessoa.

  1. Plotando bloxplot e apresentando sumários sobre a temperatura mínima das duas cidades
# boxplot
box_temperaturaMinCG = cg %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)")

box_temperaturaMinJP = jp %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)")

grid.arrange(box_temperaturaMinCG, box_temperaturaMinJP, ncol = 2)

Sumário para temperatura mínima de Campina Grande:

summary(cg$tmin)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  15.30   18.20   19.50   19.27   20.30   22.60 

Para Campina Grande, há uma variação de temperaturas mínimas de 15ºC a 23ºC, aproximadamente, com mediana e média em aproximadamente 19,5ºC. Ainda, 75% dos valores estão abaixo de 20,3ºC.

Sumário para temperatura mínima de João Pessoa:

summary(jp$tmin)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  15.60   21.40   22.70   22.58   23.70   26.70 

Para João Pessoa, há uma variação de temperaturas mínimas de 15ºC a 26ºC, aproximadamente, com mediana e média em aproximadamente 22,5ºC. Ainda, 75% dos valores estão abaixo de 23,7ºC.

Isto indica que Campina Grande tem uma temperatura mínima mais frequentemente menor que João Pessoa.

  1. Plotando bloxplot e apresentando sumários sobre a temperatura máxima das duas cidades
# boxplot
box_temperaturaMaxCG = cg %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

box_temperaturaMaxJP = jp %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

grid.arrange(box_temperaturaMaxCG, box_temperaturaMaxJP, ncol = 2)

Sumário para temperatura máxima de Campina Grande:

summary(cg$tmax)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  25.00   28.60   30.50   30.24   31.90   34.60 

Para Campina Grande, há uma variação de temperaturas máximas de 25ºC a 35ºC, aproximadamente, com mediana e média em aproximadamente 30,5ºC. Ainda, 75% dos valores estão abaixo de 31,9ºC.

Sumário para temperatura máxima de João Pessoa:

summary(jp$tmax)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  27.20   30.00   30.80   30.83   31.60   33.70 

Para Campina Grande, há uma variação de temperaturas mínimas de 27ºC a 34ºC, aproximadamente, com mediana e média em aproximadamente 31,8ºC. Ainda, 75% dos valores estão abaixo de 31,6ºC.

Isto indica que para temperaturas máximas Campina Grande e João Pessoa são praticamente equivalentes, com a primeira tendo uma maior variação de valores para esta medição.

Agora, mostrando informações sobre temperatura de ambas as cidades anualmente. A temperatura média é o resultado da média entre os valores calculados para a temperatura média por ano. O pico de temperatura mínima é o mínimo do conjunto de valores calculados para a temperatura mínima. Já o pico de temperatura máxima é o máximo do conjunto de valores calculados para a temperatura máxima.

  1. Gráfico de Linhas para a média da temperatura média anual
line_pico = pico %>% 
    group_by(cidade, ano) %>%
    summarise(tmediaAno = round(mean(tmedia),2),
              tminAno = min(tmin),
              tmaxAno = max(tmax),
              .groups = "drop")

line_pico %>% 
    ggplot(aes(x = ano, y = tmediaAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(y = "Temperatura Média (ºC)")

João Pessoa demonstra ter uma temperatura média anual MAIOR que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 4ºC em alguns anos.

  1. Gráfico de Linhas para o pico da temperatura mínima anual
line_pico %>% 
    ggplot(aes(x = ano, y = tminAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(y = "Pico de Temperatura Mínima (ºC)")

João Pessoa demonstra ter uma temperatura mínima anual MAIOR que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 5ºC em alguns anos.

  1. Gráfico de Linhas para o pico da temperatura máxima anual
line_pico %>% 
    ggplot(aes(x = ano, y = tmaxAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(y = "Pico de Temperatura Máxima (ºC)")

Campina Grande demonstra ter uma temperatura máxima anual MAIOR que João Pessoa entre 1995 e 2015, ano a partir do qual passa a ser MENOR. É válido destacar que a diferença de temperatura não ultrapassou 2ºC em nenhum dos anos.

RESPOSTA:

De forma geral, Campina Grande tem uma maior variação de temperatura ao longo do dia do que João Pessoa, mas esta permanece o dia com temperaturas mais elevadas que aquela, o que torna João Pessoa uma cidade mais quente.

Analisando ano por ano, Campina Grande demonstrou ter em relação a João Pessoa: (i) temperatura média menor, com cerca de 4ºC a menos em alguns anos; (ii) ter temperatura mínima menor, com cerca de 5ºC a menos em alguns anos; e (iii) ter * temperatura máxima maior*, com cerca de apenas 2ºC a mais em alguns anos. Isto confirma João Pessoa como uma cidade mais quente do que Campina Grande.


  • Investigando o Pico de Verão (Janeiro e Fevereiro):

Considerando apenas os meses de Janeiro e Fevereiro para a análise a seguir:

pico = climas %>% 
    filter(mes == 1 | mes == 2)

picoCG = cg %>% 
    filter(mes == 1 | mes == 2)

picoJP = jp %>% 
    filter(mes == 1 | mes == 2)
  1. Visualizando os boxplots da temperatura média para cada cidade referentes a todos os meses de Janeiro e Fevereiro.
# boxplot
box_picoVeraoCG = picoCG %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)") 

box_picoVeraoJP = picoJP %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)")

grid.arrange(box_picoVeraoCG, box_picoVeraoJP, ncol = 2) 

Sumário da temperatura média para os meses de Janeiro e Fevereiro de Campina Grande

summary(picoCG$tmedia)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  22.98   25.26   25.92   25.83   26.54   27.97 

Para Campina Grande, há uma variação de temperaturas médias de 23ºC a 28ºC, aproximadamente, com mediana e média em aproximadamente 26ºC. Ainda, 75% dos valores estão abaixo de 26,54ºC.

Sumário da temperatura média para os meses de Janeiro e Fevereiro de João Pessoa

summary(picoJP$tmedia)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  26.61   28.37   28.76   28.69   29.11   30.09 

Para João Pessoa, há uma variação de temperaturas médias de 26ºC a 30ºC, aproximadamente, com mediana e média em aproximadamente 29ºC. Ainda, 75% dos valores estão abaixo de 29,11ºC.

Isto indica que Campina Grande tem uma temperatura média mais frequentemente menor que João Pessoa.

  1. Visualizando os boxplots da temperatura mínima para cada cidade referentes a todos os meses de Janeiro e Fevereiro.
box_picoVeraoMinCG = picoCG %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)") 

box_picoVeraoMinJP = picoJP %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)")

grid.arrange(box_picoVeraoMinCG, box_picoVeraoMinJP, ncol = 2)

Sumário da temperatura mínima para os meses de Janeiro e Fevereiro de Campina Grande

summary(picoCG$tmin)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  18.10   20.10   20.40   20.46   21.00   22.50 

Para Campina Grande, há uma variação de temperaturas mínimas de 18ºC a 22,5ºC, aproximadamente, com mediana e média em aproximadamente 20,4ºC. Ainda, 75% dos valores estão abaixo de 21ºC.

Sumário da temperatura mínima para os meses de Janeiro e Fevereiro de João Pessoa

summary(picoJP$tmin)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  20.90   22.93   23.70   23.60   24.27   26.70 

Para João Pessoa, há uma variação de temperaturas mínimas de 21ºC a 27ºC, aproximadamente, com mediana e média em aproximadamente 23,7ºC. Ainda, 75% dos valores estão abaixo de 24,27ºC.

Isto indica que Campina Grande tem uma temperatura mínima mais frequentemente menor que João Pessoa.

  1. Visualizando os boxplots da temperatura máxima para cada cidade referentes a todos os meses de Janeiro e Fevereiro.
box_picoVeraoMaxCG = picoCG %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

box_picoVeraoMaxJP = picoJP %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

grid.arrange(box_picoVeraoMaxCG, box_picoVeraoMaxJP, ncol = 2)

Sumário da temperatura máxima para os meses de Janeiro e Fevereiro de Campina Grande

summary(picoCG$tmax)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  28.40   31.07   32.00   31.83   32.70   34.20 

Para Campina Grande, há uma variação de temperaturas máximas de 28ºC a 34ºC, aproximadamente, com mediana e média em aproximadamente 32ºC. Ainda, 75% dos valores estão abaixo de 32,7ºC.

Sumário da temperatura máxima para os meses de Janeiro e Fevereiro de João Pessoa

summary(picoJP$tmax)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  29.90   31.20   31.60   31.62   32.00   33.70 

Para João Pessoa, há uma variação de temperaturas máximas de 30ºC a 34ºC, aproximadamente, com mediana e média em aproximadamente 31,6ºC. Ainda, 75% dos valores estão abaixo de 32ºC.

Isto indica que para temperaturas máximas Campina Grande e João Pessoa são praticamente equivalentes, com a primeira tendo uma maior variação de valores para esta medição.

Agora, mostrando informações sobre temperatura de ambas as cidades anualmente. A temperatura média é o resultado da média entre os valores calculados para a temperatura média por ano. O pico de temperatura mínima é o mínimo do conjunto de valores calculados para a temperatura mínima. Já o pico de temperatura máxima é o máximo do conjunto de valores calculados para a temperatura máxima.

  1. Gráfico de Linhas para a média da temperatura média referente ao pico do verão por ano
line_pico = pico %>% 
    group_by(cidade, ano) %>%
    summarise(tmediaAno = round(mean(tmedia),2),
              tminAno = min(tmin),
              tmaxAno = max(tmax),
              .groups = "drop")

line_pico %>% 
    ggplot(aes(x = ano, y = tmediaAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(x = "Ano", y = "Temperatura Média (ºC)")

João Pessoa demonstra ter uma temperatura média anual MAIOR que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 4ºC em alguns anos.

  1. Gráfico de Linhas para o mínimo da temperatura mínima referente ao pico do verão por ano
line_pico %>% 
    ggplot(aes(x = ano, y = tminAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(x = "Ano", y = "Temperatura Mínima (ºC)")

João Pessoa demonstra ter uma temperatura mínima anual MAIOR que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 5ºC em alguns anos.

  1. Gráfico de Linhas para o máximo da temperatura máxima referente ao pico do verão por ano
line_pico %>% 
    ggplot(aes(x = ano, y = tmaxAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(x = "Ano", y = "Temperatura Máxima (ºC)")

Campina Grande demonstra ter uma temperatura máxima anual MAIOR que João Pessoa entre 1995 e 2015, ano a partir do qual passa a ser menor. É válido destacar que a diferença de temperatura não ultrapassou 2ºC em nenhum dos anos.

RESPOSTA:

De forma geral, Campina Grande tem uma maior variação de temperatura ao longo do dia do que João Pessoa, mas esta permanece o dia com temperaturas mais elevadas que aquela, o que torna João Pessoa uma cidade mais quente também no Pico do Verão.

Analisando ano por ano, Campina Grande demonstrou ter em relação a João Pessoa: (i) temperatura média menor, com cerca de 4ºC a menos em alguns anos; (ii) ter temperatura mínima menor, com cerca de 5ºC a menos em alguns anos; e (iii) ter * temperatura máxima maior*, com cerca de apenas 2ºC a mais em alguns anos. Isto confirma João Pessoa como uma cidade mais quente do que Campina Grande também no Pico do Verão.

Por fim, foi percebido que existe comportamento idêntico na variação de temperaturas entre as duas cidades, identificado tanto de forma geral e anualmente, como considerando apenas o pico do verão (janeiro e fevereiro) de maneira geral e por ano também. Logo, João Pessoa é mais quente do que Campina Grande tanto no pico do verão quanto no ano todo desde 1995, exceto nos anos de 2000 e 2001 em razão da falta de dados sobre estes respectivos anos.


Q2: Quais os meses mais quentes e mais frios? Como você descreveria a temperatura das festas juninas das cidades nos últimos anos?

  • Investigando a temperatura em diferentes meses do ano
  1. Gráfico de Linhas para a média da temperatura média mensal
line_temperaturaMes = climas %>% 
    group_by(cidade, mes) %>%
    summarise(tmediaMes = round(mean(tmedia),2),
              tmaxMes = max(tmax),
              tminMes = min(tmin),
              .groups = "drop")

line_temperaturaMes %>% 
    ggplot(aes(x = mes, y = tmediaMes, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaMes), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Mês", breaks = 1:12) +
    labs(y = "Temperatura Média (ºC)") 

João Pessoa demonstra ter uma temperatura média mensal MAIOR que Campina Grande em todos os meses investigados. A diferença de temperatura manteve um padrão de cerca de 3ºC ao longo dos meses. Na média, março é o mês mais quente e julho é o mês mais frio para as duas cidades.

  1. Gráfico de Linhas para o máximo de temperatura máxima mensal
line_temperaturaMes %>% 
    ggplot(aes(x = mes, y = tmaxMes, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxMes), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Mês", breaks = 1:12) +
    labs(y = "Temperatura Máxima (ºC)") 

Campina Grande demonstra ter uma temperatura máxima mensal MAIOR que Campina Grande na maioria dos meses investigados, com exceção dos meses de Maio e Junho onde foi MENOR. A diferença de temperatura foi bastante variada ao longo dos meses.

Para João Pessoa, o pico de temperatura máxima foi identificado nos meses de janeiro e março. Para Campina Grande, o pico de temperatura máxima foi identificado no mês março.

  1. Gráfico de Linhas para o mínimo de temperatura mínima mensal
line_temperaturaMes %>% 
    ggplot(aes(x = mes, y = tminMes, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminMes), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Mês", breaks = 1:12) +
    labs(y = "Temperatura Mínima (ºC)") 

João Pessoa demonstra ter uma temperatura mínima mensal MAIOR que Campina Grande em todos os meses investigados. A diferença de temperatura entre ambas chegou a 3ºC em alguns meses.

Para João Pessoa, a menor temperatura mínima foi identificada no mês de agosto. Para Campina Grande, as menores temperaturas mínimas foram identificadas nos meses de julho e agosto.

RESPOSTA:

Ao longo dos meses do ano, João Pessoa é mais quente do que Campina Grande. Entretanto, no mês de junho, Campina Grande obtém temperaturas menores do que João Pessoa tanto para a média, quanto para a mínima e máxima. Logo, Campina Grande costuma estar mais fria no mês de junho.

Na média, março é o mês mais quente e julho é o mês mais frio para as duas cidades. As menores temperaturas estão nos meses de julho, somente para Campina Grande, e em agosto, para ambas as cidades. Já as maiores temperaturas estão nos meses de janeiro, apenas para Campina Grande, e em março, para as duas cidades.


  • Investigando a temperatura durante as festas juninas (mês de junho) dos últimos 10 anos: Entre 2008 e 2018

Repetindo o processo anterior feito para a análise de temperaturas mensais, agora considerando apenas o mês de Junho e os anos compreendidos entre 2008 e 2018 (os últimos 10 anos da base de dados).

temperaturaJunho = climas %>% 
    filter(mes == 6 & ano > 2007)

temperaturaJunho = temperaturaJunho %>% 
    group_by(cidade, ano) %>%
    summarise(tmediaAno6 = round(mean(tmedia),2),
              tmaxAno6 = max(tmax),
              tmedmaxAno6 = round(mean(tmax),2),
              tminAno6 = min(tmin),
              tmedminAno6 = round(mean(tmin),2),
              .groups = "drop")

temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmediaAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Temperatura Média de Junho (ºC)") 


temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmaxAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Temperatura Máxima de Junho (ºC)") 


temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmedmaxAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmedmaxAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Média da Temperatura Máxima de Junho (ºC)") 


temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tminAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Temperatura Mínima de Junho (ºC)") 


temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmedminAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmedminAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous(breaks = 2008:2018) +
    labs(x = "Ano", y = "Média da Temperatura Mínima de Junho  (ºC)") 

RESPOSTA:

Considerando os últimos 10 anos da base de dados, anos compreendidos entre 2008 e 2018, pode-se apontar que Campina Grande permaneceu mais fria do que João Pessoa no mês de junho, com uma diferença de cerca de 4ºC vários anos.

Campina Grande ser mais fria que João Pessoa no mês de junho é válido tanto para as medições de temperaturas mínimas e máximas quanto para as médias das temperaturas mínima, média e máxima.


Q3: Quanto chove por semana em JP e CG? Descreva a distribuição do volume de chuvas para as cidades?

Observando o comportamento das chuvas nas duas cidades:

  1. Plotando histograma, gráfico de densidade, bloxplot e apresentando sumários sobre o índice de chuvas das duas cidades

hist_chuvasCG = cg %>%
    ggplot(aes(x = chuva)) +
    geom_histogram(binwidth = 10, color = "#FCC8C5", fill = "#FCC8C5") +
    labs(x = "Índice de Chuvas (mm)", y = "Frequência") 

hist_chuvasJP = jp %>%
    ggplot(aes(x = chuva)) +
    geom_histogram(binwidth = 10, color = "#99E5E7", fill = "#99E5E7") +
    labs(x = "Índice de Chuvas (mm)", y = "Frequência") 

grid.arrange(hist_chuvasCG, hist_chuvasJP, ncol = 2)


dens_chuvasCG = cg %>%
    ggplot(aes(x = chuva)) +
    geom_density(fill = "#FCC8C5") +
    labs(x = "Índice de Chuvas (mm)", y = "Densidade")  

dens_chuvasJP = jp %>%
    ggplot(aes(x = chuva)) +
    geom_density(fill = "#99E5E7") +
    labs(x = "Índice de Chuvas (mm)", y = "Densidade") 

grid.arrange(dens_chuvasCG, dens_chuvasJP, ncol = 2)


box_chuvasCG = cg %>%
    ggplot(aes(x = cidade, y = chuva)) +
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Índice de Chuvas (mm)")

box_chuvasJP = jp %>%
    ggplot(aes(x = cidade, y = chuva)) +
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Índice de Chuvas (mm)")

grid.arrange(box_chuvasCG, box_chuvasJP, ncol = 2)

  • Histograma: É mostrado que existe uma frequência maior de chuvas abaixo de 50mm para Campina Grande e de 100mm para João Pessoa. A maior chuva para a Campina Grande não passou de 200mm, enquanto que João Pessoa teve algumas chuvas maiores do que 200mm chegando a ultrapassar 350mm de chuva. É válido destacar que estas medições indicão valores semanais.

  • Densidade: Confirma a informação mostrada no histograma.

  • Boxplot: Para Campina Grande, 75% dos índices semanais de chuva estão abaixo de 25mm. Para João Pessoa, 75% das medições para chuvas estão abaixo de 50mm. Além disso, ambas possuem índices de chuva muito maiores do que as suas respectivas medianas.

summary(cg$chuva)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   0.00    0.40    5.05   14.22   19.05  191.90 

Para Campina Grande, há uma variação de chuvas de 0mm a 192mm, aproximadamente, com mediana equivalente a 5,05mm e média igual 14,22mm. A diferença entre o 3º quartil e o valor máximo é muito grande, mostrando uma distribuição irregular dos dados. Os valores de média e mediana não são bem representativos.

summary(jp$chuva)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   0.00    3.00   14.50   33.59   47.12  351.60 

Para João Pessoa, há uma variação de chuvas de 0mm a 352mm, aproximadamente, com mediana equivalente a 14,5mm e média igual 33,59mm. A diferença entre o 3º quartil e o valor máximo é muito grande (maior ainda do que para Campina Grande), mostrando uma distribuição ainda mais irregular dos dados. Os valores de média e mediana não são bem representativos.

RESPOSTA:

Para Campina Grande, 75% dos índices semanais de chuva estão abaixo de 25mm. Para João Pessoa, 75% das medições para chuvas estão abaixo de 50mm. Além disso, ambas possuem índices de chuva muito maiores do que as suas respectivas medianas. Isto é, existe uma distribuição muito irregular de chuvas, de maneira geral. A diferença entre o 3º quartil e o valor máximo é muito grande (maior ainda em João Pessoa), mostrando distribuições irregulares dos dados. Os valores de média e mediana não são bem representativos.


Q4: Qual a relação entre a temperatura de uma semana e a temperatura da semana anterior (descreva para as duas cidades)?

Visualizando graficamente os dados sobre temperaturas médias e sua semana imediatamente anterior para verificar a possibilidade de correlação.

  1. Gráfico de Pontos de Temperatura Média X Temperatura Média da Semana Anterior
relacaoTemperatura = climas

relacaoTemperatura %>% 
    ggplot(aes(x = tmedia, y = temp_anterior, color = cidade)) +
    geom_quasirandom(alpha = .5, size = 1) +
    labs(x = "Temperatura Média (ºC)", y = "Temperatura Média da Semana Anterior (ºC)")

Visualmente, nota-se que existe uma relação linear entre a temperatura média e a temperatura média da sua semana imediatamente anterior, tanto para Campina Grande, quanto para João Pessoa. Isto significa que a temperatura média de uma semana específica foi semelhante à temperatura média de sua semana imediatamente anterior.

Para valores menores de temperaturas, Campina Grande destaca-se mais, ao passo que para maiores temperaturas, João Pessoa destaca-se mais.

Verificando os valores de correlação para os coeficientes de pearson, spearman e kendall para as duas cidades.

correlacaoTemperaturaCG = cg 

correlacaoTemperaturaCG %>% 
    summarise(pearson = cor(tmedia, temp_anterior, method = "pearson"),
              spearman = cor(tmedia, temp_anterior, method = "spearman"),
              kendall = cor(tmedia, temp_anterior, method = "kendall"))

Para Campina Grande, todos os três coeficientes calculados apontaram uma correlação positiva alta entre a temperatura média e a temperatura média de sua semana imediatamente anterior.

correlacaoTemperaturaJP = jp 

correlacaoTemperaturaJP %>% 
    summarise(pearson = cor(tmedia, temp_anterior, method = "pearson"),
              spearman = cor(tmedia, temp_anterior, method = "spearman"),
              kendall = cor(tmedia, temp_anterior, method = "kendall"))

Para João Pessoa, todos os três coeficientes calculados apontaram uma correlação positiva alta entre a temperatura média e a temperatura média de sua semana imediatamente anterior.

Agora, verificando o sumário entre as temperaturas para as duas cidades.

relacaoTemperaturaCG = cg

summary(relacaoTemperaturaCG$tmedia, relacaoTemperaturaCG$temp_anterior)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  20.77   23.36   24.91   24.62   25.82   28.15 

Para Campina Grande, a média e a mediana obtiveram valores muito próximos e não estão distantes dos seus pontos máximo e mínimo, o que mostra uma distribuição regular dos dados.

relacaoTemperaturaJP = jp

summary(relacaoTemperaturaJP$tmedia, relacaoTemperaturaJP$temp_anterior)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  23.99   26.85   27.91   27.73   28.64   30.11 

Para João Pessoa, a média e a mediana obtiveram valores muito próximos e não estão distantes dos seus pontos máximo e mínimo, o que mostra uma distribuição regular dos dados.

RESPOSTA:

Pode-se perceber que existe uma relação linear e de alta correlação entre a temperatura média e a temperatura média da sua semana imediatamente anterior, tanto para Campina Grande, quanto para João Pessoa. Isto significa que a temperatura média de uma semana específica foi semelhante à temperatura média de sua semana imediatamente anterior.

A diferença está nos valores das temperaturas, onde Campina Grande apresenta valores mais baixos do que João Pessoa. Contudo, ambas possuem um comportamento semelhante para as temperaturas médias e as temperaturas médias da semana imediatamente anterior.


Q5: Qual a relação entre temperatura e chuvas nas semanas em que choveu (descreva para as duas cidades)?

Visualizando graficamente os dados sobre temperaturas médias e chuvas para verificar a possibilidade de correlação.

  1. Gráfico de Pontos de Temperatura Média X Índice de Chuvas
relacaoTemperaturaChuva = climas

relacaoTemperaturaChuva %>% 
    ggplot(aes(x = tmedia, y = chuva, color = cidade)) +
    geom_quasirandom(alpha = .5, size = 1) +
    labs(x = "Temperatura Média (ºC)", y = "Índice de Chuvas (mm)")

Não é possível observar visualmente alguma correlação entre temperatura média e índice de chuvas em nenhuma das cidades. O que pode ser visto é apenas que para valores menores de temperaturas, Campina Grande destaca-se mais, ao passo que para maiores temperaturas, João Pessoa destaca-se mais.

Verificando os valores de correlação para os coeficientes de pearson, spearman e kendall para as duas cidades.

correlacaoTemperaturaChuvasCG = cg 

correlacaoTemperaturaChuvasCG %>% 
    summarise(pearson = cor(tmedia, chuva, method = "pearson"),
              spearman = cor(tmedia, chuva, method = "spearman"),
              kendall = cor(tmedia, chuva, method = "kendall"))

Para Campina Grande, os coeficientes calculados apontaram uma correlação negativa fraca (pearson e kendall) e negativa moderada (spearman) entre a temperatura média e o índice de chuvas.

correlacaoTemperaturaChuvasJP = jp 

correlacaoTemperaturaChuvasJP %>% 
    summarise(pearson = cor(tmedia, chuva, method = "pearson"),
              spearman = cor(tmedia, chuva, method = "spearman"),
              kendall = cor(tmedia, chuva, method = "kendall"))

Para Campina Grande, todos os três coeficientes calculados apontaram uma correlação negativa fraca entre a temperatura média e o índice de chuvas.

Agora, verificando o sumário entre as temperaturas e os índices de chuvas para as duas cidades.

relacaoTemperaturaChuvaCG = cg

summary(relacaoTemperaturaChuvaCG$chuva, relacaoTemperaturaChuvaCG$tmedia)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   0.00    0.40    5.05   14.22   19.05  191.90 

Para Campina Grande, a média e a mediana obtiveram valores não próximos, não estão próximas do valor mínimo e estão muito distantes do seu ponto máximo, o que mostra uma distribuição irregular dos dados.

relacaoTemperaturaChuvaJP = jp

summary(relacaoTemperaturaChuvaJP$chuva, relacaoTemperaturaChuvaJP$tmedia)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   0.00    3.00   14.50   33.59   47.12  351.60 

Para João Pessoa, a média e a mediana obtiveram valores não próximos, não estão próximas do valor mínimo e estão muito distantes do seu ponto máximo, o que mostra uma distribuição irregular dos dados. Neste caso, a irregularidade é ainda maior que em Campina Grande.

RESPOSTA:

Não é possível observar alguma correlação entre temperatura média e índice de chuvas em nenhuma das cidades. O que pode ser visto é apenas que para valores menores de temperaturas, Campina Grande destaca-se mais, ao passo que para maiores temperaturas, João Pessoa destaca-se mais.

Os coeficientes de pearson, spearman e kendall apontaram uma correlação negativa fraca entre temperatura média e índice de chuvas para as duas cidades, no geral. Além disso, a variação de dados mostra irregularidade também nas duas cidades.

Logo, não é possível afirmar que existe correlação entre temperatura média e índice de chuvas para as cidades de Campina Grande e João Pessoa. Por exemplo, pode chover em dias quentes e frios e também pode não chover em dias quentes e frios. Isto dificulta a identificação de uma relação entre a temperatura média e o índice de chuvas.

---
title: "Estudo sobre clima: CG x JP"
output: html_notebook
---

Programa de Pós-Graduação em Ciência da Computação da Universidade Federal de Campina Grande (PPGCC/UFCG)

Disciplina: Fundamentos de Pesquisa em Ciência da Computação II (FPCC II)

Professor: Fábio Jorge Almeida Morais

Aluno: Felipe Torres Leite

Tarefa: [Laboratório 2: Campina Grande X João Pessoa](https://github.com/fpcc2-2023-1/fpcc2-lab2-MrFelipeTorres)

Data: 08/05/2023

## Carregamento dos dados

Carregando dados sobre o clima de CG e JP. Serão usados dados do INMET, agregados por semana. Os dados originais vêm do Banco de Dados Meteorológicos para Ensino e Pesquisa (BDMEP) que tem como objetivo apoiar as atividades de ensino e pesquisa e outras aplicações em meteorologia, hidrologia, recursos hídricos, saúde pública, meio ambiente, etc.

*OBS: É válido salientar que este é um estudo feito com base em informações sobre apenas temperatura e quantidade de chuvas. Portanto, as análises realizadas não podem ser consideradas como afirmações categóricas universais, e sim, como apontamentos baseados nos dados de entrada utilizados.*

```{r echo=FALSE, message=FALSE, warning=FALSE}
library(tidyverse)
library(here)
library(lubridate)
library(ggbeeswarm)
library(gridExtra)
library(rmarkdown)
theme_set(theme_bw())
```

```{r}
climas = read_csv(here::here("data/clima_cg_jp-semanal.csv"), 
                  col_types = "cTdddddd")

glimpse(climas)
```

```{r read}
climas = climas %>% 
  #mutate(temp_anterior = lag(temp_media, n = 1))
   mutate(temp_anterior = lag(tmedia, n = 1)) 
```

Alterando a tabela adicionando uma coluna com a temperatura da semana anterior em cada linha.

```{r}
paged_table(climas)
```

É importante salientar que a base de dados utilizada mostra uma variação de dados ao longo de meses iniciando em 1987 e finalizando em 2019. Porém, é possível verificar que existem meses e/ou anos onde há ausências nas medições em ambas as cidades investigadas. Isto pode gerar uma influência negativa na análise geral, uma vez que comparar um ano com dados referente a 12 meses com outro(s) com uma quantidade inferior a isto tornará a análise enviesada e, portanto, implicar em resultados, interpretações errôneas e ameaçar a validade da pesquisa. Logo, é necessário descobrir em quais anos as informações estão incompletas para que sejam descartadas.

Verificando os dados sobre CG:

```{r}
cg = climas %>% 
    filter(cidade == "Campina Grande") 

meses_por_anoCG <- aggregate(cg$mes, by = list(cg$ano), FUN = function(x) length(unique(x)))
names(meses_por_anoCG) <- c("ano", "meses_com_dados")
meses_por_anoCG$meses_faltantes <- 12 - meses_por_anoCG$meses_com_dados

paged_table(meses_por_anoCG)
```

Pode-se verificar que os dados para Campina Grande iniciam em 1992 e terminam em 2019, porém, os anos de 1992 a 1994, 2000, 2001 e 2019 estão incompletos. Portanto, serão descartados da análise.

Verificando os dados sobre JP:

```{r}
jp = climas %>% 
    filter(cidade == "João Pessoa")

meses_por_anoJP <- aggregate(jp$mes, by = list(jp$ano), FUN = function(x) length(unique(x)))
names(meses_por_anoJP) <- c("ano", "meses_com_dados")
meses_por_anoJP$meses_faltantes <- 12 - meses_por_anoJP$meses_com_dados

paged_table(meses_por_anoJP)
```

Pode-se verificar que os dados para João Pessoa iniciam em 1987 e terminam em 2019, porém, os anos de 1987 a 1990, 1994 e 2019 estão incompletos. Portanto, serão descartados da análise.

Logo, os anos válidos para a investigação estão compreendidos entre 1995 a 2018, com exceção de 2000 e 2001, uma vez que contêm dados sobre os 12 meses de cada ano para ambas as cidades.

Recriando a tabela 'climas' com o conjunto válido de dados:

```{r}
climas = climas %>% 
    filter(ano > 1994 & ano < 2019 & ano != 2000 & ano != 2001)

cg = climas %>% 
    filter(cidade == "Campina Grande")

jp = climas %>% 
    filter(cidade == "João Pessoa")

paged_table(climas)
```

------------------------------------------------------------------------

## Questões

### Q1: Qual a cidade é mais quente? Isso muda se considerarmos apenas o período de janeiro e fevereiro (pico do verão)?

-   Investigando a cidade mais quente:

Observando o comportamento da temperatura nas duas cidades:

1.  Plotando histograma, gráfico de densidade, bloxplot e apresentando sumários sobre a **temperatura média** das duas cidades

```{r}
# histograma
hist_temperaturaCG = cg %>% 
    ggplot(aes(x = tmedia)) +
    geom_histogram(binwidth = .5, color = "#FCC8C5", fill = "#FCC8C5") +
    labs(x = "Temperatura Média (ºC)", y = "Frequência") 

hist_temperaturaJP = jp %>% 
    ggplot(aes(x = tmedia)) + 
    geom_histogram(binwidth = .5, color = "#99E5E7", fill = "#99E5E7") +
    labs(x = "Temperatura Média (ºC)", y = "Frequência")

grid.arrange(hist_temperaturaCG, hist_temperaturaJP, ncol = 2)

# densidade
dens_temperaturaCG = cg %>% 
    ggplot(aes(x = tmedia)) + 
    geom_density(fill = "#FCC8C5") +
    labs(x = "Temperatura Média (ºC)", y = "Densidade")  

dens_temperaturaJP = jp %>% 
    ggplot(aes(x = tmedia)) + 
    geom_density(fill = "#99E5E7") +
    labs(x = "Temperatura Média (ºC)", y = "Densidade") 

grid.arrange(dens_temperaturaCG, dens_temperaturaJP, ncol = 2)

# boxplot
box_temperaturaCG = cg %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)")

box_temperaturaJP = jp %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)")

grid.arrange(box_temperaturaCG, box_temperaturaJP, ncol = 2)
```

- Histograma: É mostrado que existe uma frequência maior de temperaturas médias para Campina Grande entre 25ºC e 26C. Já para João Pessoa, entre 28ºC e 29ºC. Em ambas, existe uma tendência de suas temperaturas mais frequentes serem menores que os respectivos valores apontados como mais frequentes.

- Densidade: Confirma a informação mostrada no histograma.

- Boxplot: Para Campina Grande, 75% das medições para a temperatura média estão abaixo de 25,82ºC. Para João Pessoa, 75% das medições para a temperatura média estão abaixo de 28,64ºC.

Sumário para temperatura média de Campina Grande:

```{r}
summary(cg$tmedia)
```
Para Campina Grande, há uma variação de temperaturas médias de 20ºC a 28ºC, aproximadamente, com mediana e média em aproximadamente 25ºC.

Sumário para temperatura média de João Pessoa:

```{r}
summary(jp$tmedia)
```
Para João Pessoa, há uma variação de temperaturas médias de 24ºC a 30ºC, aproximadamente, com mediana e média em aproximadamente 28ºC.

Isto indica que Campina Grande tem uma **temperatura média** mais frequentemente **menor** que João Pessoa.

2.  Plotando bloxplot e apresentando sumários sobre a **temperatura mínima** das duas cidades

```{r}
# boxplot
box_temperaturaMinCG = cg %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)")

box_temperaturaMinJP = jp %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)")

grid.arrange(box_temperaturaMinCG, box_temperaturaMinJP, ncol = 2)
```

Sumário para temperatura mínima de Campina Grande:

```{r}
summary(cg$tmin)
```

Para Campina Grande, há uma variação de temperaturas mínimas de 15ºC a 23ºC, aproximadamente, com mediana e média em aproximadamente 19,5ºC. Ainda, 75% dos valores estão abaixo de 20,3ºC.

Sumário para temperatura mínima de João Pessoa:

```{r}
summary(jp$tmin)
```

Para João Pessoa, há uma variação de temperaturas mínimas de 15ºC a 26ºC, aproximadamente, com mediana e média em aproximadamente 22,5ºC. Ainda, 75% dos valores estão abaixo de 23,7ºC.

Isto indica que Campina Grande tem uma **temperatura mínima** mais frequentemente **menor** que João Pessoa.

3.  Plotando bloxplot e apresentando sumários sobre a **temperatura máxima** das duas cidades

```{r}
# boxplot
box_temperaturaMaxCG = cg %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

box_temperaturaMaxJP = jp %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

grid.arrange(box_temperaturaMaxCG, box_temperaturaMaxJP, ncol = 2)
```

Sumário para temperatura máxima de Campina Grande:

```{r}
summary(cg$tmax)
```

Para Campina Grande, há uma variação de temperaturas máximas de 25ºC a 35ºC, aproximadamente, com mediana e média em aproximadamente 30,5ºC. Ainda, 75% dos valores estão abaixo de 31,9ºC.

Sumário para temperatura máxima de João Pessoa:

```{r}
summary(jp$tmax)
```

Para Campina Grande, há uma variação de temperaturas mínimas de 27ºC a 34ºC, aproximadamente, com mediana e média em aproximadamente 31,8ºC. Ainda, 75% dos valores estão abaixo de 31,6ºC.

Isto indica que para **temperaturas máximas** Campina Grande e João Pessoa são praticamente **equivalentes**, com a primeira tendo uma maior variação de valores para esta medição.

Agora, mostrando informações sobre temperatura de ambas as cidades anualmente. A temperatura média é o resultado da média entre os valores calculados para a temperatura média por ano. O pico de temperatura mínima é o mínimo do conjunto de valores calculados para a temperatura mínima. Já o pico de temperatura máxima é o máximo do conjunto de valores calculados para a temperatura máxima.

4.  Gráfico de Linhas para a média da temperatura média anual

```{r}
line_pico = pico %>% 
    group_by(cidade, ano) %>%
    summarise(tmediaAno = round(mean(tmedia),2),
              tminAno = min(tmin),
              tmaxAno = max(tmax),
              .groups = "drop")

line_pico %>% 
    ggplot(aes(x = ano, y = tmediaAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(y = "Temperatura Média (ºC)")
```

João Pessoa demonstra ter uma **temperatura média anual MAIOR** que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 4ºC em alguns anos.

5.  Gráfico de Linhas para o pico da temperatura mínima anual

```{r}
line_pico %>% 
    ggplot(aes(x = ano, y = tminAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(y = "Pico de Temperatura Mínima (ºC)")
```

João Pessoa demonstra ter uma **temperatura mínima anual MAIOR** que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 5ºC em alguns anos.

6.  Gráfico de Linhas para o pico da temperatura máxima anual

```{r}
line_pico %>% 
    ggplot(aes(x = ano, y = tmaxAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(y = "Pico de Temperatura Máxima (ºC)")
```

Campina Grande demonstra ter uma **temperatura máxima anual MAIOR** que João Pessoa entre 1995 e 2015, ano a partir do qual passa a ser MENOR. É válido destacar que a diferença de temperatura não ultrapassou 2ºC em nenhum dos anos.

**RESPOSTA:**

De forma geral, Campina Grande tem uma maior variação de temperatura ao longo do dia do que João Pessoa, mas esta permanece o dia com temperaturas mais elevadas que aquela, o que torna **João Pessoa uma cidade mais quente**. 

Analisando ano por ano, Campina Grande demonstrou ter em relação a João Pessoa: (i) *temperatura média menor*, com cerca de 4ºC a menos em alguns anos; (ii) ter *temperatura mínima menor*, com cerca de 5ºC a menos em alguns anos; e (iii) ter * temperatura máxima maior*, com cerca de apenas 2ºC a mais em alguns anos. Isto confirma **João Pessoa como uma cidade mais quente** do que Campina Grande.


-------------------------------------------------------------------------------------------------------------------

-   Investigando o Pico de Verão (Janeiro e Fevereiro):

Considerando apenas os meses de Janeiro e Fevereiro para a análise a seguir:

```{r}
pico = climas %>% 
    filter(mes == 1 | mes == 2)

picoCG = cg %>% 
    filter(mes == 1 | mes == 2)

picoJP = jp %>% 
    filter(mes == 1 | mes == 2)
```

1. Visualizando os boxplots da **temperatura média** para cada cidade referentes a todos os meses de Janeiro e Fevereiro.

```{r}
# boxplot
box_picoVeraoCG = picoCG %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)") 

box_picoVeraoJP = picoJP %>% 
    ggplot(aes(x = cidade, y = tmedia)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Média (ºC)")

grid.arrange(box_picoVeraoCG, box_picoVeraoJP, ncol = 2) 
```

Sumário da temperatura média para os meses de Janeiro e Fevereiro de Campina Grande

```{r}
summary(picoCG$tmedia)
```
Para Campina Grande, há uma variação de temperaturas médias de 23ºC a 28ºC, aproximadamente, com mediana e média em aproximadamente 26ºC. Ainda, 75% dos valores estão abaixo de 26,54ºC.

Sumário da temperatura média para os meses de Janeiro e Fevereiro de João Pessoa

```{r}
summary(picoJP$tmedia)
```

Para João Pessoa, há uma variação de temperaturas médias de 26ºC a 30ºC, aproximadamente, com mediana e média em aproximadamente 29ºC. Ainda, 75% dos valores estão abaixo de 29,11ºC.

Isto indica que Campina Grande tem uma **temperatura média** mais frequentemente **menor** que João Pessoa.

2. Visualizando os boxplots da **temperatura mínima** para cada cidade referentes a todos os meses de Janeiro e Fevereiro.

```{r}
box_picoVeraoMinCG = picoCG %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)") 

box_picoVeraoMinJP = picoJP %>% 
    ggplot(aes(x = cidade, y = tmin)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Mínima (ºC)")

grid.arrange(box_picoVeraoMinCG, box_picoVeraoMinJP, ncol = 2)
```

Sumário da temperatura mínima para os meses de Janeiro e Fevereiro de Campina Grande

```{r}
summary(picoCG$tmin)
```

Para Campina Grande, há uma variação de temperaturas mínimas de 18ºC a 22,5ºC, aproximadamente, com mediana e média em aproximadamente 20,4ºC. Ainda, 75% dos valores estão abaixo de 21ºC.

Sumário da temperatura mínima para os meses de Janeiro e Fevereiro de João Pessoa

```{r}
summary(picoJP$tmin)
```

Para João Pessoa, há uma variação de temperaturas mínimas de 21ºC a 27ºC, aproximadamente, com mediana e média em aproximadamente 23,7ºC. Ainda, 75% dos valores estão abaixo de 24,27ºC.

Isto indica que Campina Grande tem uma **temperatura mínima** mais frequentemente **menor** que João Pessoa.

3. Visualizando os boxplots da **temperatura máxima** para cada cidade referentes a todos os meses de Janeiro e Fevereiro.

```{r}
box_picoVeraoMaxCG = picoCG %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

box_picoVeraoMaxJP = picoJP %>% 
    ggplot(aes(x = cidade, y = tmax)) + 
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Temperatura Máxima (ºC)")

grid.arrange(box_picoVeraoMaxCG, box_picoVeraoMaxJP, ncol = 2)
```

Sumário da temperatura máxima para os meses de Janeiro e Fevereiro de Campina Grande

```{r}
summary(picoCG$tmax)
```

Para Campina Grande, há uma variação de temperaturas máximas de 28ºC a 34ºC, aproximadamente, com mediana e média em aproximadamente 32ºC. Ainda, 75% dos valores estão abaixo de 32,7ºC.

Sumário da temperatura máxima para os meses de Janeiro e Fevereiro de João Pessoa

```{r}
summary(picoJP$tmax)
```

Para João Pessoa, há uma variação de temperaturas máximas de 30ºC a 34ºC, aproximadamente, com mediana e média em aproximadamente 31,6ºC. Ainda, 75% dos valores estão abaixo de 32ºC.

Isto indica que para temperaturas máximas Campina Grande e João Pessoa são praticamente equivalentes, com a primeira tendo uma maior variação de valores para esta medição.

Agora, mostrando informações sobre temperatura de ambas as cidades anualmente. A temperatura média é o resultado da média entre os valores calculados para a temperatura média por ano. O pico de temperatura mínima é o mínimo do conjunto de valores calculados para a temperatura mínima. Já o pico de temperatura máxima é o máximo do conjunto de valores calculados para a temperatura máxima. 


4. Gráfico de Linhas para a média da temperatura média referente ao pico do verão por ano

```{r}
line_pico = pico %>% 
    group_by(cidade, ano) %>%
    summarise(tmediaAno = round(mean(tmedia),2),
              tminAno = min(tmin),
              tmaxAno = max(tmax),
              .groups = "drop")

line_pico %>% 
    ggplot(aes(x = ano, y = tmediaAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(x = "Ano", y = "Temperatura Média (ºC)")

```

João Pessoa demonstra ter uma **temperatura média anual MAIOR** que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 4ºC em alguns anos.

5. Gráfico de Linhas para o mínimo da temperatura mínima referente ao pico do verão por ano

```{r}
line_pico %>% 
    ggplot(aes(x = ano, y = tminAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(x = "Ano", y = "Temperatura Mínima (ºC)")
```

João Pessoa demonstra ter uma **temperatura mínima anual MAIOR** que Campina Grande em todos os anos investigados. A diferença de temperatura entre ambas chegou a 5ºC em alguns anos.

6. Gráfico de Linhas para o máximo da temperatura máxima referente ao pico do verão por ano

```{r}
line_pico %>% 
    ggplot(aes(x = ano, y = tmaxAno, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxAno), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    labs(x = "Ano", y = "Temperatura Máxima (ºC)")
```

Campina Grande demonstra ter uma temperatura máxima anual MAIOR que João Pessoa entre 1995 e 2015, ano a partir do qual passa a ser menor. É válido destacar que a diferença de temperatura não ultrapassou 2ºC em nenhum dos anos.

**RESPOSTA:**

De forma geral, Campina Grande tem uma maior variação de temperatura ao longo do dia do que João Pessoa, mas esta permanece o dia com temperaturas mais elevadas que aquela, o que torna **João Pessoa uma cidade mais quente** também no Pico do Verão.

Analisando ano por ano, Campina Grande demonstrou ter em relação a João Pessoa: (i) *temperatura média menor*, com cerca de 4ºC a menos em alguns anos; (ii) ter *temperatura mínima menor*, com cerca de 5ºC a menos em alguns anos; e (iii) ter * temperatura máxima maior*, com cerca de apenas 2ºC a mais em alguns anos. Isto confirma **João Pessoa como uma cidade mais quente** do que Campina Grande também no Pico do Verão.

Por fim, foi percebido que existe comportamento idêntico na variação de temperaturas entre as duas cidades, identificado tanto de forma geral e anualmente, como considerando apenas o pico do verão (janeiro e fevereiro) de maneira geral e por ano também. Logo, João Pessoa é mais quente do que Campina Grande tanto no pico do verão quanto no ano todo desde 1995, exceto nos anos de 2000 e 2001 em razão da falta de dados sobre estes respectivos anos.

----------------------------------------------------------------------------------

### Q2: Quais os meses mais quentes e mais frios? Como você descreveria a temperatura das festas juninas das cidades nos últimos anos?

-   Investigando a temperatura em diferentes meses do ano

1. Gráfico de Linhas para a média da temperatura média mensal

```{r}
line_temperaturaMes = climas %>% 
    group_by(cidade, mes) %>%
    summarise(tmediaMes = round(mean(tmedia),2),
              tmaxMes = max(tmax),
              tminMes = min(tmin),
              .groups = "drop")

line_temperaturaMes %>% 
    ggplot(aes(x = mes, y = tmediaMes, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaMes), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Mês", breaks = 1:12) +
    labs(y = "Temperatura Média (ºC)") 
```

João Pessoa demonstra ter uma **temperatura média mensal MAIOR** que Campina Grande em todos os meses investigados. A diferença de temperatura manteve um padrão de cerca de 3ºC ao longo dos meses. Na média, março é o mês mais quente e julho é o mês mais frio para as duas cidades.

2. Gráfico de Linhas para o máximo de temperatura máxima mensal

```{r}
line_temperaturaMes %>% 
    ggplot(aes(x = mes, y = tmaxMes, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxMes), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Mês", breaks = 1:12) +
    labs(y = "Temperatura Máxima (ºC)") 
```

Campina Grande demonstra ter uma **temperatura máxima mensal MAIOR** que Campina Grande na maioria dos meses investigados, com exceção dos meses de Maio e Junho onde foi MENOR. A diferença de temperatura foi bastante variada ao longo dos meses.

Para João Pessoa, o pico de temperatura máxima foi identificado nos meses de janeiro e março. Para Campina Grande, o pico de temperatura máxima foi identificado no mês março.

3. Gráfico de Linhas para o mínimo de temperatura mínima mensal

```{r}
line_temperaturaMes %>% 
    ggplot(aes(x = mes, y = tminMes, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminMes), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Mês", breaks = 1:12) +
    labs(y = "Temperatura Mínima (ºC)") 
```

João Pessoa demonstra ter uma **temperatura mínima mensal MAIOR** que Campina Grande em todos os meses investigados. A diferença de temperatura entre ambas chegou a 3ºC em alguns meses.

Para João Pessoa, a menor temperatura mínima foi identificada no mês de agosto. Para Campina Grande, as menores temperaturas mínimas foram identificadas nos meses de julho e agosto.

**RESPOSTA:**

Ao longo dos meses do ano, João Pessoa é mais quente do que Campina Grande. Entretanto, no mês de junho, Campina Grande obtém temperaturas menores do que João Pessoa tanto para a média, quanto para a mínima e máxima. Logo, Campina Grande costuma estar mais fria no mês de junho.

Na média, março é o mês mais quente e julho é o mês mais frio para as duas cidades. As menores temperaturas estão nos meses de julho, somente para Campina Grande, e em agosto, para ambas as cidades. Já as maiores temperaturas estão nos meses de janeiro, apenas para Campina Grande, e em março, para as duas cidades.

----------------------------------------------------------------------------------------------

-   Investigando a temperatura durante as festas juninas (mês de junho) dos últimos 10 anos: Entre 2008 e 2018

Repetindo o processo anterior feito para a análise de temperaturas mensais, agora considerando apenas o mês de Junho e os anos compreendidos entre 2008 e 2018 (os últimos 10 anos da base de dados).

```{r}
temperaturaJunho = climas %>% 
    filter(mes == 6 & ano > 2007)

temperaturaJunho = temperaturaJunho %>% 
    group_by(cidade, ano) %>%
    summarise(tmediaAno6 = round(mean(tmedia),2),
              tmaxAno6 = max(tmax),
              tmedmaxAno6 = round(mean(tmax),2),
              tminAno6 = min(tmin),
              tmedminAno6 = round(mean(tmin),2),
              .groups = "drop")

temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmediaAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmediaAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Temperatura Média de Junho (ºC)") 

temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmaxAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmaxAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Temperatura Máxima de Junho (ºC)") 

temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmedmaxAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmedmaxAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Média da Temperatura Máxima de Junho (ºC)") 

temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tminAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tminAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous("Anos", breaks = 2008:2018) +
    labs(x = "Ano", y = "Temperatura Mínima de Junho (ºC)") 

temperaturaJunho %>% 
    ggplot(aes(x = ano, y = tmedminAno6, color = cidade)) +
    geom_point() +
    geom_line() +
    geom_text(aes(label = tmedminAno6), hjust = 0.5, vjust = -1, size = 3, angle = 90) +
    scale_x_continuous(breaks = 2008:2018) +
    labs(x = "Ano", y = "Média da Temperatura Mínima de Junho  (ºC)") 
```

**RESPOSTA:**

Considerando os últimos 10 anos da base de dados, anos compreendidos entre 2008 e 2018, pode-se apontar que Campina Grande permaneceu mais fria do que João Pessoa no mês de junho, com uma diferença de cerca de 4ºC vários anos. 

Campina Grande ser mais fria que João Pessoa no mês de junho é válido tanto para as medições de temperaturas mínimas e máximas quanto para as médias das temperaturas mínima, média e máxima.

-------------------------------------------------------------------------------------

### Q3: Quanto chove por semana em JP e CG? Descreva a distribuição do volume de chuvas para as cidades?

Observando o comportamento das chuvas nas duas cidades:

1. Plotando histograma, gráfico de densidade, bloxplot e apresentando sumários sobre o índice de chuvas das duas cidades

```{r}

hist_chuvasCG = cg %>%
    ggplot(aes(x = chuva)) +
    geom_histogram(binwidth = 10, color = "#FCC8C5", fill = "#FCC8C5") +
    labs(x = "Índice de Chuvas (mm)", y = "Frequência") 

hist_chuvasJP = jp %>%
    ggplot(aes(x = chuva)) +
    geom_histogram(binwidth = 10, color = "#99E5E7", fill = "#99E5E7") +
    labs(x = "Índice de Chuvas (mm)", y = "Frequência") 

grid.arrange(hist_chuvasCG, hist_chuvasJP, ncol = 2)

dens_chuvasCG = cg %>%
    ggplot(aes(x = chuva)) +
    geom_density(fill = "#FCC8C5") +
    labs(x = "Índice de Chuvas (mm)", y = "Densidade")  

dens_chuvasJP = jp %>%
    ggplot(aes(x = chuva)) +
    geom_density(fill = "#99E5E7") +
    labs(x = "Índice de Chuvas (mm)", y = "Densidade") 

grid.arrange(dens_chuvasCG, dens_chuvasJP, ncol = 2)

box_chuvasCG = cg %>%
    ggplot(aes(x = cidade, y = chuva)) +
    geom_boxplot(coef = 1000, width = .2, fill = "#FCC8C5") +
    labs(x = "Cidade", y = "Índice de Chuvas (mm)")

box_chuvasJP = jp %>%
    ggplot(aes(x = cidade, y = chuva)) +
    geom_boxplot(coef = 1000, width = .2, fill = "#99E5E7") +
    labs(x = "Cidade", y = "Índice de Chuvas (mm)")

grid.arrange(box_chuvasCG, box_chuvasJP, ncol = 2)
```
 
- Histograma: É mostrado que existe uma frequência maior de chuvas abaixo de 50mm para Campina Grande e de 100mm para João Pessoa. A maior chuva para a Campina Grande não passou de 200mm, enquanto que João Pessoa teve algumas chuvas maiores do que 200mm chegando a ultrapassar 350mm de chuva. É válido destacar que estas medições indicão valores semanais.

- Densidade: Confirma a informação mostrada no histograma.

- Boxplot: Para Campina Grande, 75% dos índices semanais de chuva estão abaixo de 25mm. Para João Pessoa, 75% das medições para chuvas estão abaixo de 50mm. Além disso, ambas possuem índices de chuva muito maiores do que as suas respectivas medianas.

```{r}
summary(cg$chuva)
```

Para Campina Grande, há uma variação de chuvas de 0mm a 192mm, aproximadamente, com mediana equivalente a 5,05mm e média igual 14,22mm. A diferença entre o 3º quartil e o valor máximo é muito grande, mostrando uma distribuição irregular dos dados. Os valores de média e mediana não são bem representativos.

```{r}
summary(jp$chuva)
```

Para João Pessoa, há uma variação de chuvas de 0mm a 352mm, aproximadamente, com mediana equivalente a 14,5mm e média igual 33,59mm. A diferença entre o 3º quartil e o valor máximo é muito grande (maior ainda do que para Campina Grande), mostrando uma distribuição ainda mais irregular dos dados. Os valores de média e mediana não são bem representativos.

**RESPOSTA:**

Para Campina Grande, 75% dos índices semanais de chuva estão abaixo de 25mm. Para João Pessoa, 75% das medições para chuvas estão abaixo de 50mm. Além disso, ambas possuem índices de chuva muito maiores do que as suas respectivas medianas. Isto é, existe uma distribuição muito irregular de chuvas, de maneira geral. A diferença entre o 3º quartil e o valor máximo é muito grande (maior ainda em João Pessoa), mostrando distribuições irregulares dos dados. Os valores de média e mediana não são bem representativos.

------------------------------------------------------------------------

### Q4: Qual a relação entre a temperatura de uma semana e a temperatura da semana anterior (descreva para as duas cidades)?

Visualizando graficamente os dados sobre temperaturas médias e sua semana imediatamente anterior para verificar a possibilidade de correlação.

1. Gráfico de Pontos de Temperatura Média X Temperatura Média da Semana Anterior

```{r}
relacaoTemperatura = climas

relacaoTemperatura %>% 
    ggplot(aes(x = tmedia, y = temp_anterior, color = cidade)) +
    geom_quasirandom(alpha = .5, size = 1) +
    labs(x = "Temperatura Média (ºC)", y = "Temperatura Média da Semana Anterior (ºC)")
```

Visualmente, nota-se que existe uma relação linear entre a temperatura média e a temperatura média da sua semana imediatamente anterior, tanto para Campina Grande, quanto para João Pessoa. Isto significa que a temperatura média de uma semana específica foi semelhante à temperatura média de sua semana imediatamente anterior.

Para valores menores de temperaturas, Campina Grande destaca-se mais, ao passo que para maiores temperaturas, João Pessoa destaca-se mais.

Verificando os valores de correlação para os coeficientes de *pearson*, *spearman* e *kendall* para as duas cidades.

```{r}
correlacaoTemperaturaCG = cg 

correlacaoTemperaturaCG %>% 
    summarise(pearson = cor(tmedia, temp_anterior, method = "pearson"),
              spearman = cor(tmedia, temp_anterior, method = "spearman"),
              kendall = cor(tmedia, temp_anterior, method = "kendall"))
```

Para Campina Grande, todos os três coeficientes calculados apontaram uma correlação positiva alta entre a temperatura média e a temperatura média de sua semana imediatamente anterior.

```{r}
correlacaoTemperaturaJP = jp 

correlacaoTemperaturaJP %>% 
    summarise(pearson = cor(tmedia, temp_anterior, method = "pearson"),
              spearman = cor(tmedia, temp_anterior, method = "spearman"),
              kendall = cor(tmedia, temp_anterior, method = "kendall"))
```

Para João Pessoa, todos os três coeficientes calculados apontaram uma correlação positiva alta entre a temperatura média e a temperatura média de sua semana imediatamente anterior.

Agora, verificando o sumário entre as temperaturas para as duas cidades.

```{r}
relacaoTemperaturaCG = cg

summary(relacaoTemperaturaCG$tmedia, relacaoTemperaturaCG$temp_anterior)
```

Para Campina Grande, a média e a mediana obtiveram valores muito próximos e não estão distantes dos seus pontos máximo e mínimo, o que mostra uma distribuição regular dos dados.

```{r}
relacaoTemperaturaJP = jp

summary(relacaoTemperaturaJP$tmedia, relacaoTemperaturaJP$temp_anterior)
```

Para João Pessoa, a média e a mediana obtiveram valores muito próximos e não estão distantes dos seus pontos máximo e mínimo, o que mostra uma distribuição regular dos dados.

**RESPOSTA:**

Pode-se perceber que existe uma relação linear e de alta correlação entre a temperatura média e a temperatura média da sua semana imediatamente anterior, tanto para Campina Grande, quanto para João Pessoa. Isto significa que a temperatura média de uma semana específica foi semelhante à temperatura média de sua semana imediatamente anterior. 

A diferença está nos valores das temperaturas, onde Campina Grande apresenta valores mais baixos do que João Pessoa. Contudo, ambas possuem um comportamento semelhante para as temperaturas médias e as temperaturas médias da semana imediatamente anterior.


----------------------------------------------------------------------------------------

### Q5: Qual a relação entre temperatura e chuvas nas semanas em que choveu (descreva para as duas cidades)?

Visualizando graficamente os dados sobre temperaturas médias e chuvas para verificar a possibilidade de correlação.

1. Gráfico de Pontos de Temperatura Média X Índice de Chuvas

```{r}
relacaoTemperaturaChuva = climas

relacaoTemperaturaChuva %>% 
    ggplot(aes(x = tmedia, y = chuva, color = cidade)) +
    geom_quasirandom(alpha = .5, size = 1) +
    labs(x = "Temperatura Média (ºC)", y = "Índice de Chuvas (mm)")
```

Não é possível observar visualmente alguma correlação entre temperatura média e índice de chuvas em nenhuma das cidades. O que pode ser visto é apenas que para valores menores de temperaturas, Campina Grande destaca-se mais, ao passo que para maiores temperaturas, João Pessoa destaca-se mais.

Verificando os valores de correlação para os coeficientes de *pearson*, *spearman* e *kendall* para as duas cidades.

```{r}
correlacaoTemperaturaChuvasCG = cg 

correlacaoTemperaturaChuvasCG %>% 
    summarise(pearson = cor(tmedia, chuva, method = "pearson"),
              spearman = cor(tmedia, chuva, method = "spearman"),
              kendall = cor(tmedia, chuva, method = "kendall"))
```

Para Campina Grande, os coeficientes calculados apontaram uma correlação negativa fraca (*pearson* e *kendall*) e negativa moderada (*spearman*) entre a temperatura média e o índice de chuvas.

```{r}
correlacaoTemperaturaChuvasJP = jp 

correlacaoTemperaturaChuvasJP %>% 
    summarise(pearson = cor(tmedia, chuva, method = "pearson"),
              spearman = cor(tmedia, chuva, method = "spearman"),
              kendall = cor(tmedia, chuva, method = "kendall"))
```

Para Campina Grande, todos os três coeficientes calculados apontaram uma correlação negativa fraca entre a temperatura média e o índice de chuvas.

Agora, verificando o sumário entre as temperaturas e os índices de chuvas para as duas cidades.

```{r}
relacaoTemperaturaChuvaCG = cg

summary(relacaoTemperaturaChuvaCG$chuva, relacaoTemperaturaChuvaCG$tmedia)
```

Para Campina Grande, a média e a mediana obtiveram valores não próximos, não estão próximas do valor mínimo e estão muito distantes do seu ponto máximo, o que mostra uma distribuição irregular dos dados.

```{r}
relacaoTemperaturaChuvaJP = jp

summary(relacaoTemperaturaChuvaJP$chuva, relacaoTemperaturaChuvaJP$tmedia)
```

Para João Pessoa, a média e a mediana obtiveram valores não próximos, não estão próximas do valor mínimo e estão muito distantes do seu ponto máximo, o que mostra uma distribuição irregular dos dados. Neste caso, a irregularidade é ainda maior que em Campina Grande.

**RESPOSTA:**

Não é possível observar alguma correlação entre temperatura média e índice de chuvas em nenhuma das cidades. O que pode ser visto é apenas que para valores menores de temperaturas, Campina Grande destaca-se mais, ao passo que para maiores temperaturas, João Pessoa destaca-se mais.

Os coeficientes de *pearson*, *spearman* e *kendall* apontaram uma correlação negativa fraca entre temperatura média e índice de chuvas para as duas cidades, no geral. Além disso, a variação de dados mostra irregularidade também nas duas cidades.

Logo, não é possível afirmar que existe correlação entre temperatura média e índice de chuvas para as cidades de Campina Grande e João Pessoa. Por exemplo, pode chover em dias quentes e frios e também pode não chover em dias quentes e frios. Isto dificulta a identificação de uma relação entre a temperatura média e o índice de chuvas.
