library(tidyverse)
library(here)
library(skimr)
library(hrbrthemes)
options(knitr.table.format = "html")
library(ggpubr)

Vamos começar lendo novamente nossos dados dos climas das cidades da Paraiba, iremos continuar analisando as cidades de:

dados_raw = read_csv(
    here("data/tempo-jp-cg-pt.csv"),
    col_types = cols(
        .default = col_double(),
        cidade = col_character(),
        semana = col_date(format = ""),
        ano = col_integer(),
        mes = col_integer()
    )
)

Buscando correlação entre temperaturas na mesma cidade.

Que tal buscarmos observar se é possivel encontrar alguma correlação entre a temperatura de uma semana e a temperatura da semana passada nas 3 cidades, quem sabe possamos descobrir qual delas possui o clima mais crazy !?

Podemos tentar visualizar essa informação através de um gráfico temporal

campina = dados_raw %>% 
    filter(cidade == 'Campina Grande', ano == 2019) %>% 
    mutate(temp_anterior = lag(temp_media, n = 1)) %>% 
    filter(!is.na(temp_anterior), !is.na(temp_media))

patos = dados_raw %>% 
    filter(cidade == 'Patos', ano == 2019) %>% 
    mutate(temp_anterior = lag(temp_media, n = 1)) %>% 
    filter(!is.na(temp_anterior), !is.na(temp_media))

jpessoa = dados_raw %>% 
    filter(cidade == 'João Pessoa', ano == 2019) %>% 
    mutate(temp_anterior = lag(temp_media, n = 1)) %>% 
    filter(!is.na(temp_anterior), !is.na(temp_media))

Campina Grande

Encontrei essa visualização esses dias e juro que quebrei a cabeça pra tentar entender, mas achei legal usar para mostrar a autocorrelação da temperatura de Campina Grande no ano de 2019, oque mais precisamos atentar nesse gráfico é em relação a reta diagonal. É possível observar que as temperaturas atuais e com atraso de 1 dia possuem correlações altas, é interessante ver também que essa correlação se apresenta nos dias em que a temperatura é alta, já nos dias mais frios é mais facil voltarmos para um dia quente, devido a baixa correlação. Que pena =/ i love frio.

lag.plot(campina$temp_media,
         lag=1, 
         main = "Média das temperaturas em Campina Grande", 
         diag.col = "red",
         labels=FALSE)

Bom, pra não dizer que só porque sou Campina-grandense. Que tal visualizarmos o mesmo para Patos e João Pessoa ?

Patos

lag.plot(patos$temp_media,
         lag=1, 
         main = "Média das temperaturas em Patos", 
         diag.col = "red",
         labels=FALSE)

Para Patos é interessante também! podemos ver que os dias com temperaturas mais altas possuem mais correlação que dias mais amenos kkk.

João Pessoa

lag.plot(jpessoa$temp_media,
         lag=1, 
         main = "Média das temperaturas em João Pessoa", 
         diag.col = "red",
         labels=FALSE)

Aqui a tendencia continua, a variabilidade entre dias quentes parece ser baixa em todas as cidades, mas especialmente em João Pessoa, podemos ver mais claramente os dias frios com baixa correlação.

Para finalizar vamos tentar quantificar essa correlação entre a temperatura da semana passada e a atual.

dados_raw %>% 
    mutate(temp_anterior = lag(temp_media, n = 1)) %>% 
    filter(!is.na(temp_anterior), !is.na(temp_media)) %>% 
    group_by(cidade) %>% 
    summarise(correlacoes = cor(temp_media, temp_anterior))

São valores muitos altos de correlação positiva! creio que isso seria meio lógico devido a serem dados referentes a mesma cidade em uma lag muito baixo, de apenas 1 dia, ou até mesmo por serem dados sazonais.

Que tal agora tentarmos ver relação entre variáveis diferentes ?

Podemos tentar descrever a relação entre a temperatura e chuvas nas semanas em que choveu nas 3 cidades :)

Campina Grande

Bem, como de costume vamos começar com Campina Grande.

campina %>% 
    ggscatter(x = "temp_media", y = "chuva", 
              add = "reg.line", conf.int = TRUE, 
              cor.coef = TRUE, cor.method = "pearson",
              xlab = "Temperatura Média (C°)", ylab = "Chuvas (mm)")
`geom_smooth()` using formula 'y ~ x'

O gráfico acima é bastante intuitivo e nos mostra através do valor de R, que nada mais é que o valor da correlação de pearson entre a temperatura e as chuvas na cidade, um valor negativo proximo a -1, ou seja quanto mais a temperatura aumenta é mais provavel que a quantidade de mm de chuva diminua, talvez chuvas finas de verão ? Em resumo temos:

  • Um formato de correlação entre as variáveis.
  • Um sinal negativo portanto uma correlação negativa.
  • Uma intensidade média/forte de correlação.
  • Pouquíssimos pontos extremos

Patos

Vamos analisar agora para a cidade de Patos.

patos %>% 
    ggscatter(x = "temp_media", y = "chuva", 
              add = "reg.line", conf.int = TRUE, 
              cor.coef = TRUE, cor.method = "pearson",
              xlab = "Temperatura Média (C°)", ylab = "Chuvas (mm)")
`geom_smooth()` using formula 'y ~ x'

Em Patos temos uma correlação mais baixa, próxima a zero, indicando que quase não há correlação entre as variáveis. talvez as chuvas em Patos, quando ocorrem, sejam explicadas por outros motivo ao invés da temperatura.

João Pessoa

Por fim, vamos observar agora como andam as coisas em João Pessoa.

jpessoa %>% 
    ggscatter(x = "temp_media", y = "chuva", 
              add = "reg.line", conf.int = TRUE, 
              cor.coef = TRUE, cor.method = "pearson",
              xlab = "Temperatura Média (C°)", ylab = "Chuvas (mm)")
`geom_smooth()` using formula 'y ~ x'

Aqui temos uma cidade intermediaria, mas bem parecida com oque ocorre em Campina Grande. É possível ver que em dias mais quentes ocorrem níveis de chuvas inferiores a dias mais frios. Mas como podemos ver o valor de correlação entre essas variaveis nessa cidade é médio.

