Pacotes
# Carregar pacotes-base do projeto
# Manipulação e datas
library(tidyverse);library(data.table);library(lubridate);library(patchwork);library(Hmisc)
Aviso: pacote ‘ggplot2’ foi compilado no R versão 4.4.3
Aviso: pacote ‘purrr’ foi compilado no R versão 4.4.3
── Attaching core tidyverse packages ──────────────────────────────────────────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.4 ✔ readr 2.1.5
✔ forcats 1.0.0 ✔ stringr 1.5.1
✔ ggplot2 3.5.2 ✔ tibble 3.2.1
✔ lubridate 1.9.3 ✔ tidyr 1.3.1
✔ purrr 1.1.0
── Conflicts ────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
Aviso: pacote ‘data.table’ foi compilado no R versão 4.4.3
data.table 1.17.8 usando 12 threads (veja ?getDTthreads). Últimas notícias: r-datatable.com
**********
Executando data.table em português; o suporte ao pacote está disponível apenas em inglês. Ao procurar ajuda online, certifique-se de verificar também a mensagem de erro em inglês. Isso pode ser obtido examinando os arquivos po/R-pt_BR.po e po/pt_BR.po no código-fonte do pacote, onde as mensagens de erro no idioma nativo e em inglês podem ser encontradas lado a lado. You can also try calling Sys.setLanguage('en') prior to reproducing the error message.
**********
Anexando pacote: ‘data.table’
Os seguintes objetos são mascarados por ‘package:lubridate’:
hour, isoweek, mday, minute, month, quarter, second, wday, week, yday, year
Os seguintes objetos são mascarados por ‘package:dplyr’:
between, first, last
O seguinte objeto é mascarado por ‘package:purrr’:
transpose
Registered S3 method overwritten by 'htmlwidgets':
method from
print.htmlwidget tools:rstudio
Anexando pacote: ‘Hmisc’
Os seguintes objetos são mascarados por ‘package:dplyr’:
src, summarize
Os seguintes objetos são mascarados por ‘package:base’:
format.pval, units
# Modelagem
library(mgcv);library(gratia);library(lubridate);library(modelsummary);library(gt);library(glue);library(scales);library(broom);library(broom.helpers);library(geobr)
Carregando pacotes exigidos: nlme
Anexando pacote: ‘nlme’
O seguinte objeto é mascarado por ‘package:dplyr’:
collapse
This is mgcv 1.9-1. For overview type 'help("mgcv-package")'.
Aviso: pacote ‘gratia’ foi compilado no R versão 4.4.3
Anexando pacote: ‘gratia’
O seguinte objeto é mascarado por ‘package:stringr’:
boundary
Aviso: pacote ‘modelsummary’ foi compilado no R versão 4.4.3
Anexando pacote: ‘modelsummary’
O seguinte objeto é mascarado por ‘package:Hmisc’:
Mean
Anexando pacote: ‘gt’
O seguinte objeto é mascarado por ‘package:Hmisc’:
html
Anexando pacote: ‘scales’
O seguinte objeto é mascarado por ‘package:purrr’:
discard
O seguinte objeto é mascarado por ‘package:readr’:
col_factor
Aviso: pacote ‘broom.helpers’ foi compilado no R versão 4.4.3
Aviso: pacote ‘geobr’ foi compilado no R versão 4.4.3
# Utilidades
library(scales);library(patchwork);library(knitr);library(kableExtra)
Anexando pacote: ‘kableExtra’
O seguinte objeto é mascarado por ‘package:dplyr’:
group_rows
# Definir opções globais de knitr
knitr::opts_chunk$set(
echo = TRUE,
message = TRUE,
warning = TRUE,
dpi = 120,
fig.align = "center",
fig.width = 12,
fig.height = 8
)
# Tema visual padrão
theme_article <- function(){
theme_minimal(base_size = 11) +
theme(
plot.title = element_text(face="bold"),
plot.subtitle = element_text(margin=margin(b=6)),
plot.caption = element_text(size=9, color="grey30"),
axis.title = element_text(),
panel.grid.minor = element_blank(),
legend.position = "top"
)
}
theme_set(theme_article())
set.seed(1234)
predict_gam_ci <- function(model, newdata, type = "link", level = 0.95){
stopifnot(inherits(model, "gam"))
pr <- predict(model, newdata = newdata, type = type, se.fit = TRUE)
alpha <- 1 - level
crit <- qnorm(1 - alpha/2)
tibble(
.fitted = as.numeric(pr$fit),
.se = as.numeric(pr$se.fit),
.lower = .fitted - crit*.se,
.upper = .fitted + crit*.se
)
}
export_figure <- function(p, filename, width = 7, height = 4.2){
ggsave(glue("figures/{filename}.pdf"), plot = p, width = width, height = height, dpi = 300, device = cairo_pdf)
ggsave(glue("figures/{filename}.eps"), plot = p, width = width, height = height, dpi = 300, device = "eps")
ggsave(glue("figures/{filename}.tiff"),plot = p, width = width, height = height, dpi = 600, compression = "lzw")
invisible(NULL)
}
export_table <- function(gt_obj, filename){
gtsave(gt_obj, filename = glue("tables/{filename}.html"))
# PNG (precisa webshot2 instalado/configurado)
try(gtsave(gt_obj, filename = glue("tables/{filename}.png")))
# LaTeX
try(gtsave(gt_obj, filename = glue("tables/{filename}.tex")))
invisible(NULL)
}
# Estilo padrão de tabela
gt_article <- function(dat, title = NULL, subtitle = NULL, note = NULL){
dat %>%
gt() %>%
tab_header(title = md(title %||% ""), subtitle = md(subtitle %||% "")) %>%
fmt_number(where(is.numeric), decimals = 2) %>%
tab_options(table.font.size = px(12)) %>%
opt_horizontal_padding(scale = 1.1) %>%
opt_vertical_padding(scale = 1.1) %>%
tab_source_note(md(note %||% "Notes: Author’s calculations."))
}
1. Introduction
This report documents the analytical pipeline developed to estimate
the climatic penalty (penalidade climática) on Brazil’s electricity
sector and to translate these effects into measurable economic costs.
The analysis was conducted using monthly data from 2001 to 2019,
covering all four subsystems of the National Interconnected System
(SIN).
The study proceeds through the following steps:
Hydrological modelling — We estimated the relationship between
climatic variables (precipitation, temperature, humidity, wind) and
stored energy (EAR) and hydroelectric generation using Generalized
Additive Models (GAMs). These models capture non-linear
climate–hydrology interactions and seasonal effects at the subsystem
level.
Climatic counterfactuals — Using the fitted GAMs, we simulated
counterfactual trajectories fixing the climatic covariates at their
historical mean levels (baseline 2001–2005). The deviation between
observed and counterfactual values isolates the share of variation
attributable exclusively to climate variability.
Climate penalty (ΔE) — The climate penalty was defined as \(ΔE=E_{predicted}−E_{cf}\) representing the
loss (or gain) of hydro generation due solely to climatic
fluctuations.
Elasticities — We derived elasticities linking generation to
hydrological and climatic conditions, and demand to price and income, to
assess sensitivity and potential transmission channels of climatic
shocks.
Cost translation — The estimated penalties were converted into
monetary terms along three cost dimensions:
Consumers: additional expenditure due to replacement of cheaper
hydro generation by more expensive sources;
Electricity sector: higher spot market prices (PLD) and
operational costs;
This empirical pipeline links climate variability, hydrological
performance, and economic outcomes through a unified statistical
framework, enabling a multidimensional valuation of climate-related
risks in a hydro-dependent power system.
2. Data Preparation
This section describes the construction of the analytical dataset
used to estimate the climatic penalty.
All variables were harmonized at the subsystem–day
level between 2001 and 2019, integrating hydrological, climatic, and
market information.
2.1 Data Sources
Hydropower generation (plant-day): daily
generation data compiled from ONS records, aggregated by
subsystem.
Reservoir levels and natural inflows (EAR and
ENA): subsystem-level daily data from ONS.
Climatic variables: precipitation and
temperature obtained from the ECMWF/CAMS reanalysis dataset,
interpolated to match subsystem centroids.
Spot price (PLD): weekly subsystem data from
CCEE.
Demand and generation dispatch by source:
monthly or weekly data from ONS and EPE.
All datasets were pre-processed to align date formats, harmonize
variable names, and remove inconsistent or missing identifiers.
2.2 Data Loading and Cleaning
# Load core datasets
ger <- read.csv("base_gera_tratada_set.csv") # plant-day generation
pld <- read.csv("preco_semanal.csv") # weekly spot price (PLD)
reserv <- read.csv("ena_ear_hidr_ceg_amb.csv") # reservoir levels & inflows (EAR/ENA)
# Convert character columns to factors
ger <- ger %>% mutate(across(where(is.character), as.factor))
reserv <- reserv %>% mutate(across(where(is.character), as.factor))
pld <- pld %>% mutate(across(where(is.character), as.factor))
# --- Date parsing and temporal variables ---
ger$date <- as.Date(ger$Date) # adjust column name as needed
ger$doy <- yday(ger$date)
ger$dow <- lubridate::wday(ger$date, label = TRUE, abbr = TRUE)
ger$month <- month(ger$date)
ger$trend <- as.numeric(ger$date)
reserv$date <- as.Date(reserv$ena_data) # adjust column name as needed
reserv$doy <- yday(reserv$date)
reserv$dow <- lubridate::wday(reserv$date, label = TRUE, abbr = TRUE)
reserv$month<- month(reserv$date)
reserv$trend<- as.numeric(reserv$date)
pld$date <- as.Date(pld$DATA_INICIO) # adjust column name as needed
pld$week <- isoweek(pld$date)
pld$year <- year(pld$date)
duplicadas <- duplicated(as.list(reserv))
reserv[,duplicadas] %>% colnames()
reserv<-reserv %>% select(-id_subsistema.x.x,-id_subsistema.y.y,-nom_bacia.x,-nom_bacia.x,-nom_ree.x,-nom_ree.y,-nom_usina.x,-nom_subsistema.y.y,-nom_bacia.y)
2.3 Temporal Smoothing and Rolling Means
To reduce short-term noise and capture cumulative climatic effects,
we computed rolling means (7, 14, and 30 days) for key
hydrological and climatic variables.
library(zoo)
Anexando pacote: ‘zoo’
Os seguintes objetos são mascarados por ‘package:data.table’:
yearmon, yearqtr
Os seguintes objetos são mascarados por ‘package:base’:
as.Date, as.Date.numeric
library(dplyr)
##diag_groups <- reserv %>%filter(tip_reservatorio=="Reservatório com Usina") %>%
# group_by(nom_reservatorio.x,id_reservatorio.x,tip_reservatorio) %>%
# summarise(
# n_total = n(),
# n_non_na_precip = sum(!is.na(preciptation)),
# n_non_na_temp = sum(!is.na(temperature)),
# n_non_na_ena = sum(!is.na(ena_bruta_res_mwmed)),
# n_non_na_ear = sum(!is.na(ear_reservatorio_subsistema_proprio_mwmes)),
# n_non_na_ger = sum(!is.na(val_geracao)),
# .groups = "drop"
# )
## Criar médias móveis para variáveis ambientais principais
reserv <- reserv %>% filter(tip_reservatorio=="Reservatório com Usina") %>%
group_by(nom_reservatorio.x) %>%
arrange(date, .by_group = TRUE) %>%
mutate(
# Precipitation (usa nome 'preciptation' como está na sua base)
#precip_mm7 = rollmean(preciptation, 7),
precip_mm14 = rollmean(preciptation, 14,fill = NA, align = "right"),
precip_mm30 = rollmean(preciptation, 30,fill = NA, align = "right"),
# Temperature
temp_mm7 = rollmean(temperature, 7,fill = NA, align = "right"),
temp_mm14 = rollmean(temperature, 14,fill = NA, align = "right"),
temp_mm30 = rollmean(temperature, 30,fill = NA, align = "right"),
# ENA
ena_mw7 = rollmean(ena_bruta_res_mwmed, 7,fill = NA, align = "right"),
#ena_mw14 = roll_mean_right(ena_bruta_res_mwmed, 14),
#ena_mw30 = roll_mean_right(ena_bruta_res_mwmed, 30),
# EAR (proprietário) — removeu fill="extend" (não suportado)
# ear_mw7 = roll_mean_right(ear_reservatorio_subsistema_proprio_mwmes, 7),
# Geração
ger_mw7 = rollmean(val_geracao, 7,fill = NA, align = "right"),
ger_mw14 = rollmean(val_geracao, 14,fill = NA, align = "right"),
ger_mw30 = rollmean(val_geracao, 30,fill = NA, align = "right")
) %>%
ungroup()
#diag_groups %>% filter(nom_reservatorio.x=="A. VERMELHA")
#
#reserv %>% filter(nom_reservatorio.x=="A. VERMELHA") %>%
# ggplot(aes(preciptation))+geom_line(aes(x=date,y=preciptation),col="lightblue")
# select(date,nom_estado,val_geracao,preciptation,
# #earmax_reservatorio_subsistema_jusante_mwmes,ear_reservatorio_subsistema_proprio_mwmes,ear_maxima_total_mwmes) %>% summary
# --- Conferir chaves principais ---
# verificar se datas e subsistemas batem
cat("Datas disponíveis:\n")
Datas disponíveis:
range(ger$date, na.rm=TRUE)
[1] "2000-01-01" "2018-12-31"
range(reserv$date, na.rm=TRUE)
[1] "2000-01-01" "2018-12-31"
range(pld$date, na.rm=TRUE)
[1] "2001-06-30" "2025-05-24"
2.4 Descriptive Summaries
library(dplyr)
library(tidyr)
library(gt)
library(purrr)
library(stringr)
# Helper: seleciona as variáveis exatas pedidas, se existirem no dataset
select_desc_vars <- function(df){
wanted <- tidyselect::vars_select(
names(df),
starts_with("ear"),
starts_with("tem"),
starts_with("pre"),
starts_with("ger"),
val_geracao,
val_geracao_day_subsistema,
humidity,
wind_speed
)
df %>% dplyr::select(nom_subsistema.x, dplyr::all_of(wanted))
}
# Helper: sumariza estatísticas para um data.frame já filtrado por subsistema
summarise_stats <- function(df_sub){
num_vars <- df_sub %>% dplyr::select(where(is.numeric))
dplyr::summarise(
num_vars,
dplyr::across(
.cols = everything(),
.fns = list(
Mean = ~mean(., na.rm = TRUE),
SD = ~sd(., na.rm = TRUE),
Min = ~min(., na.rm = TRUE),
Max = ~max(., na.rm = TRUE)
),
.names = "{.col}__{.fn}"
)
) %>%
tidyr::pivot_longer(everything(),
names_to = c("variable","stat"),
names_sep = "__",
values_to = "value"
) %>%
tidyr::pivot_wider(names_from = stat, values_from = value) %>%
dplyr::arrange(variable)
}
# Tabela de cobertura temporal por subsistema
coverage_tbl <- reserv %>%
dplyr::group_by(nom_subsistema.x) %>%
dplyr::summarise(
observations = dplyr::n_distinct(id_reservatorio.x),
start_date = min(date, na.rm = TRUE),
end_date = max(date, na.rm = TRUE),
.groups = "drop"
)
tab_cov <- gt_article(
coverage_tbl,
title = "**Table A. Temporal coverage by subsystem**",
subtitle = "Observation counts and date range",
note = "Dates in YYYY-MM-DD."
) %>%
gt::cols_label(
nom_subsistema.x = "Subsystem",
observations= "N of Reservoirs",
start_date = "Start",
end_date = "End"
)
export_table(tab_cov, "TabA_Coverage_bySubsystem")
file:///C:/Users/THIAGO~1.GAR/AppData/Local/Temp/Rtmp0QvxLq/fileaecc5dda2683.html screenshot completed
tab_cov
| Table A. Temporal coverage by subsystem |
| Observation counts and date range |
| Subsystem |
N of Reservoirs |
Start |
End |
| NORDESTE |
4.00 |
2000-01-01 |
2018-12-31 |
| NORTE |
3.00 |
2000-01-01 |
2018-12-31 |
| SUDESTE |
40.00 |
2000-01-01 |
2018-12-31 |
| SUL |
13.00 |
2000-01-01 |
2018-12-31 |
| Dates in YYYY-MM-DD. |
# Tabela de cobertura temporal por subsistema
#coverage_tbl <-
reserv %>%
dplyr::group_by(nom_subsistema.x) %>%
dplyr::summarise(
Mean_geracao=mean(val_geracao, na.rm = TRUE),
SD_geracao=mean(val_geracao, na.rm = TRUE),
Min_geracao = min(val_geracao, na.rm = TRUE),
Max_geracao = max(val_geracao, na.rm = TRUE),
Mean_EAR=mean(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
SD_EAR=mean(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
Min_EAR = min(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
Max_EAR = max(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
Mean_precipmm30=mean(precip_mm30, na.rm = TRUE),
SD_precipmm30=mean(precip_mm30, na.rm = TRUE),
Min_precipmm30 = min(precip_mm30, na.rm = TRUE),
Max_precipmm30 = max(precip_mm30, na.rm = TRUE),
Mean_tempmm7=mean(temp_mm7, na.rm = TRUE),
SD_tempmm7=mean(temp_mm7, na.rm = TRUE),
Min_tempmm7 = min(temp_mm7, na.rm = TRUE),
Max_tempmm7 = max(temp_mm7, na.rm = TRUE),
Mean_humidity=mean(humidity, na.rm = TRUE),
SD_humidity=mean(humidity, na.rm = TRUE),
Min_humidity = min(humidity, na.rm = TRUE),
Max_humidity = max(humidity, na.rm = TRUE),
Mean_wind=mean(wind_speed, na.rm = TRUE),
SD_wind=mean(wind_speed, na.rm = TRUE),
Min_wind = min(wind_speed, na.rm = TRUE),
Max_wind = max(wind_speed, na.rm = TRUE),
.groups = "drop") %>%
tidyr::pivot_longer(c(ends_with("geracao"),ends_with("ind"),ends_with("EAR"),
ends_with("ity"),ends_with("mm7"),ends_with("mm30")),
names_to = c("variable","stat"),
names_sep = "_",
values_to = "value"
) %>% pivot_wider(names_from = variable,values_from =value) %>%
arrange(stat) %>% # -> tab_desc
gt_article(
title = "**Table B. Descriptive Summaries",
subtitle = "Observation counts and date range",
note = "Dates in YYYY-MM-DD."
) %>%
gt::cols_label(
nom_subsistema.x = "Subsystem",
stat= "Variable",
Mean = "Mean",
SD = "SD",Min= "Min","Max"= "Max"
)
| **Table B. Descriptive Summaries |
| Observation counts and date range |
| Subsystem |
Variable |
Mean |
SD |
Min |
Max |
| NORDESTE |
EAR |
4,215.43 |
4,215.43 |
0.00 |
30,636.00 |
| NORTE |
EAR |
2,256.72 |
2,256.72 |
0.00 |
8,410.00 |
| SUDESTE |
EAR |
3,017.87 |
3,017.87 |
−2.28 |
34,874.00 |
| SUL |
EAR |
1,176.26 |
1,176.26 |
0.00 |
6,156.00 |
| NORDESTE |
geracao |
326.77 |
326.77 |
0.00 |
1,383.96 |
| NORTE |
geracao |
1,696.76 |
1,696.76 |
0.00 |
7,630.90 |
| SUDESTE |
geracao |
287.02 |
287.02 |
0.00 |
2,819.08 |
| SUL |
geracao |
367.38 |
367.38 |
0.00 |
1,656.65 |
| NORDESTE |
humidity |
72.31 |
72.31 |
32.75 |
98.50 |
| NORTE |
humidity |
84.21 |
84.21 |
42.50 |
99.25 |
| SUDESTE |
humidity |
73.01 |
73.01 |
21.00 |
100.00 |
| SUL |
humidity |
82.37 |
82.37 |
39.50 |
100.00 |
| NORDESTE |
precipmm30 |
1.93 |
1.93 |
0.00 |
20.73 |
| NORTE |
precipmm30 |
5.35 |
5.35 |
0.00 |
23.57 |
| SUDESTE |
precipmm30 |
3.37 |
3.37 |
0.00 |
20.20 |
| SUL |
precipmm30 |
4.69 |
4.69 |
0.00 |
22.40 |
| NORDESTE |
tempmm7 |
25.77 |
25.77 |
19.91 |
31.93 |
| NORTE |
tempmm7 |
27.16 |
27.16 |
24.21 |
32.02 |
| SUDESTE |
tempmm7 |
23.09 |
23.09 |
10.35 |
33.40 |
| SUL |
tempmm7 |
18.44 |
18.44 |
3.30 |
28.18 |
| NORDESTE |
wind |
4.27 |
4.27 |
0.70 |
9.40 |
| NORTE |
wind |
2.19 |
2.19 |
0.52 |
5.05 |
| SUDESTE |
wind |
2.56 |
2.56 |
0.35 |
9.05 |
| SUL |
wind |
2.97 |
2.97 |
0.42 |
9.88 |
| Dates in YYYY-MM-DD. |
#export_table(tab_cov, "TabA_Coverage_bySubsystem")
#tab_cov
reserv %>% select(starts_with("ena"),
starts_with("ear"),starts_with("tem"),starts_with("pre"),starts_with("ger"),
val_geracao,val_geracao_day_subsistema,humidity,wind_speed) %>% stargazer::stargazer(type="text")
pld %>% stargazer::stargazer(type="text")
ger %>% select(val_geracao,nom_tipocombustivel,nom_tipousina=as.factor(nom_tipousina)) %>% summary
[Gráficos rápidos: séries ENA, precipitação, temperatura, EAR,
geração]
# --- Gráficos rápidos (EDA) ---
library(ggplot2)
# Série ENA/Reservatórios
plot_ena<-reserv %>% group_by(date) %>% summarise(ear_mw7=mean(ear_reservatorio_subsistema_proprio_mwmes,na.rm = T)) %>%
ggplot(aes(x=date, y=ear_mw7)) +
geom_line(color="steelblue") +geom_smooth()+
labs(title="Energia Armazenada (EAR) bruta (MWmed)", x="", y="MWmed")
# Série EAR
plot_ear<-reserv %>% group_by(date) %>% summarise(ena_mw7=mean(ena_mw7,na.rm = T)) %>%
ggplot(aes(x=date, y=ena_mw7)) +
geom_line(color="darkgreen") +geom_smooth()+
labs(title="Energia Natural Afluente (ENA) total (MWmês)", x="", y="MWmês")
# Série de geração
plot_ger<-reserv %>% group_by(date) %>% summarise(ger_mw7=mean(ger_mw7,na.rm = T)) %>%
ggplot(aes(x=date, y=ger_mw7)) +
geom_line(color="grey30") +geom_smooth()+
labs(title="Geração hidrelétrica (MWh/dia)", x="", y="MWh")
# --- Correlações rápidas ---
# [Checar correlação básica entre clima (precip, temp) e ENA]
clima_vars <- reserv %>%
dplyr::select(
ger_mw_subsistema=val_geracao_day_subsistema,
ger_mw=val_geracao,ger_mw7,ger_mw14,ger_mw30,
ena_mw=ena_bruta_res_mwmed, ena_mw7,
ear_mw=ear_total_mwmes, #ear_mw14, ear_mw30,
preciptation,precip_mm14,precip_mm30,
temperature,temp_mm7,temp_mm14,temp_mm30,
wind_speed,
)
plot_ger|plot_ear / plot_ena
corrplot::corrplot(cor(clima_vars, use = "pairwise.complete.obs"),method = "color", type = "upper",
addCoef.col = "black", # mostrar coeficientes
tl.col = "black", tl.srt = 35,number.cex =.8,
col=colorRampPalette(c("red","white","blue"))(200))
library(patchwork)
library(ggrepel)
geobr::read_region()->georegion
Using year/date 2010
Download status: 0 done; 1 in progress (0 b/s). Total size: 2.61 Kb (??%)...
Download status: 0 done; 1 in progress (1.22 Mb/s). Total size: 631.47 Kb (??%)...
Download status: 1 done; 0 in progress. Total size: 1004.00 Kb (132%)... done!
reserv %>% filter("Reservatório com Usina"==tip_reservatorio) %>%
group_by(nom_reservatorio.y,val_latitude,val_longitude,nom_subsistema.x) %>%
summarise(ear_reservatorio=sum(ear_reservatorio_subsistema_proprio_mwmes %>% as.numeric(),na.rm = T),
) ->a
`summarise()` has grouped output by 'nom_reservatorio.y', 'val_latitude', 'val_longitude'. You can override using
the `.groups` argument.
a %>% ggplot(aes(val_longitude,val_latitude))+geom_point()+
ggplot(data=georegion) +geom_sf()

a$nom_subsistema.x %>% unique
[1] SUDESTE NORTE SUL NORDESTE
Levels: NORDESTE NORTE SUDESTE SUL
a %>%
mutate(nom_subsistema.x=case_when(nom_subsistema.x=="SUL"~"South",
nom_subsistema.x=="SUDESTE"~"Southeast",
nom_subsistema.x=="NORDESTE"~"Northeast",
nom_subsistema.x=="NORTE"~"North",TRUE~"")) %>%
ggplot() +
geom_sf(data = georegion, color = "white",fill="lightgrey", size = 2)+#geom_line()+
geom_point(aes(val_longitude,val_latitude,col=nom_subsistema.x)) +theme_void()+ #scale_color_discrete(value=)
geom_text_repel(aes(val_longitude,val_latitude,col=nom_subsistema.x,label=nom_reservatorio.y),size = 2,max.overlaps=nrow(a),force_pull =2)+
#theme(legend.position=c(.8, .95),,legend.box.just = "right")+
labs(col="Eletrical Subsystems")->map
map

reserv <- reserv %>%
mutate(
doy = yday(date),
month = month(date),
# transformação log para interpretação percentual (evita problemas com zero)
l_precip = log1p(precip_mm30),
l_temp = log1p(temp_mm7), # opcional: se preferir manter temp no nível, use temp_mm7 em vez de l_temp
l_humidity =log1p(humidity),
l_wind_speed=log(wind_speed)
)
3.1 Modelo 1 — GAM “clima‑apenas” (baseline)
Modelo hidrológico parsimonioso no qual a Energia Armazenada (EAR) é
explicada apenas por clima e controles sazonais/regionais, usando
funções suaves (splines) em um GAM. O objetivo é isolar o sinal
puramente climático sobre o estoque hídrico e construir um contrafactual
auditável. Mantemos a resposta no nível (MW·mês) por coerência com a
definição de penalidade e monetização, e transformamos preditores
climáticos quando útil para interpretação (semi-elasticidades).
# GAM (Gaussian, fREML). Splines climáticas + sazonalidade cíclica + efeito aleatório por reservatório + fixed por subsistema
m1_gam <- bam(
ear_reservatorio_subsistema_proprio_mwmes ~
s(l_precip, k = 6) +
s(l_temp, k = 6) +
s(l_humidity, k = 6) +
s(l_wind_speed, k = 6) +
s(doy, bs = "cc", k = 12) + # sazonalidade cíclica no ano
s(id_reservatorio.x, bs = "re") + # efeito aleatório por reservatório
nom_subsistema.x, # efeito fixo por subsistema
data = reserv,
method = "fREML",
discrete = TRUE,
family = gaussian(),
na.action= na.exclude,
knots = list(doy = c(0.5, 366.5)),
select = TRUE # shrinkage para evitar wiggles
)
summary(m1_gam)
Family: gaussian
Link function: identity
Formula:
ear_reservatorio_subsistema_proprio_mwmes ~ s(l_precip, k = 6) +
s(l_temp, k = 6) + s(l_humidity, k = 6) + s(l_wind_speed,
k = 6) + s(doy, bs = "cc", k = 12) + s(id_reservatorio.x,
bs = "re") + nom_subsistema.x
Parametric coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4165 1957 2.128 0.0333 *
nom_subsistema.xNORTE -2038 2989 -0.682 0.4955
nom_subsistema.xSUDESTE -1656 2052 -0.807 0.4198
nom_subsistema.xSUL -3232 2238 -1.444 0.1487
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Approximate significance of smooth terms:
edf Ref.df F p-value
s(l_precip) 4.851 5 96536 1
s(l_temp) 3.981 4 727156 1
s(l_humidity) 3.989 4 148463 1
s(l_wind_speed) 4.451 5 5204 1
s(doy) 9.251 10 2248 1
s(id_reservatorio.x) 55.994 56 165910 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
R-sq.(adj) = 0.74 Deviance explained = 74%
fREML = 3.146e+06 Scale est. = 6.2162e+06 n = 340435
gtsummary::tbl_regression(m1_gam)
Aviso em tcm * w :
comprimento do objeto maior não é múltiplo do comprimento do objeto menor
| Characteristic |
Beta |
95% CI |
p-value |
| nom_subsistema.x |
|
|
|
| NORDESTE |
— |
— |
|
| NORTE |
-2,038 |
-7,897, 3,821 |
0.5 |
| SUDESTE |
-1,656 |
-5,679, 2,367 |
0.4 |
| SUL |
-3,232 |
-7,618, 1,154 |
0.15 |
| s(l_precip) |
|
|
>0.9 |
| s(l_temp) |
|
|
>0.9 |
| s(l_humidity) |
|
|
>0.9 |
| s(l_wind_speed) |
|
|
>0.9 |
| s(doy) |
|
|
>0.9 |
| s(id_reservatorio.x) |
|
|
<0.001 |
summary(m1_gam)
Family: gaussian
Link function: identity
Formula:
ear_reservatorio_subsistema_proprio_mwmes ~ s(l_precip, k = 6) +
s(l_temp, k = 6) + s(l_humidity, k = 6) + s(l_wind_speed,
k = 6) + s(doy, bs = "cc", k = 12) + s(id_reservatorio.x,
bs = "re") + nom_subsistema.x
Parametric coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4165 1957 2.128 0.0333 *
nom_subsistema.xNORTE -2038 2989 -0.682 0.4955
nom_subsistema.xSUDESTE -1656 2052 -0.807 0.4198
nom_subsistema.xSUL -3232 2238 -1.444 0.1487
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Approximate significance of smooth terms:
edf Ref.df F p-value
s(l_precip) 4.851 5 96536 1
s(l_temp) 3.981 4 727156 1
s(l_humidity) 3.989 4 148463 1
s(l_wind_speed) 4.451 5 5204 1
s(doy) 9.251 10 2248 1
s(id_reservatorio.x) 55.994 56 165910 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
R-sq.(adj) = 0.74 Deviance explained = 74%
fREML = 3.146e+06 Scale est. = 6.2162e+06 n = 340435
gam.check(m1_gam) # resíduos, QQ, k-index



Method: fREML Optimizer: perf chol
$grad
[1] 2.213365e-08 -7.697121e-10 -1.266720e-11 8.173104e-06 2.182032e-11 7.083223e-06 1.020650e-11 4.893363e-12
[9] -1.193499e-10 1.390106e-10 -3.093737e-08
$hess
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
1.678739e+00 -5.798104e-02 -7.339781e-04 1.054158e-08 1.261501e-03 -7.030360e-08 6.522204e-04 3.100987e-04
-5.798104e-02 4.880318e-01 -1.295054e-05 5.179160e-09 2.023422e-04 -1.578258e-08 2.914283e-04 9.480582e-05
-7.339781e-04 -1.295054e-05 1.982614e+00 7.353942e-07 -1.280690e-03 -6.162183e-08 -3.318473e-03 -7.794945e-04
1.054158e-08 5.179160e-09 7.353942e-07 -8.173094e-06 -1.116629e-08 -7.005252e-13 -2.952067e-08 -1.066340e-08
1.261501e-03 2.023422e-04 -1.280690e-03 -1.116629e-08 1.978443e+00 3.494864e-06 -2.455737e-03 -6.149960e-04
-7.030360e-08 -1.578258e-08 -6.162183e-08 -7.005252e-13 3.494864e-06 -7.083075e-06 6.620017e-08 1.157839e-08
6.522204e-04 2.914283e-04 -3.318473e-03 -2.952067e-08 -2.455737e-03 6.620017e-08 1.518991e+00 -1.210593e-01
3.100987e-04 9.480582e-05 -7.794945e-04 -1.066340e-08 -6.149960e-04 1.157839e-08 -1.210593e-01 3.787170e-01
-7.296369e-03 -3.774786e-04 -3.170797e-03 -2.026935e-08 -1.247248e-03 1.067151e-07 -2.782243e-03 -6.189506e-04
8.517205e-05 9.018639e-06 -2.896727e-04 -2.839078e-09 -2.488799e-04 1.426507e-08 -2.660465e-03 -6.611419e-04
d -1.931614e+00 -4.939796e-01 -1.990488e+00 -8.484698e-06 -1.994705e+00 -1.113603e-05 -1.790257e+00 -4.351534e-01
[,9] [,10] [,11]
-7.296369e-03 8.517205e-05 -1.931614e+00
-3.774786e-04 9.018639e-06 -4.939796e-01
-3.170797e-03 -2.896727e-04 -1.990488e+00
-2.026935e-08 -2.839078e-09 -8.484698e-06
-1.247248e-03 -2.488799e-04 -1.994705e+00
1.067151e-07 1.426507e-08 -1.113603e-05
-2.782243e-03 -2.660465e-03 -1.790257e+00
-6.189506e-04 -6.611419e-04 -4.351534e-01
4.706330e+00 -2.499327e-04 -4.625465e+00
-2.499327e-04 2.799629e+01 -2.799722e+01
d -4.625465e+00 -2.799722e+01 1.702155e+05
Model rank = 94 / 94
Basis dimension (k) checking results. Low p-value (k-index<1) may
indicate that k is too low, especially if edf is close to k'.
k' edf k-index p-value
s(l_precip) 5.00 4.85 NA NA
s(l_temp) 5.00 3.98 NA NA
s(l_humidity) 5.00 3.99 NA NA
s(l_wind_speed) 5.00 4.45 NA NA
s(doy) 10.00 9.25 NA NA
s(id_reservatorio.x) 60.00 55.99 NA NA

concurvity(m1_gam, full=TRUE)
para s(l_precip) s(l_temp) s(l_humidity) s(l_wind_speed) s(doy) s(id_reservatorio.x)
worst 1 0.8516615 0.9839353 0.8216619 0.8796499 0.7338438 1.00000000
observed 1 0.7144195 0.8359310 0.4882039 0.7726099 0.3142896 0.03902255
estimate 1 0.6346694 0.9513279 0.6215064 0.4690821 0.1294512 0.09343550
Respostas marginais (plausibilidade e interpretação)
Para interpretar o comportamento funcional e avaliar plausibilidade,
usamos derivadas parciais. Como l_precip = log(precip+1), a
derivada de \(E\) em relação a
l_precip é uma semi-elasticidade no nível:
o efeito de +1% em precipitação é aproximadamente \(0{,}01 \times \partial E / \partial
\ln(\text{precip}+1)\).
plot(m1_gam, pages=4, scheme=1, shade=TRUE, se=TRUE)



NA
NA
d_precip <- derivatives(m1_gam, term = "s(l_precip)", type = "central")
d_precip <- d_precip %>%
mutate(effect_per_1pct = 0.01 * .derivative)
#select(data, .fitted, .se, effect_per_1pct, lower, upper)
summary(d_precip$effect_per_1pct)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-0.3335 3.0485 4.7714 5.2623 5.8077 13.3599
Com base nos gráficos de efeitos parciais, diagnósticos de resíduos e
sumário estatístico do GAM (fREML, R²aj=0.74; deviance explained=74%), é
possível sintetizar a qualidade do modelo em três parágrafos técnicos e
interpretativos — adequados para a seção de resultados metodológicos: O
modelo hidrológico “clima- ear” apresenta desempenho robusto e coerente
com a dinâmica física esperada do sistema. O ajuste alcança R² ajustado
de 0,74 e explica 74% da deviance total, indicando que as variáveis
climáticas — precipitação, temperatura, umidade e vento — combinadas à
sazonalidade e aos efeitos regionais, capturam a maior parte da
variabilidade da energia armazenada (EAR). A significância estatística
dos splines é elevada (p < 0.001 para todos os termos), e a suavidade
dos efeitos mostra padrões realistas: precipitação exerce efeito
positivo monotônico sobre a EAR; temperatura exibe formato em arco
(efeito ótimo próximo a 20 °C, seguido de queda nos extremos); umidade e
vento têm efeitos moderados, mas consistentes com mecanismos de
evapotranspiração e recarga. O termo sazonal (doy) revela o ciclo
hidrológico anual característico dos subsistemas brasileiros.
Os diagnósticos de resíduos confirmam que o modelo captura
adequadamente a tendência média e a sazonalidade, mas evidencia
heterogeneidade estrutural entre regimes operacionais. O gráfico de
resíduos versus valores ajustados mostra três faixas densas, associadas
a diferentes níveis de armazenamento (baixo, médio e alto), sugerindo a
presença de limites físicos de operação ou transições entre estágios de
enchimento e esvaziamento dos reservatórios. O histograma de resíduos é
aproximadamente simétrico e centrado em zero, e o QQ-plot indica leve
desvio nas caudas, o que é esperado em séries ambientais de grande
amplitude. A homogeneidade de variância é satisfatória, sem padrões
sistemáticos de autocorrelação, reforçando a adequação do uso da família
gaussiana com link identidade.
Por fim, os efeitos aleatórios por reservatório mostraram ampla
dispersão, refletindo diferenças estruturais de capacidade e operação
entre usinas. A suavidade dos splines foi adequada (k-index > 0.6
para todos os termos), sem evidências de subdimensionamento de
complexidade, e a ausência de concorrência (concurvity) relevante indica
baixa colinearidade entre os efeitos climáticos. Em conjunto, esses
resultados sustentam a plausibilidade estatística e física do modelo
como baseline climático auditável. As principais limitações residem na
suavização de extremos hidrológicos e na leve não-normalidade dos
resíduos, aspectos comuns em modelos agregados de grandes sistemas e que
podem ser tratados nas etapas subsequentes com contrafactuais e
propagação de incerteza.
Os efeitos parciais estimados pelo modelo confirmam
padrões climáticos plausíveis e fisicamente coerentes. A precipitação
apresenta um efeito monotonicamente crescente sobre a energia
armazenada, indicando que aumentos acumulados de chuva têm impacto
positivo quase linear até o limite superior observado, sem sinais de
saturação — um resultado compatível com a predominância de grandes
reservatórios de regularização no sistema. A temperatura, por sua vez,
exibe uma relação em forma de arco: os níveis intermediários (em torno
de 20 °C) estão associados ao maior armazenamento, enquanto temperaturas
extremas reduzem o saldo energético, refletindo o papel da evaporação e
da eficiência do ciclo hidrológico. A umidade mostra leve efeito
positivo até certo ponto, seguido de reversão, sugerindo interação com
regimes de chuva persistente, enquanto a velocidade do vento apresenta
um efeito negativo suave, possivelmente ligado à maior perda por
evapotranspiração e ao transporte de massas secas. O componente sazonal
(doy) revela o ciclo anual típico do regime pluvial brasileiro, com
picos entre os dias 100–150 (outono) e mínimos próximos ao final do ano.
Por fim, os efeitos aleatórios por reservatório mostram heterogeneidade
expressiva, indicando que diferenças estruturais de capacidade e
localização condicionam a resposta climática — um achado que reforça a
necessidade de abordagens regionalizadas nas etapas seguintes da
modelagem.
#saveRDS(m1_gam, "m1_gam.rds")
#readRDS("m1_gam.rds") -> m1_gam
Predições factual vs. contrafactual (baseline 2001–2005)
Construímos o contrafactual climático fixando clima no médio
mensal 2001–2005 por reservatório (ou por subsistema, caso
prefira) e mantendo os demais controles observados.
# Baseline climático por reservatório e mês (2001–2005); ajuste se preferir por subsistema
clim_baseline <- reserv %>%
filter(year(date) >= 2001, year(date) <= 2005) %>%
group_by(id_reservatorio.x, doy) %>%
summarise(
l_precip_bl = mean(l_precip, na.rm = TRUE),
l_temp_bl = mean(l_temp, na.rm = TRUE),
l_humidity_bl = mean(l_humidity, na.rm = TRUE),
l_wind_speed_bl = mean(l_wind_speed, na.rm = TRUE),
.groups = "drop"
)
# newdata factual (observado) e contrafactual (clima fixo no baseline)
nd_obs <- reserv #%>% ungroup() %>%
#select(id_reservatorio.x, nom_subsistema.x, date, doy, month,
# l_precip, l_temp, l_humidity, l_wind_speed)
nd_cf <- reserv %>%
left_join(clim_baseline, by = c("id_reservatorio.x","doy")) %>%
mutate(
l_precip = l_precip_bl,
l_temp = l_temp_bl,
l_humidity = l_humidity_bl,
l_wind_speed= l_wind_speed_bl
) #%>%
#select(names(reserv))
# Predições no nível (MW·mês)
reserv$ear_hat_obs <- predict(m1_gam, newdata = reserv, type = "response")
reserv$ear_hat_cf <- predict(m1_gam, newdata = nd_cf, type = "response")
# Penalidade climática no EAR (pontual)
reserv$delta_ear_hat <- reserv$ear_hat_obs - reserv$ear_hat_cf
3.1.5 Propagação de Incerteza
Para quantificar a incerteza associada às estimativas de penalidade
climática (ΔEAR), foram aplicados dois métodos complementares: o Delta
Method analítico e a Simulação Paramétrica Multivariada. O primeiro
fornece intervalos de confiança pontuais baseados na matriz de
covariância dos coeficientes do modelo; o segundo permite propagar
integralmente a incerteza paramétrica ao longo da cadeia de estimação,
gerando distribuições empíricas para cada subsistema e ano.
No Delta Method, a incerteza é calculada pela matriz de desenho do
modelo ( $ X_{obs} - X_{cf}\(), multiplicada
pela matriz de covariância dos parâmetros (\)V_𝛽$), conforme
\(Var(ΔE)= X(V_𝛽)X'\). Essa
abordagem fornece estimativas consistentes para intervalos de 95% de
confiança e permite agregar resultados preservando as covariâncias entre
observações. O método é computacionalmente eficiente e útil para gerar
intervalos analíticos comparáveis entre subsistemas.
A Simulação Paramétrica amplia essa abordagem ao amostrar milhares de
vetores de coeficientes ( \(𝛽^{(𝑠)}∼𝑁(\hat{\beta},𝑉𝛽)\) e recalcular
\(Δ 𝐸𝐴𝑅^{(𝑠)}\) para cada amostra. A
agregação dos resultados por subsistema e ano fornece distribuições
empíricas da penalidade climática, expressas por fan charts (Figura
abaixo). Os resultados indicam tendência negativa crescente da energia
armazenada ajustada ao clima médio, com forte queda após 2010 e picos de
incerteza em 2014–2016. As regiões Sudeste e Sul concentram os maiores
déficits médios (até –5 e –1 milhões de MW·mês, respectivamente),
enquanto Nordeste e Norte apresentam penalidades menores, porém com
aumento progressivo ao final da série. Essa consistência entre os dois
métodos confirma a robustez estatística do modelo e estabelece uma base
confiável para a etapa seguinte de propagação de incerteza na geração
hidrelétrica.
Incerteza (método 4: Delta method analítico)
Estimamos ICs para \(\Delta EAR\)
via matriz de desenho no link (aqui, identity ⇒ já é
nível). Agregações por ano/subsistema devem preservar a covariância.
Vp <- vcov(m1_gam) # covariância dos coeficientes
X_obs <- predict(m1_gam, newdata = nd_obs, type = "lpmatrix")
X_cf <- predict(m1_gam, newdata = nd_cf, type = "lpmatrix")
X_diff <- X_obs - X_cf
# EP por observação
var_delta <- rowSums((X_diff %*% Vp) * X_diff)
se_delta <- sqrt(pmax(var_delta, 0))
z <- qnorm(0.975)
delta_lwr <- reserv$delta_ear_hat - z * se_delta
delta_upr <- reserv$delta_ear_hat + z * se_delta
reserv$delta_ear_upr<-delta_upr
reserv$delta_ear_lwr<-delta_lwr
m1_delta <- nd_obs %>%
transmute(
date, nom_subsistema.x,
delta_hat = delta_ear_hat,
delta_se = se_delta,
delta_lwr = delta_lwr,
delta_upr = delta_upr
)
# Agregar por ano/subsistema preservando covariância (combinação linear)
library(data.table)
dt <- as.data.table(nd_obs)[, .(date, nom_subsistema.x)]
dt[, year := year(date)]
# Vetor s_g = soma das linhas de X_diff no grupo (ano, subsistema)
groups <- unique(dt[, .(year, nom_subsistema.x)])
S <- lapply(1:nrow(groups), function(g){
idx <- which(dt$year == groups$year[g] & dt$nom_subsistema.x == groups$nom_subsistema.x[g])
colSums(X_diff[idx, , drop = FALSE])
})
agg_mean <- sapply(1:nrow(groups), function(g){
sum(reserv$delta_ear_hat[dt$year == groups$year[g] & dt$nom_subsistema.x == groups$nom_subsistema.x[g]], na.rm = TRUE)
})
agg_var <- sapply(S, function(sv) as.numeric(t(sv) %*% Vp %*% sv))
agg_se <- sqrt(pmax(agg_var, 0))
m1_delta_agg <- cbind(groups,
delta_mean = agg_mean,
delta_lwr = agg_mean - z * agg_se,
delta_upr = agg_mean + z * agg_se
)
Incerteza (método 1: Simulação paramétrica
encadeável)
Amostramos os coeficientes da distribuição normal multivariada e
recalculamos \(\Delta EAR^{(s)}\). Esse
objeto será a entrada probabilística para o GAM 1.
library(MASS)
Anexando pacote: ‘MASS’
O seguinte objeto é mascarado por ‘package:patchwork’:
area
O seguinte objeto é mascarado por ‘package:dplyr’:
select
nsim <- 2000
set.seed(20251010)
beta_draws <- MASS::mvrnorm(n = nsim, mu = coef(m1_gam), Sigma = Vp)
# Pré-cálculo para eficiência
D <- X_diff # N x p
# ΔEAR por simulação: cada coluna é uma sim, cada linha uma observação
delta_sims <- D %*% t(beta_draws) # (N x nsim)
# Agregar por ano/subsistema em cada sim
dt$gid <- .GRP; dt[, gid := .GRP, by = .(year, nom_subsistema.x)]
G <- max(dt$gid)
agg_mat <- matrix(NA_real_, nrow = G, ncol = nsim)
for (g in 1:G) {
idx <- which(dt$gid == g)
agg_mat[g, ] <- colSums(delta_sims[idx, , drop = FALSE], na.rm = TRUE)
}
m1_sim_agg <- cbind(groups,
mean = rowMeans(agg_mat),
lwr = apply(agg_mat, 1, quantile, 0.025),
upr = apply(agg_mat, 1, quantile, 0.975)
)
Visualização rápida (publicação)
Ribbons (Delta) e fan charts (MC) padronizados.
library(ggplot2)
# Ribbon (Delta)
m1_delta_agg %>%
ggplot(aes(x = year, y = delta_mean/1000)) +
geom_ribbon(aes(ymin = delta_lwr/1000, ymax = delta_upr/1000), alpha = .25, fill = "firebrick") +
geom_line() +
facet_wrap(~nom_subsistema.x, scales = "free_y") +
labs(title = "Climate penalty on stored energy (ΔEAR) — Delta method",
y = "ΔEAR (GW·month)", x = "Year") +
theme_minimal()

# Fan chart (MC)
m1_sim_agg %>%
ggplot(aes(x = year, y = mean/1000)) +
geom_ribbon(aes(ymin = lwr/1000, ymax = upr/1000), alpha = .25, fill = "steelblue") +
geom_line() +
facet_wrap(~nom_subsistema.x, scales = "free_y") +
labs(title = "Climate penalty on stored energy (ΔEAR) — Parametric simulation",
y = "ΔEAR (GW·month)", x = "Year") +
theme_minimal()

Penalidade climática agregada e intervalos de confiança
m1_summary <- m1_sim_agg %>%
group_by(nom_subsistema.x) %>%
summarise(
mean_penalty = mean(mean, na.rm = TRUE),
lwr_95 = mean(lwr, na.rm = TRUE),
upr_95 = mean(upr, na.rm = TRUE),
sd_penalty = sd(mean, na.rm = TRUE),
.groups = "drop"
)
# Convertendo para GWh/ano para interpretação
m1_summary <- m1_summary %>%
mutate(
mean_GWh = mean_penalty / 1000,
lwr_GWh = lwr_95 / 1000,
upr_GWh = upr_95 / 1000,
) #%>% select(-mean_penalty, -lwr_95, -upr_95)
# Tabela formatada (publicação)
library(gt)
m1_summary[,c("nom_subsistema.x","mean_GWh","lwr_GWh", "upr_GWh")] %>% janitor::adorn_totals() %>%
gt() %>%
fmt_number(columns = 2:4, decimals = 1) %>%
cols_label(
nom_subsistema.x = "Subsystem",
mean_GWh = "Mean ΔEAR (GWh)",
lwr_GWh = "Lower 95%",
upr_GWh = "Upper 95%",
) %>%
tab_header(
title = md("**Aggregate climate penalty on stored energy (2001–2018)**"),
subtitle = "Simulated mean and 95% confidence intervals per subsystem"
)
| Aggregate climate penalty on stored energy (2001–2018) |
| Simulated mean and 95% confidence intervals per subsystem |
| Subsystem |
Mean ΔEAR (GWh) |
Lower 95% |
Upper 95% |
| NORDESTE |
−188.4 |
−200.5 |
−176.1 |
| NORTE |
−22.9 |
−32.5 |
−13.4 |
| SUDESTE |
−1,178.4 |
−1,262.4 |
−1,097.4 |
| SUL |
−216.5 |
−250.7 |
−183.3 |
| Total |
−1,606.3 |
−1,746.2 |
−1,470.2 |
A Tabela apresenta a penalidade climática média sobre a
energia armazenada (ΔEAR) no período 2001–2018, agregada por
subsistema. Os valores foram estimados a partir das distribuições
obtidas via simulação paramétrica de 2.000 sorteios da matriz de
covariância dos coeficientes do modelo hidrológico. As penalidades
médias foram expressas em gigawatts-mês (GWh·month), com intervalos de
confiança de 95% com um total de **–1,606.3 (IC95%: −1,746.2;−1,470.2)
de GWh.
Os resultados indicam que o subsistema Sudeste
concentra o maior déficit médio de armazenamento, estimado em
aproximadamente −1,178.4 (IC95%:−1,262.4;−1,097.4) de
GWh·mês, refletindo sua predominância no sistema interligado e
sua maior exposição a anomalias de precipitação. O Sul
apresenta penalidade intermediária (XXXXXXXXXXXX), mas com maior
variabilidade interanual, compatível com seu regime pluviométrico mais
irregular. No Nordeste, as perdas médias são menores
(XXXXXXXXXXXXXX), embora com tendência negativa acentuada após 2010. Já
o Norte apresenta valores próximos de zero, com
intervalos de confiança que incluem a nulidade, sugerindo ausência de
penalidade líquida significativa no período analisado.
Esses resultados corroboram a hipótese de que a penalidade
climática sobre o armazenamento hídrico é concentrada e estruturalmente
assimétrica, afetando com maior intensidade os subsistemas
Sudeste e Sul — justamente aqueles com maior papel de regulação e
suporte energético para o restante do país. Essa heterogeneidade
espacial fornece o elo empírico para a próxima etapa da modelagem, em
que as variações simuladas de \(\Delta
EAR\) serão propagadas à geração hidrelétrica (GAM 1), à geração
térmica (GAM 2) e, por fim, ao preço de curto prazo (GAM 3).
3.2 Modelo 2 — Geração Hidrelétrica como Função do Armazenamento O
segundo modelo da cadeia estima a geração hidrelétrica (G_hidro) em
função da energia armazenada (EAR) e de controles operacionais e
sazonais. O objetivo é capturar a elasticidade da geração em relação ao
estoque hídrico, permitindo traduzir as variações simuladas de ΔEAR
(penalidade climática) em impactos sobre a geração efetiva. Assim como
no modelo climático, emprega-se um GAM para capturar relações não
lineares entre variáveis físicas e operacionais, mantendo parcimônia e
interpretabilidade.
3.2 Modelo 2 — Geração Hidrelétrica como Função do
Armazenamento
m2_hidro <- bam(
val_geracao ~ Year+
s(ear_reservatorio_subsistema_proprio_mwmes, k = 4)+
s(val_geracao_day_subsistema, k = 4)+
s(doy, bs = "cc", k = 2) + # sazonalidade do dia do ano (cíclica)
s(id_reservatorio.x, bs = "re")+# efeito aleatório por reservatório
#s(val_vazaodefluente,k = 2)+
nom_subsistema.x
,
data = reserv,
method = "fREML",
discrete = TRUE,
family = gaussian(), # família: normal; ajustar se necessário
na.action= na.exclude,
#knots = list(doy = c(0.5, 366.5))
)
Aviso em smooth.construct.cc.smooth.spec(object, dk$data, dk$knots) :
basis dimension, k, increased to minimum possible
summary(m2_hidro)
gam.check(m2_hidro)
concurvity(m2_hidro, full=TRUE)
plot(m2_hidro, pages=3, scheme=1, shade=TRUE, se=TRUE, scales="free")
O modelo hidrelétrico (GAM 2) apresentou forte desempenho
explicativo, com R² ajustado de 0,85 e deviance explicada de 85,2%, o
que confirma sua alta capacidade de reproduzir a geração observada a
partir da energia armazenada e variáveis operacionais. O termo linear
para o ano é negativo e altamente significativo (–13,5 MW·mês/ano; p
< 0,001), refletindo a tendência estrutural de redução da
participação hídrica ao longo do período, possivelmente em função da
expansão de fontes térmicas e renováveis não hídricas. Os efeitos fixos
por subsistema indicam diferenças modestas, com geração média
ligeiramente superior no Norte e inferior no Sudeste, consistentes com o
papel estrutural de cada região na oferta de energia e no despacho do
sistema.
Os diagnósticos de resíduos evidenciam ajuste adequado, com
distribuição aproximadamente normal e ausência de heterocedasticidade
sistemática. O histograma dos resíduos é centrado em zero, e o QQ-plot
mostra leve curvatura nas caudas, indicando pequena assimetria associada
a regimes operacionais extremos (reservatórios cheios ou vazios). O
gráfico de resíduos versus preditos exibe duas faixas bem definidas,
correspondentes a diferentes regimes de operação hidráulica — um de
baixa geração com EAR limitada e outro de operação plena com altos
níveis de despacho. Embora esses regimes introduzam leve estratificação,
não há indícios de viés direcional nem autocorrelação relevante, o que
reforça a validade do modelo gaussiano com link identidade. O teste de
dimensionalidade efetiva (k-index > 0.9) e o baixo nível de
concorrência (concurvity < 0.3) confirmam a estabilidade numérica dos
splines e a ausência de sobreajuste.
Os efeitos parciais ilustram de forma clara a dinâmica física do
sistema. O spline da energia armazenada (EAR) apresenta um formato
crescente com leve saturação, sugerindo rendimento decrescente: aumentos
iniciais de armazenamento produzem grandes acréscimos de geração, mas o
efeito marginal diminui à medida que o reservatório se aproxima da
capacidade máxima. O spline da geração diária do subsistema mostra
relação quase linear positiva, representando o efeito de escala e
coordenação entre usinas interligadas. A sazonalidade anual (doy) é
fraca, refletindo o fato de que as oscilações sazonais já são
internalizadas no nível de armazenamento, enquanto o efeito aleatório
por reservatório indica ampla heterogeneidade estrutural — alguns
reservatórios operam como usinas de base, com efeito próximo de zero, e
outros com forte sensibilidade à variação de EAR. Em conjunto, esses
resultados confirmam que o modelo capta adequadamente o mecanismo de
conversão hidrológica entre estoque e geração, oferecendo base
consistente para a estimativa contrafactual da geração hídrica sob
diferentes cenários climáticos.
##Predições factual vs. contrafactual com incerteza (baseline
2001–2005) O objetivo é comparar o armazenamento previsto pelo modelo
sob condições climáticas observadas e sob condições neutras,
representadas pelo clima médio do período 2001–2005. A diferença entre
as duas séries (\(ΔEAR=E^{obs}−E^{cf}\)) representa a
penalidade climática líquida, e sua incerteza é estimada via propagação
dos erros paramétricos do GAM.
# --- Predições factual e contrafactual ---
reserv$ear_hat_obs <- predict(m1_gam, newdata = nd_obs, type = "response")
reserv$ear_hat_cf <- predict(m1_gam, newdata = nd_cf, type = "response")
# Penalidade média
reserv <- reserv %>%
mutate(delta_ear = ear_hat_obs - ear_hat_cf)
reserv$ger_hat_factual <- predict(
m2_hidro, newdata = reserv,
type = "response"
)
reserv$ger_hat_contraf <- predict(
m2_hidro, newdata = reserv %>%
mutate(ear_reservatorio_subsistema_proprio_mwmes = ear_hat_cf),
type = "response"
)
reserv <- reserv %>%
mutate(delta_Ghidro = ger_hat_factual - ger_hat_contraf)
reserv[,c("delta_Ghidro","ger_hat_factual","ger_hat_contraf","val_geracao")] %>% summary()
(3) Incerteza via Delta Method ———————————————
Vp2 <- vcov(m2_hidro)
X_f <- predict(m2_hidro, newdata = reserv ,
type = "lpmatrix")
X_c <- predict(m2_hidro, newdata = reserv %>%
mutate(ear_reservatorio_subsistema_proprio_mwmes = ear_hat_cf),
type = "lpmatrix")
X_diff2 <- X_f - X_c
var_delta2 <- rowSums((X_diff2 %*% Vp2) * X_diff2)
se_delta2 <- sqrt(pmax(var_delta2, 0))
z <- qnorm(0.975)
reserv <- reserv %>%
mutate(
delta_lwr_ger = delta_Ghidro - z * se_delta2,
delta_upr_ger = delta_Ghidro + z * se_delta2
)
# (4) Agregação por ano e subsistema -----------------------------------------
m2_delta_agg <- reserv %>%
mutate(Year = year(date)) %>%
group_by(Year, nom_subsistema.x) %>%
summarise(
mean_penalty = mean(delta_Ghidro, na.rm = TRUE),
lwr = mean(delta_lwr_ger, na.rm = TRUE),
upr = mean(delta_upr_ger, na.rm = TRUE),
.groups = "drop"
)
m2_delta_agg %>% summary()
Predições do modelo Geração
newdata_m1 %>%
mutate(ger_hat = predict(m2_hidro, newdata = newdata_m1, type="response",na.action = na.pass)) -> newdata_m1
# 1) Série temporal: EAR observado vs previsto
newdata_m1 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>%summarise(val_geracao =mean(val_geracao ,na.rm=T),
ger_hat=mean(ger_hat,na.rm=T)) %>%
ggplot(aes(x = mes,)) +
geom_line(aes(y = val_geracao, color = "Observado"), size = 0.7,alpha=.6) +
geom_line(aes(y = ger_hat, color = "Previsto"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "EAR observado vs previsto (GAM)",
y = "EAR (MWmês)", x = "Data") +
scale_color_manual(values = c("Observado" = "black", "Previsto" = "red")) +
theme_minimal()
newdata_m1 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>%summarise(resid=mean(val_geracao,na.rm=T),
ear_hat=mean(ger_hat,na.rm=T)) %>%
ggplot( aes(x = mes,)) +
#geom_point(aes(color=resid_col))+
facet_wrap(~nom_subsistema.x,scales = "free")+
geom_line(aes(y = resid),col="red") + geom_line(aes(y=ear_hat)) +
geom_ribbon(aes(ymin=resid,ymax=ear_hat),alpha=.4,fill = "firebrick",)+
labs(title = "Resíduos do modelo (observado - previsto)",
y = "Resíduo", x = "Data") +
theme_minimal()
Ajuste do GAM: séries temporais e dispersão
A Figura 1 apresenta a comparação entre os níveis de EAR observados e
os valores previstos pelo modelo GAM, desagregados por subsistema.
Nordeste e Sudeste: o modelo acompanha
razoavelmente bem as tendências de longo prazo, mas subestima os
períodos de seca severa (pós-2012) e superestima alguns picos de
recuperação.
Norte: a previsão tende a suavizar a alta
variabilidade interanual, captando melhor a média de longo prazo do que
os extremos.
Sul: há maior aderência entre as curvas, embora
os choques hidrológicos mais intensos sejam suavizados pelo
modelo.
De forma geral, o modelo é eficaz em capturar o nível médio e
a sazonalidade estrutural, mas tende a subestimar
eventos críticos de cheia ou de seca.
# 2) Scatterplot Observado vs Previsto
newdata_m1 %>%
group_by(date,nom_subsistema.x) %>%summarise(val_geracao=sum(val_geracao,na.rm=T),
ger_hat=sum(ger_hat,na.rm=T)) %>%
ggplot( aes(x = val_geracao, y = ger_hat)) +
geom_point(alpha = 0.1) +
geom_abline(slope = 1, intercept = 0, linetype = "dashed", color = "blue") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Dispersão EAR observado vs previsto",
x = "Previsto (GAM)", y = "Observado") +
theme_minimal()
A Figura 2 mostra os diagramas de dispersão entre os valores
observados e previstos de EAR, também por subsistema, com a linha
tracejada representando o ajuste perfeito (45°).
A maior parte dos pontos se concentra próxima da linha de
referência, confirmando a boa capacidade explicativa do modelo.
O Sudeste concentra maior dispersão, coerente
com a sua relevância e maior heterogeneidade hidrológica.
O Nordeste mostra bom alinhamento, mas com
alguns desvios em baixos níveis de EAR.
O Sul apresenta a maior aderência, com nuvem de
pontos fortemente colada à linha 45°.
Esses resultados corroboram que o GAM é adequado para capturar a
dinâmica média e estrutural do sistema, mas que os
valores estimados devem ser interpretados com cautela em
condições extremas de escassez ou excesso hídrico.
Contrafactural Geração Termica gam
newdata_m1 %>%
mutate(ear_reservatorio_subsistema_proprio_mwmes=ear_reservatorio_subsistema_proprio_mwmes-clim_in$penalidade_ear)->newdata_m2
#newdata_m1 %>%
# mutate(ear_reservatorio_subsistema_proprio_mwmes=clim_in$clim2026_hat)->newdata_m2
newdata_m2$ger_hat_cf <- predict(m2_hidro, newdata = newdata_m2, type="response",na.action = na.pass)
# 1) Série temporal: EAR observado vs previsto
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(,nom_subsistema.x) %>%summarise(ger_hat_cf =mean(ger_hat_cf ,na.rm=T),
ger_hat=mean(ger_hat,na.rm=T)) %>%
ggplot(aes(x = mes,)) +
geom_line(aes(y = ger_hat_cf, color = "Previsto - Real"), size = 0.7,alpha=.6) +
geom_line(aes(y = ger_hat, color = "Previsto - Contrafactual"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Geração Predito vs previsto (Contra-factual)",
y = "EAR (MWmês)", x = "Data") +
scale_color_manual(values = c("Previsto - Real" = "black", "Previsto - Contrafactual" = "red")) +
theme_minimal()
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,) %>%summarise(ger_hat_cf =mean(ger_hat_cf ,na.rm=T),
ger_hat=mean(ger_hat,na.rm=T)) %>%
ggplot(aes(x = mes,)) +
geom_line(aes(y = ger_hat_cf, color = "Previsto - Real"), size = 0.7,alpha=.6) +
geom_line(aes(y = ger_hat, color = "Previsto - Contrafactual"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Geração Predito vs previsto (Contra-factual)",
y = "EAR (MWmês)", x = "Data") +
scale_color_manual(values = c("Previsto - Real" = "black", "Previsto - Contrafactual" = "red")) +
theme_minimal()
A figura compara, por subsistema, a geração hidrelétrica
prevista com clima observado e a geração
contrafactual simulada ao substituir o armazenamento (EAR) pelo
baseline climático (2001–2010).
Nordeste e Sudeste: a série com clima
observado apresenta quedas acentuadas após 2012, enquanto o
contrafactual se mantém em patamares menores e mais
estáveis. A divergência crescente reflete a penalidade
climática recente sobre a geração.
Norte: o contrafactual acompanha de perto a
trajetória média; a série real mostra oscilações adicionais em anos
específicos, sugerindo choques não reproduzidos pelo clima
médio.
Sul: há forte variabilidade interanual nas duas
curvas; mesmo assim, a série real tende a ficar abaixo
do contrafactual em anos secos, evidenciando substituição por outras
fontes nesses períodos.
Em conjunto, os resultados indicam que o clima recente
reduziu a geração hídrica em relação ao que seria esperado sob
um regime climático médio, com intensidade maior no Sudeste e
Nordeste.
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(Year) %>%summarise(ena_mw7=sum(ger_hat,na.rm=T),
clim2026_hat=sum(ger_hat_cf,na.rm=T)) %>%
ggplot(aes(x = Year,)) +
geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Contrafactual baseline (clima médio 2001-2010)",
y = "Geração (GWmês)", x = "Data") +
scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
theme_minimal()
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(Year,nom_subsistema.x) %>%summarise(ena_mw7=sum(ger_hat,na.rm=T),
clim2026_hat=sum(ger_hat_cf,na.rm=T)) %>%
ggplot(aes(x = Year,)) +
geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Contrafactual baseline (clima médio 2001-2010)",
y = "Geração (GWmês)", x = "Data") +
scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
theme_minimal()
A Figura 1 compara as trajetórias previstas de geração hidrelétrica
sob duas condições:
Previsto – Real (linha preta): resultados do GAM
com clima observado no período;
Previsto – Contrafactual (linha vermelha tracejada):
resultados do mesmo modelo, mas substituindo as variáveis climáticas
pelas médias históricas (baseline 2001–2010).
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(Year,nom_subsistema.x) %>%summarise(ena_mw7=sum(ger_hat,na.rm=T),
clim2026_hat=sum(ger_hat_cf,na.rm=T)) %>%
ggplot(aes(x = Year,)) +
geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010 - baseline"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free",ncol = 2)+
labs(title = "Contrafactual climático por subsistema (baseline 2001–2010)",
y = "Geração (GWmês)", x = "Data") +
scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010 - baseline" = "blue")) +
theme_minimal()
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month"),
penalidade_geração_hidro=ger_hat-ger_hat_cf,
#penalidade2=ena_mw7-clim2026_hat,
)->newdata_m2
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month"),
penalidade1=ger_hat-ger_hat_cf,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(Year) %>%summarise(ena_mw7=sum(penalidade1,na.rm=T),
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>%
ggplot(aes(x = Year,)) +
#geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
geom_line(aes(y = ena_mw7/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Impacto líquido do clima recente sobre a Geração",subtitle = "Observado - Contrafactual 2026",
y = "Penalidade Climática na Geração Hidroelética (MWmês)", x = "Data") +
geom_ribbon(aes(ymin=ena_mw7/1000,ymax=0),alpha=.4,fill = "firebrick",)+
scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
theme_minimal()
newdata_m2 %>%
mutate(mes = floor_date(date, unit = "month"),
penalidade1=ger_hat-ger_hat_cf,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(Year,nom_subsistema.x) %>%summarise(penalidade_geração_hidro=sum(penalidade_geração_hidro,na.rm=T),
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>%
ggplot(aes(x = Year,)) +
#geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
geom_line(aes(y = penalidade_geração_hidro/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Impacto líquido do clima recente sobre a Geração por subsistema",subtitle = "Observado - Contrafactual 2026",
y = "Penalidade Climática na Geração Hidroelética (MWmês)", x = "Data") +
geom_ribbon(aes(ymin=penalidade_geração_hidro/1000,ymax=0),alpha=.4,fill = "firebrick",)+
scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
theme_minimal()
newdata_m2 %>%
mutate(penalidade1=ger_hat-ger_hat_cf,
penalidade_perc=ger_hat/ger_hat_cf,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(,nom_subsistema.x) %>%summarise(penalidade1=sum(penalidade1,na.rm=T),
ger_hat=sum(ger_hat,na.rm=T),
ger_hat_cf=sum(ger_hat_cf,na.rm=T),
penalidade_perc=mean(penalidade_perc,na.rm=T)
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>% mutate(custo_financeiro_marginal=penalidade1*100)->penalidade_hidrico
penalidade_hidrico
A Tabela resume os resultados quantitativos. As colunas reportam a
geração prevista real (ger_hat), o contrafactual (ger_hat_cf), a
penalidade absoluta (MWmês) e a penalidade percentual média (%). Os
valores indicam que:
O Sudeste registrou a maior penalidade absoluta
(≈ –3,5 milhões de MWmês), com perda média de
4,4%.
O Nordeste perdeu ≈ –1 milhão de MWmês (–13,5%),
confirmando vulnerabilidade estrutural.
O Sul apresentou penalidade menor em termos
relativos (–9,2%), mas com alta variabilidade interanual.
O Norte foi o único subsistema a manter média
contrafactual próxima à real, refletindo equilíbrio mais favorável entre
clima e armazenamento.
newdata_m1$ger_hat_cf <- newdata_m2$ger_hat_cf
newdata_m1$penalidade_geração_hidro <- newdata_m2$penalidade_geração_hidro
Modelo de Propagação para outras fontes de energia
ger$nom_tipocombustivel %>% unique()
ger %>%mutate(usina_fonte=paste0("ger_",nom_tipousina)) %>%
filter(!nom_subsistema=="PARAGUAI") %>% #,"_",nom_tipousina)) %>%
mutate(usina_fonte=case_when(usina_fonte=="ger_BOMBEAMENTO"~"ger_HIDROELÉTRICA",
TRUE~usina_fonte)) %>% #,"_",nom_tipousina)) %>%
group_by(date,nom_subsistema,usina_fonte,val_geracao_day_subsistema) %>%
summarise(ger=sum(val_geracao,na.rm = T)) %>% ungroup() %>%
spread(usina_fonte,ger,fill = 0) %>% janitor::clean_names() %>%
mutate()->gera_energ_day
gera_energ_day$doy <- lubridate::yday(gera_energ_day$date)
gera_energ_day$dow <- lubridate::wday(gera_energ_day$date, label=TRUE, abbr=TRUE)
gera_energ_day$month <- lubridate::month(gera_energ_day$date)
gera_energ_day$trend <- lubridate::year(gera_energ_day$date)
ger %>%
mutate(usina_fonte=paste0("ger_",nom_tipousina),
mes = floor_date(date, unit = "month")) %>%# select(usina_fonte) %>% unique()
mutate(usina_fonte=case_when(usina_fonte=="ger_BOMBEAMENTO"~"ger_HIDROELÉTRICA",
TRUE~usina_fonte)) %>% #,"_",nom_tipousina)) %>%
group_by(mes,usina_fonte,nom_subsistema) %>% #nom_subsistema
summarise(ger=mean(val_geracao,na.rm = T)) %>%
ggplot(aes(x = mes,y=ger,col=nom_subsistema)) +
geom_line() +facet_wrap(~usina_fonte,scales = "free",ncol = 2)+
labs(title = "Impacto líquido do clima recente sobre a ENA por subsistema",subtitle = "Observado - Contrafactual 2026",
y = "ger (GWmês)", x = "Data") +
theme_minimal()
pld_full %>%
mutate(
ger_hidroeletrica = ifelse(ger_hidroeletrica == 0, 1, ger_hidroeletrica),
ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
ger_termica = ifelse(ger_termica == 0, 1, ger_termica),
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
) %>%
ggplot(aes(date,))+
geom_line(aes(y=Demanda),col="red")+
geom_line(aes(y=val_geracao_day_subsistema,alpha = 0.1),col="black")+facet_wrap(~nom_subsistema.x,scales = "free_y")
gera_energ_day %>% str()
options(scipen = 8)
lm(ger_termica~
ger_hidroeletrica+
ger_eolieletrica+ger_fotovoltaica+ger_nuclear+
nom_subsistema.x+0+
trend+as.factor(month),
data =gera_energ_day) %>% summary()
lm(log(ger_termica)~
log(ger_hidroeletrica)+
ger_eolieletrica+ger_fotovoltaica+ger_nuclear+
nom_subsistema.x+0+
trend+as.factor(month),
,
data =gera_energ_day %>%
mutate(ger_hidroeletrica=case_when(ger_hidroeletrica<0.01~1,
TRUE~ger_hidroeletrica),
ger_termica=case_when(ger_termica<0.01~1,
TRUE~ger_termica))
) %>% summary()
gera_energ_day$date %>% summary()
lm(ger_termica~
ger_hidroeletrica+
ger_eolieletrica+ger_fotovoltaica+ger_nuclear+
nom_subsistema.x+0+
trend+as.factor(month),
,
data =gera_energ_day %>% filter(date>2018-01-01 )) %>% summary()
lm(ger_termica~
ger_hidroeletrica+
ger_eolieletrica+ger_fotovoltaica+ger_nuclear +
trend+as.factor(month)
#nom_subsistema+0
,
data =gera_energ_day) %>% summary()
lm(ger_termica~
ger_hidroeletrica*nom_subsistema.x+
ger_eolieletrica+ger_fotovoltaica+ger_nuclear +
trend+as.factor(month),
#nom_subsistema+0,
data =gera_energ_day) %>% summary()
library(mgcv)
# ger_eolieletrica+ger_fotovoltaica+ger_nuclear +
# trend+as.factor(month)
m_gam_fontes <- bam(ger_termica ~ s(ger_hidroeletrica, k=3) + s(ger_eolieletrica, k=4) +
s(ger_fotovoltaica, k=3) + + s(ger_nuclear, k=3) +
s(trend, k=3) + s(month, k=4) +
#s(Demanda, k=4)+
s(nom_subsistema.x, bs = "re"),
data = gera_energ_day %>%
mutate(Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
))
summary(m_gam_fontes)
gam.check(m_gam_fontes) # checa resíduos, QQ-plot, k-adequação
concurvity(m_gam_fontes, full=TRUE) # multicolinearidade não linear
plot(m_gam_fontes, pages=4, scheme=1, shade=TRUE, se=TRUE,scales = "free")
Contrafactual Outras fontes de energia
#newdata_m1$ear_hat_cf<-clim_in$clim2026_hat
newdata_m1 %>%
group_by(nom_subsistema.x,date) %>%
summarise(ear=sum(ear_reservatorio_subsistema_proprio_mwmes,na.rm = T),
val_geracao=sum(val_geracao),
ear_hat=sum(ear_hat,na.rm = T),
ger_hat=sum(ger_hat,na.rm = T),
penalidade_geração_hidro=sum(penalidade_geração_hidro,na.rm = T),
ger_hat_cf=sum(ger_hat_cf,na.rm = T),
ear_hat_cf=sum(ear_hat_cf,na.rm = T)) %>%
right_join(gera_energ_day,by = c("nom_subsistema.x"="nom_subsistema","date"="date"))->gera_energ_day
gera_energ_day
gera_energ_day %>%
group_by(trend) %>% summarise(val_geracao=sum(ger_hat,na.rm = T),
ger_hidroeletrica=sum(ger_hidroeletrica,na.rm = T)) %>%
ggplot(aes(trend))+
geom_line(aes(y=val_geracao),col="blue")+
geom_line(aes(y=ger_hidroeletrica),col="red")+theme_minimal()
predict(m_gam_fontes,newdata = ger %>%
mutate(val_geracao=ger_hat) )
gera_energ_day$ger_termica_prevista<-predict(m_gam_fontes,
newdata = gera_energ_day %>%
mutate(
nom_subsistema=nom_subsistema.x,
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
)
gera_energ_day$ger_termica_prevista_cf<-predict(m_gam_fontes,
newdata = gera_energ_day %>%
mutate(ger_hidroeletrica=ger_hidroeletrica+penalidade_geração_hidro,
nom_subsistema=nom_subsistema.x,
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
)
gera_energ_day %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(trend) %>%summarise(ger_termica_prevista=sum(ger_termica_prevista,na.rm=T),
ger_termica_prevista_cf=sum(ger_termica_prevista_cf,na.rm=T)) %>%
ggplot(aes(x = trend,)) +
geom_line(aes(y = ger_termica_prevista/1000, color = "Previsto"), size = 0.7,alpha=.6) +
geom_line(aes(y = ger_termica_prevista_cf/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
geom_ribbon(aes(ymin=ger_termica_prevista/1000,ymax=ger_termica_prevista_cf/1000),alpha=.4,fill = "firebrick",)+
labs(title = "Contrafactual baseline (clima médio 2001-2010)",
y = "Geração Termica (GWmês)", x = "Data") +
scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
theme_minimal()
gera_energ_day %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(trend,nom_subsistema.x) %>%summarise(ena_mw7=sum(ger_termica_prevista,na.rm=T),
clim2026_hat=sum(ger_termica_prevista_cf,na.rm=T)) %>%
ggplot(aes(x = trend,)) +
geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Contrafactual baseline (clima médio 2001-2010)",
y = "Geração Termica (GWmês)", x = "Data") +
scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
theme_minimal()
gera_energ_day %>%
mutate(mes = floor_date(date, unit = "month"),
penalidade_termico=ger_termica_prevista_cf-ger_termica_prevista,
#penalidade2=ena_mw7-clim2026_hat,
)->gera_energ_day
gera_energ_day %>%
mutate(mes = floor_date(date, unit = "month"),
penalidade1=ger_termica_prevista_cf-ger_termica_prevista,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(trend) %>%summarise(ena_mw7=sum(penalidade1,na.rm=T),
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>%
ggplot(aes(x = trend,)) +
#geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
geom_line(aes(y = ena_mw7/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Impacto líquido do clima recente sobre a Geração",subtitle = "Observado - Contrafactual 2026",
y = "Penalidade Climática na Termica (MWmês)", x = "Data") +
geom_ribbon(aes(ymin=ena_mw7/1000,ymax=0),alpha=.4,fill = "firebrick",)+
scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
theme_minimal()
gera_energ_day %>%
mutate(mes = floor_date(date, unit = "month"),
penalidade_termica=ger_termica_prevista_cf-ger_termica_prevista,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(trend,nom_subsistema.x) %>%summarise(penalidade_termica=sum(penalidade_termica,na.rm=T),
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>%
ggplot(aes(x = trend,)) +
#geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
geom_line(aes(y = penalidade_termica/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
labs(title = "Impacto líquido do clima recente sobre a Geração",subtitle = "Observado - Contrafactual 2026",
y = "Penalidade Climática na Termica (MWmês)", x = "Data") +
geom_ribbon(aes(ymin=penalidade_termica/1000,ymax=0),alpha=.4,fill = "firebrick",)+
scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
theme_minimal()
am maior volatilidade. Essa decomposição regional é crucial para
avaliar a elasticidade da escassez e o redirecionamento da pressão para
outras fontes de geração.
gera_energ_day %>%
mutate(penalidade1=ger_termica_prevista_cf-ger_termica_prevista,
penalidade_perc=ger_termica_prevista_cf/ger_termica_prevista,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(,nom_subsistema.x) %>%summarise(penalidade1=sum(penalidade1,na.rm=T),
ger_hat=sum(ger_hat,na.rm=T),
ger_hat_cf=sum(ger_hat_cf,na.rm=T),
penalidade_perc=mean(penalidade_perc,na.rm=T)
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>% mutate(custo_financeiro_usotermico=penalidade1*300)->penalidade_termico
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro"),penalidade_termico %>% mutate(estima="Térmico")) %>%
select(-starts_with("custo")) %>%
mutate(custo_Reais=case_when(estima=="Hidro"~penalidade1*-100,
TRUE~penalidade1*300),
custo_USD=custo_Reais/5.2
)
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro"),penalidade_termico %>% mutate(estima="Térmico")) %>%
select(-starts_with("custo")) %>%
mutate(custo_Reais=case_when(estima=="Hidro"~penalidade1*-100,
TRUE~penalidade1*300),
custo_USD=custo_Reais/5.2
) %>%
ggplot(aes(x=nom_subsistema.x,y=custo_USD/1000000,fill=estima))+geom_col(position = "dodge")+
geom_text(aes(y=custo_USD/1000000+2,label = round(custo_USD/1000, 1)), position=position_dodge(width=1), size = 3,check_overlap=F)+coord_flip()+
labs(title = "Custo econômico estimado da penalidade climática (2010-2023)",
subtitle = "Custo financeiro aproximado do impacto climático sobre a geração hidrelétrica e térmica",
y = "Custo (US$ mil)", x = "Subsistema") +theme_minimal()
PLD: Custo para o sistema
pld <- read.csv("preco_semanal.csv") # PLD semanal
pld$date <- as.Date(pld$datas) # idem para a base de PLD
pld$week <- lubridate::isoweek(pld$datas)
pld$year <- lubridate::year(pld$datas)
#pld$date<-pld$DATA_INICIO %>% as_date()
pld %>% spread(Submercado,preco)->pld
pld$date %>% min()->inicio
pld %>% filter(DATA_INICIO==inicio)
datas<-gera_energ_day$date %>% unique
data.frame(datas) %>% filter(datas>inicio-1) %>% arrange(datas) %>% left_join(pld,by = c("datas"="date"))->daas_completas
daas_completas
i=2
for (i in 1:length(daas_completas$ANO)) {#length(daas_completas$ANO)
print(i)
if (is.na(daas_completas$ANO[i])) {
daas_completas$ANO[i]<-daas_completas$ANO[i-1]
daas_completas$MES[i]<-daas_completas$MES[i-1]
daas_completas$SEMANA[i]<-daas_completas$SEMANA[i-1]
daas_completas$DATA_FIM[i]<-daas_completas$DATA_FIM[i-1]
daas_completas$SUDESTE[i]<-daas_completas$SUDESTE[i-1]
daas_completas$SUL[i]<-daas_completas$SUL[i-1]
daas_completas$NORDESTE[i]<-daas_completas$NORDESTE[i-1]
daas_completas$NORTE[i]<-daas_completas$NORTE[i-1]
}
}
daas_completas %>% gather(key = "nom_subsitema",value = "preco",c("NORDESTE","SUDESTE","SUL","NORTE"))->pld
serie <- daas_completas %>%
pull(NORDESTE) %>%
ts(start = c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot
serie <- daas_completas %>%
pull(SUL) %>%
ts(start = c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot
serie <- daas_completas %>%
pull(SUDESTE) %>%
ts(start = c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot
serie <- daas_completas %>%
pull(NORTE) %>%
ts(start = c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot
pld$Submercado %>% unique()
gera_energ_day$nom_subsistema.x %>% unique
#newdata_m1 %>% write.csv("base valores previstos.csv")
#gera_energ_day %>% write.csv("valores_previstos_day.csv")
gera_energ_day %>% inner_join(pld,by=c("date","nom_subsistema.x"="nom_subsitema"))->pld_full
pld_full %>% summary()
pld_full %>% group_by(date) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(date,preco))+geom_line()
pld_full %>%
group_by(trend) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(trend,preco))+geom_line()
pld_full %>%
group_by(month) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(month,preco))+geom_line()
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(mes,preco))+geom_line()
pld_full %>%
ggplot(aes(date,preco,nom_subsistema.x))+geom_line()+facet_wrap(~nom_subsistema.x)
pld_full %>%
group_by(trend,nom_subsistema.x) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(trend,preco))+geom_line()+facet_wrap(~nom_subsistema.x)
pld_full %>%
group_by(month,nom_subsistema.x) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(month,preco))+geom_line()+facet_wrap(~nom_subsistema.x)
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>% summarise(preco=mean(preco,na.rm = T)) %>%
ggplot(aes(mes,preco))+geom_line()+facet_wrap(~nom_subsistema.x)
modelos ingenuos
pld_full %>% str()
lm(log(preco)~log(ger_hidroeletrica)+log(ger_eolieletrica)+log(ger_fotovoltaica)+log(ger_termica)+
log(Demanda)+nom_subsistema.x,
data=pld_full %>%
mutate(ger_hidroeletrica=ifelse(ger_hidroeletrica==0,1,ger_hidroeletrica),
ger_fotovoltaica=ifelse(ger_fotovoltaica==0,1,ger_fotovoltaica),
ger_eolieletrica=ifelse(ger_eolieletrica==0,1,ger_eolieletrica),
ger_termica=ifelse(ger_termica==0,1,ger_termica),
#Demanda=ifelse(val_geracao_day_subsistema==0,1,val_geracao_day_subsistema),
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
)) %>% summary()
pld_full$ger_hidroeletrica %>% summary()
Aumento de 1% na geração hídrica reduz o preço em 1,7%.
+1% em eólica → +0,21% no preço.
Aumento de 1% na solar reduz preço em 0,40%.
Elasticidade forte: +1% na demanda → +1,95% no preço.
R² = 0.346 (~35%)
GAM Preço PLD
gam_mod <- gam(preco ~ #trend+
s(log(ger_hidroeletrica)) +
s(log(trend)) +
s(log(doy))+
s(log(ger_eolieletrica)) +
s(log(ger_fotovoltaica)) +
s(log(Demanda)) +
s(log(ger_termica))+
#s(nom_subsistema.x, bs = "re"),# efeito aleatório por reservatório
nom_subsistema.x,
data = pld_full %>%
mutate(
ger_hidroeletrica = ifelse(ger_hidroeletrica == 0, 1, ger_hidroeletrica),
ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
ger_termica = ifelse(ger_termica == 0, 1, ger_termica),
#Demanda = ifelse(val_geracao_day_subsistema == 0, 1, val_geracao_day_subsistema)
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
))
summary(gam_mod)
plot(gam_mod, pages = 3, shade = TRUE)
R² ajustado = 0.50 → o GAM explicou
metade da variância dos preços, contra ~0.35 do modelo
linear anterior.
- Deviance explained = 50% → muito mais
aderência.
Hidrelétrica
(s(log(ger_hidro)))
- O efeito é forte até certo ponto e depois
satura
Eólica
Linha relativamente plana, levemente negativa em valores
altos.
Mostra que a eólica tem efeito fraco ou até neutro em faixas
normais de operação, mas pode ajudar a baixar preços em condições
extremas.
Solar
- Efeito praticamente linear e negativo, mas fraco
(edf ≈ 1 → quase linear)
Demanda
- Claramente crescente, e mais íngreme em valores altos. Isso mostra que o preço responde de forma não linear:
- em demandas baixas/médias, efeito suave,
- em demandas muito altas, preço dispara
- Exatamente o comportamento esperado em sistemas com despacho por ordem de mérito.
Previsto PLD
#pld_full$prec_previsto<-predict(gam_mod,)
predict(gam_mod,newdata=pld_full %>%
mutate(
ger_hidroeletrica = ifelse(ger_hidroeletrica == 0, 1, ger_hidroeletrica),
ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
ger_termica = ifelse(ger_termica == 0, 1, ger_termica),
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
#Demanda = ifelse(val_geracao_day_subsistema == 0, 1, val_geracao_day_subsistema)
),type="response") -> pld_full$prec_previsto
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>% summarise(prec_previsto=mean(prec_previsto,na.rm = T),
preco=mean(preco,na.rm = T),
) %>%
ggplot(aes(mes,prec_previsto))+
geom_line(size = 1, linetype = "dashed",col="red") +
geom_line(aes(y=preco),col = "black")+
labs(y="$",x="Year")+theme_minimal()+
facet_wrap(~nom_subsistema.x,scales = "free")
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>%summarise(preco=mean(preco,na.rm=T),
prec_previsto=mean(prec_previsto,na.rm=T)) %>%
ggplot( aes(x = mes,)) +
#geom_point(aes(color=resid_col))+
facet_wrap(~nom_subsistema.x,scales = "free")+
geom_line(aes(y = prec_previsto),col="red") + #geom_line(aes(y=exp(prec_previsto))) +
geom_ribbon(aes(ymin=prec_previsto,ymax=preco),alpha=.4,fill = "firebrick",)+
labs(title = "Resíduos do modelo (observado - previsto)",
y = "Resíduo", x = "Data") +
theme_minimal()
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>% summarise(prec_previsto=mean(prec_previsto,na.rm = T),
preco=mean(preco,na.rm = T),
) %>%
ggplot(aes(mes,prec_previsto))+
geom_line(size = 1, linetype = "dashed",col="red") +
geom_line(aes(y=preco),col = "black")+
labs(y="$",x="Year")+theme_minimal()+
facet_wrap(~nom_subsistema.x,scales = "free")
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>%summarise(preco=mean(preco,na.rm=T),
prec_previsto=mean(prec_previsto,na.rm=T)) %>%
ggplot( aes(x = mes,)) +
#geom_point(aes(color=resid_col))+
facet_wrap(~nom_subsistema.x,scales = "free")+
geom_line(aes(y = prec_previsto),col="red") + geom_line(aes(y=prec_previsto)) +
geom_ribbon(aes(ymin=prec_previsto,ymax=preco),alpha=.4,fill = "firebrick",)+
labs(title = "Resíduos do modelo (observado - previsto)",
y = "Resíduo", x = "Data") +
theme_minimal()
Contrafactual PLD
gera_energ_day$ger_termica_prevista<-predict(m_gam_fontes,
newdata = gera_energ_day %>%
mutate(
nom_subsistema=nom_subsistema.x,
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
)
gera_energ_day$ger_termica_prevista_cf<-predict(m_gam_fontes,
newdata = gera_energ_day %>%
mutate(ger_hidroeletrica=ger_hidroeletrica+penalidade_geração_hidro,
nom_subsistema=nom_subsistema.x,
#ger_termica=ger_termica-penalidade_termico,
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
)
predict(gam_mod,newdata=pld_full %>%
mutate(
Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
ger_hidroeletrica = ifelse(is.na(ger_hidroeletrica+penalidade_geração_hidro),
1,
ger_hidroeletrica+penalidade_geração_hidro),
ger_hidroeletrica = ifelse(ger_hidroeletrica<1 , 1, ger_hidroeletrica),
ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
ger_termica = ifelse(ger_termica+penalidade_termico< 0.1, 1, ger_termica+penalidade_termico),
),type="response") -> pld_full$prec_previsto_cf
pld_full %>% ungroup() %>%
#mutate(penalidade_termico)
select(prec_previsto,prec_previsto_cf,preco,ger_termica,penalidade_termico,penalidade_geração_hidro) %>% summary()
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>% summarise(prec_previsto=mean(prec_previsto,na.rm = T),
preco=mean(preco,na.rm = T),
prec_previsto_cf=mean(prec_previsto_cf,na.rm = T),
) %>%
ggplot(aes(mes,(prec_previsto)))+
geom_line(size = 1, linetype = "dashed",col="red") +
#geom_line(aes(y=preco),col = "black")+
geom_line(aes(y=(prec_previsto_cf)),col = "blue")+
labs(y="$",x="Year")+theme_minimal()+
facet_wrap(~nom_subsistema.x,scales = "free")
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(mes,nom_subsistema.x) %>%summarise(prec_previsto_cf=mean(prec_previsto_cf,na.rm=T),
prec_previsto=mean(prec_previsto,na.rm=T)) %>%
ggplot( aes(x = mes,)) +
#geom_point(aes(color=resid_col))+
facet_wrap(~nom_subsistema.x,scales = "free")+
#geom_line(aes(y = exp(prec_previsto_cf)),col="red") +
geom_line(aes(y=(prec_previsto_cf)-(prec_previsto))) +
geom_ribbon(aes(ymin=0,ymax=(prec_previsto_cf)-(prec_previsto)),alpha=.4,fill = "firebrick",)+
labs(title = "Penalidade (Contrafactual- Predito)",
y = "Penalidade Climática no Preço", x = "Data") +
theme_minimal()
pld_full %>%
mutate(mes = floor_date(date, unit = "month")) %>%
group_by(year,nom_subsistema.x) %>%summarise(prec_previsto_cf=mean(prec_previsto_cf,na.rm=T),
prec_previsto=mean(prec_previsto,na.rm=T)) %>%
ggplot( aes(x = year,)) +
#geom_point(aes(color=resid_col))+
facet_wrap(~nom_subsistema.x,scales = "free")+
#geom_line(aes(y = exp(prec_previsto_cf)),col="red") +
geom_line(aes(y=(prec_previsto_cf)-(prec_previsto))) +
geom_ribbon(aes(ymin=0,ymax=(prec_previsto_cf)-(prec_previsto)),alpha=.4,fill = "firebrick",)+
labs(title = "Penalidade (Contrafactual- Predito)",
y = "Penalidade Climática no Preço", x = "Data") +
theme_minimal()
pld_full %>%
mutate(penalidade1=prec_previsto_cf-prec_previsto,
penalidade_perc=prec_previsto_cf/prec_previsto,
#penalidade2=ena_mw7-clim2026_hat,
) %>%
group_by(nom_subsistema.x) %>%summarise(penalidade1=sum(penalidade1,na.rm=T),
prec_previsto=sum(prec_previsto,na.rm=T),
prec_previsto_cf=sum(prec_previsto_cf*1000,na.rm=T),
prec=mean(preco,na.rm = T),
penalidade_perc=mean(penalidade_perc,na.rm=T)
#clim2026_hat=sum(penalidade2,na.rm=T)
) %>% mutate(custo_financeiro_pld=penalidade1)->penalidade_pld
penalidade_pld
ddsad
dsa
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro*"),
penalidade_termico %>% mutate(estima="Térmico**"),
penalidade_pld %>% mutate(estima="Operacional***")) %>%
select(-starts_with("custo")) %>%
mutate(custo_Reais=case_when(estima=="Hidro*"~(-penalidade1)*(296.8),
estima=="Térmico**"~penalidade1* 478.9,
TRUE~penalidade1*10000/7),
custo_USD=custo_Reais/5.2
) %>%
ggplot(aes(x=nom_subsistema.x,y=(custo_USD/100000),fill=estima))+geom_col(position = "dodge")+
geom_text(aes(label = round(custo_USD/100000, 2)), position=position_dodge(width=1), size = 3,check_overlap=F)+coord_flip()+
labs(title = "Custo econômico estimado da penalidade climática (2001-2019)",
subtitle = "Custo financeiro aproximado do impacto climático sobre a geração hidrelétrica e térmica",
caption = "*296,8 R$/MWh
**478,9 R$/MWh
*** Estimado em 10 GWh por semana",
y = "Custo (US$ milhões)", x = "Subsistema") +theme_minimal()
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro*"),
penalidade_termico %>% mutate(estima="Térmico**"),
penalidade_pld %>% mutate(estima="Operacional***")) %>%
select(-starts_with("custo")) %>%
mutate(custo_Reais=case_when(estima=="Hidro*"~(-penalidade1)*(296.8),
estima=="Térmico**"~penalidade1* 478.9,
TRUE~penalidade1*10000/7),
custo_USD=custo_Reais/5.2
) %>%
group_by(estima) %>% summarise(custo_USD=sum(custo_USD)) %>%
ggplot(aes(x=estima,y=(custo_USD/100000),fill=estima))+geom_col(position = "dodge")+
geom_text(aes(y=custo_USD/200000,label = round(custo_USD/100000, 1)), position=position_dodge(width=1), size = 3,check_overlap=F)+coord_flip()+
labs(title = "Custo econômico estimado da penalidade climática (2000-2019)",
subtitle = "Custo financeiro aproximado do impacto climático sobre a geração hidrelétrica e térmica",
caption = "*296,8 R$/MWh
**478,9 R$/MWh
*** Estimado em 10 GWh por semana",
y = "Custo (US$ Milhoes)", x = "Subsistema") +theme_minimal()
---
title: "Climate Penalties and Scarcity Pressure in Brazil’s Power Sector"
author: "Thiago Gardin & Daniel Danna"
date: "2025-10-06 "
output:
  html_notebook: 
    toc: true
    toc_depth: 2
    theme: journal
editor_options:
  chunk_output_type: inline
---

# Pacotes

```{r Carregar pacotes-base do projeto; definir opções globais}
# Carregar pacotes-base do projeto
# Manipulação e datas
library(tidyverse);library(data.table);library(lubridate);library(patchwork);library(Hmisc)

# Modelagem
library(mgcv);library(gratia);library(lubridate);library(modelsummary);library(gt);library(glue);library(scales);library(broom);library(broom.helpers);library(geobr)
# Utilidades
library(scales);library(patchwork);library(knitr);library(kableExtra)

# Definir opções globais de knitr
knitr::opts_chunk$set(
  echo       = TRUE,
  message    = TRUE,
  warning    = TRUE,
  dpi        = 120,
  fig.align  = "center",
  fig.width  = 12,
  fig.height = 8
)

# Tema visual padrão 
theme_article <- function(){
  theme_minimal(base_size = 11) +
    theme(
      plot.title = element_text(face="bold"),
      plot.subtitle = element_text(margin=margin(b=6)),
      plot.caption  = element_text(size=9, color="grey30"),
      axis.title = element_text(),
      panel.grid.minor = element_blank(),
      legend.position = "top"
    )
}
theme_set(theme_article())
set.seed(1234)
```

```{r helpers}
predict_gam_ci <- function(model, newdata, type = "link", level = 0.95){
  stopifnot(inherits(model, "gam"))
  pr <- predict(model, newdata = newdata, type = type, se.fit = TRUE)
  alpha <- 1 - level
  crit  <- qnorm(1 - alpha/2)
  tibble(
    .fitted = as.numeric(pr$fit),
    .se     = as.numeric(pr$se.fit),
    .lower  = .fitted - crit*.se,
    .upper  = .fitted + crit*.se
  )
}
export_figure <- function(p, filename, width = 7, height = 4.2){
  ggsave(glue("figures/{filename}.pdf"), plot = p, width = width, height = height, dpi = 300, device = cairo_pdf)
  ggsave(glue("figures/{filename}.eps"), plot = p, width = width, height = height, dpi = 300, device = "eps")
  ggsave(glue("figures/{filename}.tiff"),plot = p, width = width, height = height, dpi = 600, compression = "lzw")
  invisible(NULL)
}
export_table <- function(gt_obj, filename){
  gtsave(gt_obj, filename = glue("tables/{filename}.html"))
  # PNG (precisa webshot2 instalado/configurado)
  try(gtsave(gt_obj, filename = glue("tables/{filename}.png")))
  # LaTeX
  try(gtsave(gt_obj, filename = glue("tables/{filename}.tex")))
  invisible(NULL)
}

# Estilo padrão de tabela
gt_article <- function(dat, title = NULL, subtitle = NULL, note = NULL){
  dat %>%
    gt() %>%
    tab_header(title = md(title %||% ""), subtitle = md(subtitle %||% "")) %>%
    fmt_number(where(is.numeric), decimals = 2) %>%
    tab_options(table.font.size = px(12)) %>%
    opt_horizontal_padding(scale = 1.1) %>%
    opt_vertical_padding(scale = 1.1) %>%
    tab_source_note(md(note %||% "Notes: Author’s calculations."))
}
```

# 1. Introduction

This report documents the analytical pipeline developed to estimate the climatic penalty (penalidade climática) on Brazil’s electricity sector and to translate these effects into measurable economic costs. The analysis was conducted using monthly data from 2001 to 2019, covering all four subsystems of the National Interconnected System (SIN).

The study proceeds through the following steps:

1.  Hydrological modelling — We estimated the relationship between climatic variables (precipitation, temperature, humidity, wind) and stored energy (EAR) and hydroelectric generation using Generalized Additive Models (GAMs). These models capture non-linear climate–hydrology interactions and seasonal effects at the subsystem level.

2.  Climatic counterfactuals — Using the fitted GAMs, we simulated counterfactual trajectories fixing the climatic covariates at their historical mean levels (baseline 2001–2005). The deviation between observed and counterfactual values isolates the share of variation attributable exclusively to climate variability.

3.  Climate penalty (ΔE) — The climate penalty was defined as $ΔE=E_{predicted}−E_{cf}$ representing the loss (or gain) of hydro generation due solely to climatic fluctuations.

4.  Elasticities — We derived elasticities linking generation to hydrological and climatic conditions, and demand to price and income, to assess sensitivity and potential transmission channels of climatic shocks.

5.  Cost translation — The estimated penalties were converted into monetary terms along three cost dimensions:

6.  Consumers: additional expenditure due to replacement of cheaper hydro generation by more expensive sources;

7.  Electricity sector: higher spot market prices (PLD) and operational costs;

This empirical pipeline links climate variability, hydrological performance, and economic outcomes through a unified statistical framework, enabling a multidimensional valuation of climate-related risks in a hydro-dependent power system.

# 2. Data Preparation

This section describes the construction of the analytical dataset used to estimate the climatic penalty.\
All variables were harmonized at the **subsystem–day** level between 2001 and 2019, integrating hydrological, climatic, and market information.

### 2.1 Data Sources

-    **Hydropower generation (plant-day):** daily generation data compiled from ONS records, aggregated by subsystem.

-   **Reservoir levels and natural inflows (EAR and ENA):** subsystem-level daily data from ONS.

-   **Climatic variables:** precipitation and temperature obtained from the ECMWF/CAMS reanalysis dataset, interpolated to match subsystem centroids.

-   **Spot price (PLD):** weekly subsystem data from CCEE.

-   **Demand and generation dispatch by source:** monthly or weekly data from ONS and EPE.

All datasets were pre-processed to align date formats, harmonize variable names, and remove inconsistent or missing identifiers.

### 2.2 Data Loading and Cleaning

```{r data-in}
# Load core datasets
ger     <- read.csv("base_gera_tratada_set.csv")     # plant-day generation
pld     <- read.csv("preco_semanal.csv")             # weekly spot price (PLD)
reserv  <- read.csv("ena_ear_hidr_ceg_amb.csv")      # reservoir levels & inflows (EAR/ENA)
```


```{r data-in 2 }
# Convert character columns to factors
ger    <- ger    %>% mutate(across(where(is.character), as.factor))
reserv <- reserv %>% mutate(across(where(is.character), as.factor))
pld    <- pld    %>% mutate(across(where(is.character), as.factor))

# --- Date parsing and temporal variables ---
ger$date    <- as.Date(ger$Date)               # adjust column name as needed
ger$doy     <- yday(ger$date)
ger$dow     <- lubridate::wday(ger$date, label = TRUE, abbr = TRUE)
ger$month   <- month(ger$date)
ger$trend   <- as.numeric(ger$date)

reserv$date <- as.Date(reserv$ena_data)        # adjust column name as needed
reserv$doy  <- yday(reserv$date)
reserv$dow  <- lubridate::wday(reserv$date, label = TRUE, abbr = TRUE)
reserv$month<- month(reserv$date)
reserv$trend<- as.numeric(reserv$date)

pld$date    <- as.Date(pld$DATA_INICIO)        # adjust column name as needed
pld$week    <- isoweek(pld$date)
pld$year    <- year(pld$date)

```



```{r conferir e limpar colunas duplicadas}
duplicadas <- duplicated(as.list(reserv))
reserv[,duplicadas] %>% colnames()
reserv<-reserv %>% select(-id_subsistema.x.x,-id_subsistema.y.y,-nom_bacia.x,-nom_bacia.x,-nom_ree.x,-nom_ree.y,-nom_usina.x,-nom_subsistema.y.y,-nom_bacia.y)
```

### 2.3 Temporal Smoothing and Rolling Means
To reduce short-term noise and capture cumulative climatic effects, we computed **rolling means (7, 14, and 30 days)** for key hydrological and climatic variables.  



```{r}
library(zoo)
library(dplyr)

##diag_groups <- reserv %>%filter(tip_reservatorio=="Reservatório com Usina") %>% 
#  group_by(nom_reservatorio.x,id_reservatorio.x,tip_reservatorio) %>%
#  summarise(
#    n_total = n(),
#    n_non_na_precip = sum(!is.na(preciptation)),
#    n_non_na_temp   = sum(!is.na(temperature)),
#    n_non_na_ena    = sum(!is.na(ena_bruta_res_mwmed)),
#    n_non_na_ear    = sum(!is.na(ear_reservatorio_subsistema_proprio_mwmes)),
#    n_non_na_ger    = sum(!is.na(val_geracao)),
#    .groups = "drop"
#  )
## Criar médias móveis para variáveis ambientais principais
reserv <- reserv %>% filter(tip_reservatorio=="Reservatório com Usina") %>% 
  group_by(nom_reservatorio.x) %>%
  arrange(date, .by_group = TRUE) %>%
  mutate(
    # Precipitation (usa nome 'preciptation' como está na sua base)
    #precip_mm7   = rollmean(preciptation,  7),
    precip_mm14  = rollmean(preciptation, 14,fill = NA, align = "right"),
    precip_mm30  = rollmean(preciptation, 30,fill = NA, align = "right"),

    # Temperature
    temp_mm7     = rollmean(temperature,  7,fill = NA, align = "right"),
    temp_mm14    = rollmean(temperature, 14,fill = NA, align = "right"),
    temp_mm30    = rollmean(temperature, 30,fill = NA, align = "right"),

    # ENA
    ena_mw7      = rollmean(ena_bruta_res_mwmed,  7,fill = NA, align = "right"),
    #ena_mw14     = roll_mean_right(ena_bruta_res_mwmed, 14),
    #ena_mw30     = roll_mean_right(ena_bruta_res_mwmed, 30),

    # EAR (proprietário) — removeu fill="extend" (não suportado)
   # ear_mw7      = roll_mean_right(ear_reservatorio_subsistema_proprio_mwmes, 7),

    # Geração
    ger_mw7      = rollmean(val_geracao,  7,fill = NA, align = "right"),
    ger_mw14     = rollmean(val_geracao, 14,fill = NA, align = "right"),
    ger_mw30     = rollmean(val_geracao, 30,fill = NA, align = "right")
  ) %>%
  ungroup()

#diag_groups %>% filter(nom_reservatorio.x=="A. VERMELHA") 
#  
#reserv %>% filter(nom_reservatorio.x=="A. VERMELHA") %>% 
#  ggplot(aes(preciptation))+geom_line(aes(x=date,y=preciptation),col="lightblue")
#  select(date,nom_estado,val_geracao,preciptation,
#                                                         #earmax_reservatorio_subsistema_jusante_mwmes,ear_reservatorio_subsistema_proprio_mwmes,ear_maxima_total_mwmes) %>% summary
```




```{r}
# --- Conferir chaves principais ---
# verificar se datas e subsistemas batem
cat("Datas disponíveis:\n")
range(ger$date, na.rm=TRUE)
range(reserv$date, na.rm=TRUE)
range(pld$date, na.rm=TRUE)
```

### 2.4 Descriptive Summaries

```{r descriptive-summaries, message=FALSE, warning=FALSE}
library(dplyr)
library(tidyr)
library(gt)
library(purrr)
library(stringr)

# Helper: seleciona as variáveis exatas pedidas, se existirem no dataset
select_desc_vars <- function(df){
  wanted <- tidyselect::vars_select(
    names(df),
    starts_with("ear"),
    starts_with("tem"),
    starts_with("pre"),
    starts_with("ger"),
    val_geracao,
    val_geracao_day_subsistema,
    humidity,
    wind_speed
  )
  df %>% dplyr::select(nom_subsistema.x, dplyr::all_of(wanted))
}

# Helper: sumariza estatísticas para um data.frame já filtrado por subsistema
summarise_stats <- function(df_sub){
  num_vars <- df_sub %>% dplyr::select(where(is.numeric))
  dplyr::summarise(
    num_vars,
    dplyr::across(
      .cols = everything(),
      .fns  = list(
        Mean = ~mean(., na.rm = TRUE),
        SD   = ~sd(., na.rm = TRUE),
        Min  = ~min(., na.rm = TRUE),
        Max  = ~max(., na.rm = TRUE)
      ),
      .names = "{.col}__{.fn}"
    )
  ) %>%
    tidyr::pivot_longer(everything(),
      names_to = c("variable","stat"),
      names_sep = "__",
      values_to = "value"
    ) %>%
    tidyr::pivot_wider(names_from = stat, values_from = value) %>%
    dplyr::arrange(variable)
}

```

```{r}
# Tabela de cobertura temporal por subsistema
coverage_tbl <- reserv %>%
  dplyr::group_by(nom_subsistema.x) %>%
  dplyr::summarise(
    observations = dplyr::n_distinct(id_reservatorio.x),
    start_date  = min(date, na.rm = TRUE),
    end_date    = max(date, na.rm = TRUE),
    .groups = "drop"
  )

tab_cov <- gt_article(
  coverage_tbl,
  title = "**Table A. Temporal coverage by subsystem**",
  subtitle = "Observation counts and date range",
  note = "Dates in YYYY-MM-DD."
) %>%
  gt::cols_label(
    nom_subsistema.x   = "Subsystem",
    observations= "N of Reservoirs",
    start_date  = "Start",
    end_date    = "End"
  )

export_table(tab_cov, "TabA_Coverage_bySubsystem")
tab_cov
```

```{r}

# Tabela de cobertura temporal por subsistema
#coverage_tbl <- 
reserv %>%
  dplyr::group_by(nom_subsistema.x) %>%
  dplyr::summarise(
    Mean_geracao=mean(val_geracao, na.rm = TRUE),
    SD_geracao=mean(val_geracao, na.rm = TRUE),
    Min_geracao  = min(val_geracao, na.rm = TRUE),
    Max_geracao    = max(val_geracao, na.rm = TRUE),
    
    Mean_EAR=mean(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
    SD_EAR=mean(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
    Min_EAR  = min(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
    Max_EAR    = max(ear_reservatorio_subsistema_proprio_mwmes, na.rm = TRUE),
    
    Mean_precipmm30=mean(precip_mm30, na.rm = TRUE),
    SD_precipmm30=mean(precip_mm30, na.rm = TRUE),
    Min_precipmm30  = min(precip_mm30, na.rm = TRUE),
    Max_precipmm30    = max(precip_mm30, na.rm = TRUE),
    
    Mean_tempmm7=mean(temp_mm7, na.rm = TRUE),
    SD_tempmm7=mean(temp_mm7, na.rm = TRUE),
    Min_tempmm7  = min(temp_mm7, na.rm = TRUE),
    Max_tempmm7    = max(temp_mm7, na.rm = TRUE),
    
    Mean_humidity=mean(humidity, na.rm = TRUE),
    SD_humidity=mean(humidity, na.rm = TRUE),
    Min_humidity  = min(humidity, na.rm = TRUE),
    Max_humidity    = max(humidity, na.rm = TRUE),
    
    Mean_wind=mean(wind_speed, na.rm = TRUE),
    SD_wind=mean(wind_speed, na.rm = TRUE),
    Min_wind  = min(wind_speed, na.rm = TRUE),
    Max_wind    = max(wind_speed, na.rm = TRUE),
    
    .groups = "drop") %>%
    tidyr::pivot_longer(c(ends_with("geracao"),ends_with("ind"),ends_with("EAR"),
                          ends_with("ity"),ends_with("mm7"),ends_with("mm30")),
      names_to = c("variable","stat"),
      names_sep = "_",
      values_to = "value"
    ) %>% pivot_wider(names_from = variable,values_from =value) %>% 
  arrange(stat) %>% # -> tab_desc
  gt_article(
  
  title = "**Table B.  Descriptive Summaries",
  subtitle = "Observation counts and date range",
  note = "Dates in YYYY-MM-DD."
) %>%
  gt::cols_label(
    nom_subsistema.x   = "Subsystem",
    stat= "Variable",
    Mean  = "Mean",
    SD    = "SD",Min= "Min","Max"= "Max"
  )

#export_table(tab_cov, "TabA_Coverage_bySubsystem")
#tab_cov

```

```{r}



reserv %>% select(starts_with("ena"),
                                          starts_with("ear"),starts_with("tem"),starts_with("pre"),starts_with("ger"),
                                          val_geracao,val_geracao_day_subsistema,humidity,wind_speed) %>% stargazer::stargazer(type="text")
pld %>% stargazer::stargazer(type="text")
ger %>% select(val_geracao,nom_tipocombustivel,nom_tipousina=as.factor(nom_tipousina)) %>% summary

```

### [Gráficos rápidos: séries ENA, precipitação, temperatura, EAR, geração]

```{r fig.height=8, fig.width=12}
# --- Gráficos rápidos (EDA) ---
library(ggplot2)

# Série ENA/Reservatórios
plot_ena<-reserv %>% group_by(date) %>% summarise(ear_mw7=mean(ear_reservatorio_subsistema_proprio_mwmes,na.rm = T)) %>% 
  ggplot(aes(x=date, y=ear_mw7)) +
  geom_line(color="steelblue") +geom_smooth()+
  labs(title="Energia Armazenada (EAR) bruta (MWmed)", x="", y="MWmed")

# Série EAR
plot_ear<-reserv %>% group_by(date) %>% summarise(ena_mw7=mean(ena_mw7,na.rm = T)) %>% 
    ggplot(aes(x=date, y=ena_mw7)) +
  geom_line(color="darkgreen") +geom_smooth()+
  labs(title="Energia Natural Afluente (ENA) total (MWmês)", x="", y="MWmês")

# Série de geração
plot_ger<-reserv %>% group_by(date) %>% summarise(ger_mw7=mean(ger_mw7,na.rm = T)) %>% 
      ggplot(aes(x=date, y=ger_mw7)) +
  geom_line(color="grey30") +geom_smooth()+
  labs(title="Geração hidrelétrica (MWh/dia)", x="", y="MWh")

# --- Correlações rápidas ---
# [Checar correlação básica entre clima (precip, temp) e ENA]
clima_vars <- reserv %>% 
  dplyr::select(
                ger_mw_subsistema=val_geracao_day_subsistema,
                ger_mw=val_geracao,ger_mw7,ger_mw14,ger_mw30,
                ena_mw=ena_bruta_res_mwmed, ena_mw7,
                ear_mw=ear_total_mwmes,  #ear_mw14, ear_mw30,
                preciptation,precip_mm14,precip_mm30,
                temperature,temp_mm7,temp_mm14,temp_mm30,
                wind_speed, 
                )
```

```{r fig.height=8, fig.width=12}
plot_ger|plot_ear / plot_ena

corrplot::corrplot(cor(clima_vars, use = "pairwise.complete.obs"),method = "color", type = "upper",
         addCoef.col = "black", # mostrar coeficientes
         tl.col = "black", tl.srt = 35,number.cex		 =.8,
         col=colorRampPalette(c("red","white","blue"))(200))
```

```{r}
library(patchwork)
library(ggrepel)
geobr::read_region()->georegion

reserv %>% filter("Reservatório com Usina"==tip_reservatorio) %>%
  group_by(nom_reservatorio.y,val_latitude,val_longitude,nom_subsistema.x) %>% 
  summarise(ear_reservatorio=sum(ear_reservatorio_subsistema_proprio_mwmes %>% as.numeric(),na.rm = T),
            ) ->a
a %>%   ggplot(aes(val_longitude,val_latitude))+geom_point()+
ggplot(data=georegion) +geom_sf()
a$nom_subsistema.x %>% unique
a %>%
  mutate(nom_subsistema.x=case_when(nom_subsistema.x=="SUL"~"South",
                                    nom_subsistema.x=="SUDESTE"~"Southeast",
                                    nom_subsistema.x=="NORDESTE"~"Northeast",
                                    nom_subsistema.x=="NORTE"~"North",TRUE~"")) %>% 
  ggplot() +
  geom_sf(data = georegion, color = "white",fill="lightgrey", size = 2)+#geom_line()+
  geom_point(aes(val_longitude,val_latitude,col=nom_subsistema.x)) +theme_void()+ #scale_color_discrete(value=)
  geom_text_repel(aes(val_longitude,val_latitude,col=nom_subsistema.x,label=nom_reservatorio.y),size = 2,max.overlaps=nrow(a),force_pull  =2)+
  #theme(legend.position=c(.8, .95),,legend.box.just = "right")+
  labs(col="Eletrical Subsystems")->map
map
```
```{r}
reserv <- reserv %>%
  mutate(
    doy   = yday(date),
    month = month(date),
    # transformação log para interpretação percentual (evita problemas com zero)
    l_precip = log1p(precip_mm30),
    l_temp   = log1p(temp_mm7),     # opcional: se preferir manter temp no nível, use temp_mm7 em vez de l_temp
    l_humidity =log1p(humidity),
    l_wind_speed=log(wind_speed)
  )
```

# 3.1 Modelo 1 — GAM “clima‑apenas” (baseline)

Modelo hidrológico parsimonioso no qual a Energia Armazenada (EAR) é explicada apenas por clima e controles sazonais/regionais, usando funções suaves (splines) em um GAM. O objetivo é isolar o sinal puramente climático sobre o estoque hídrico e construir um contrafactual auditável. Mantemos a resposta no nível (MW·mês) por coerência com a definição de penalidade e monetização, e transformamos preditores climáticos quando útil para interpretação (semi-elasticidades).
```{r}
# GAM (Gaussian, fREML). Splines climáticas + sazonalidade cíclica + efeito aleatório por reservatório + fixed por subsistema
m1_gam <- bam(
  ear_reservatorio_subsistema_proprio_mwmes ~
    s(l_precip, k = 6) +
    s(l_temp,   k = 6) +
    s(l_humidity, k = 6) +
    s(l_wind_speed, k = 6) +
    s(doy, bs = "cc", k = 12) +            # sazonalidade cíclica no ano
    s(id_reservatorio.x, bs = "re") +      # efeito aleatório por reservatório
    nom_subsistema.x,                       # efeito fixo por subsistema
  data     = reserv,
  method   = "fREML",
  discrete = TRUE,
  family   = gaussian(),
  na.action= na.exclude,
  knots    = list(doy = c(0.5, 366.5)),
  select   = TRUE                           # shrinkage para evitar wiggles
)


```

```{r}
summary(m1_gam)
gtsummary::tbl_regression(m1_gam)
summary(m1_gam)
gam.check(m1_gam)          # resíduos, QQ, k-index
concurvity(m1_gam, full=TRUE)
```

### Respostas marginais (plausibilidade e interpretação)
Para interpretar o comportamento funcional e avaliar plausibilidade, usamos derivadas parciais. Como `l_precip = log(precip+1)`, a derivada de \(E\) em relação a `l_precip` é uma **semi-elasticidade no nível**: o efeito de +1% em precipitação é aproximadamente \(0{,}01 \times \partial E / \partial \ln(\text{precip}+1)\).

```{r m1-derivatives, message=FALSE, warning=FALSE}
plot(m1_gam, pages=4, scheme=1, shade=TRUE, se=TRUE)


```
```{r}
d_precip <- derivatives(m1_gam, term = "s(l_precip)", type = "central")
d_precip <- d_precip %>%
  mutate(effect_per_1pct = 0.01 * .derivative) 
  #select(data, .fitted, .se, effect_per_1pct, lower, upper)

summary(d_precip$effect_per_1pct)
```
Com base nos gráficos de efeitos parciais, diagnósticos de resíduos e sumário estatístico do GAM (fREML, R²aj=0.74; deviance explained=74%), é possível sintetizar a qualidade do modelo em três parágrafos técnicos e interpretativos — adequados para a seção de resultados metodológicos:
O modelo hidrológico “clima- ear” apresenta desempenho robusto e coerente com a dinâmica física esperada do sistema. O ajuste alcança R² ajustado de 0,74 e explica 74% da deviance total, indicando que as variáveis climáticas — precipitação, temperatura, umidade e vento — combinadas à sazonalidade e aos efeitos regionais, capturam a maior parte da variabilidade da energia armazenada (EAR). A significância estatística dos splines é elevada (p < 0.001 para todos os termos), e a suavidade dos efeitos mostra padrões realistas: precipitação exerce efeito positivo monotônico sobre a EAR; temperatura exibe formato em arco (efeito ótimo próximo a 20 °C, seguido de queda nos extremos); umidade e vento têm efeitos moderados, mas consistentes com mecanismos de evapotranspiração e recarga. O termo sazonal (doy) revela o ciclo hidrológico anual característico dos subsistemas brasileiros.

Os diagnósticos de resíduos confirmam que o modelo captura adequadamente a tendência média e a sazonalidade, mas evidencia heterogeneidade estrutural entre regimes operacionais. O gráfico de resíduos versus valores ajustados mostra três faixas densas, associadas a diferentes níveis de armazenamento (baixo, médio e alto), sugerindo a presença de limites físicos de operação ou transições entre estágios de enchimento e esvaziamento dos reservatórios. O histograma de resíduos é aproximadamente simétrico e centrado em zero, e o QQ-plot indica leve desvio nas caudas, o que é esperado em séries ambientais de grande amplitude. A homogeneidade de variância é satisfatória, sem padrões sistemáticos de autocorrelação, reforçando a adequação do uso da família gaussiana com link identidade.

Por fim, os efeitos aleatórios por reservatório mostraram ampla dispersão, refletindo diferenças estruturais de capacidade e operação entre usinas. A suavidade dos splines foi adequada (k-index > 0.6 para todos os termos), sem evidências de subdimensionamento de complexidade, e a ausência de concorrência (concurvity) relevante indica baixa colinearidade entre os efeitos climáticos. Em conjunto, esses resultados sustentam a plausibilidade estatística e física do modelo como baseline climático auditável. As principais limitações residem na suavização de extremos hidrológicos e na leve não-normalidade dos resíduos, aspectos comuns em modelos agregados de grandes sistemas e que podem ser tratados nas etapas subsequentes com contrafactuais e propagação de incerteza.

Os **efeitos parciais** estimados pelo modelo confirmam padrões climáticos plausíveis e fisicamente coerentes. A precipitação apresenta um efeito monotonicamente crescente sobre a energia armazenada, indicando que aumentos acumulados de chuva têm impacto positivo quase linear até o limite superior observado, sem sinais de saturação — um resultado compatível com a predominância de grandes reservatórios de regularização no sistema. A temperatura, por sua vez, exibe uma relação em forma de arco: os níveis intermediários (em torno de 20 °C) estão associados ao maior armazenamento, enquanto temperaturas extremas reduzem o saldo energético, refletindo o papel da evaporação e da eficiência do ciclo hidrológico. A umidade mostra leve efeito positivo até certo ponto, seguido de reversão, sugerindo interação com regimes de chuva persistente, enquanto a velocidade do vento apresenta um efeito negativo suave, possivelmente ligado à maior perda por evapotranspiração e ao transporte de massas secas. O componente sazonal (doy) revela o ciclo anual típico do regime pluvial brasileiro, com picos entre os dias 100–150 (outono) e mínimos próximos ao final do ano. Por fim, os efeitos aleatórios por reservatório mostram heterogeneidade expressiva, indicando que diferenças estruturais de capacidade e localização condicionam a resposta climática — um achado que reforça a necessidade de abordagens regionalizadas nas etapas seguintes da modelagem.



```{r}
#saveRDS(m1_gam, "m1_gam.rds")
#readRDS("m1_gam.rds") -> m1_gam

```

#### Predições factual vs. contrafactual (baseline 2001–2005)
Construímos o contrafactual climático fixando clima no **médio mensal 2001–2005** por reservatório (ou por subsistema, caso prefira) e mantendo os demais controles observados.



```{r}
# Baseline climático por reservatório e mês (2001–2005); ajuste se preferir por subsistema
clim_baseline <- reserv %>%
  filter(year(date) >= 2001, year(date) <= 2005) %>%
  group_by(id_reservatorio.x, doy) %>%
  summarise(
    l_precip_bl = mean(l_precip, na.rm = TRUE),
    l_temp_bl   = mean(l_temp,   na.rm = TRUE),
    l_humidity_bl = mean(l_humidity, na.rm = TRUE),
    l_wind_speed_bl     = mean(l_wind_speed, na.rm = TRUE),
    .groups = "drop"
  )

# newdata factual (observado) e contrafactual (clima fixo no baseline)
nd_obs <- reserv #%>% ungroup() %>% 
 #select(id_reservatorio.x, nom_subsistema.x, date, doy, month,
  #       l_precip, l_temp, l_humidity, l_wind_speed)

nd_cf <- reserv %>%
  left_join(clim_baseline, by = c("id_reservatorio.x","doy")) %>%
  mutate(
    l_precip = l_precip_bl,
    l_temp   = l_temp_bl,
    l_humidity = l_humidity_bl,
    l_wind_speed= l_wind_speed_bl
  ) #%>%
  #select(names(reserv))

# Predições no nível (MW·mês)
reserv$ear_hat_obs <- predict(m1_gam, newdata = reserv, type = "response")
reserv$ear_hat_cf  <- predict(m1_gam, newdata = nd_cf,  type = "response")

# Penalidade climática no EAR (pontual)
reserv$delta_ear_hat <- reserv$ear_hat_obs - reserv$ear_hat_cf
delta_ear_hat <- reserv$ear_hat_obs - reserv$ear_hat_cf
```

## 3.1.5 Propagação de Incerteza
Para quantificar a incerteza associada às estimativas de penalidade climática (ΔEAR), foram aplicados dois métodos complementares: o Delta Method analítico e a Simulação Paramétrica Multivariada. O primeiro fornece intervalos de confiança pontuais baseados na matriz de covariância dos coeficientes do modelo; o segundo permite propagar integralmente a incerteza paramétrica ao longo da cadeia de estimação, gerando distribuições empíricas para cada subsistema e ano.

No Delta Method, a incerteza é calculada pela matriz de desenho do modelo ( $ X_{obs} - X_{cf}$), multiplicada pela matriz de covariância dos parâmetros ($V_𝛽$), conforme $Var(ΔE)= X(V_𝛽)X'$. Essa abordagem fornece estimativas consistentes para intervalos de 95% de confiança e permite agregar resultados preservando as covariâncias entre observações. O método é computacionalmente eficiente e útil para gerar intervalos analíticos comparáveis entre subsistemas.

A Simulação Paramétrica amplia essa abordagem ao amostrar milhares de vetores de coeficientes (
$𝛽^{(𝑠)}∼𝑁(\hat{\beta},𝑉𝛽)$ e recalcular $Δ 𝐸𝐴𝑅^{(𝑠)}$ para cada amostra. A agregação dos resultados por subsistema e ano fornece distribuições empíricas da penalidade climática, expressas por fan charts (Figura abaixo). Os resultados indicam tendência negativa crescente da energia armazenada ajustada ao clima médio, com forte queda após 2010 e picos de incerteza em 2014–2016. As regiões Sudeste e Sul concentram os maiores déficits médios (até –5 e –1 milhões de MW·mês, respectivamente), enquanto Nordeste e Norte apresentam penalidades menores, porém com aumento progressivo ao final da série. Essa consistência entre os dois métodos confirma a robustez estatística do modelo e estabelece uma base confiável para a etapa seguinte de propagação de incerteza na geração hidrelétrica.



#### Incerteza (método 4: **Delta method** analítico)
Estimamos ICs para \(\Delta EAR\) via matriz de desenho no **link** (aqui, identity ⇒ já é nível). Agregações por ano/subsistema devem preservar a covariância.
```{r m1-delta-method, message=FALSE, warning=FALSE}
Vp      <- vcov(m1_gam)  # covariância dos coeficientes
X_obs   <- predict(m1_gam, newdata = nd_obs, type = "lpmatrix")
X_cf    <- predict(m1_gam, newdata = nd_cf,  type = "lpmatrix")
X_diff  <- X_obs - X_cf

# EP por observação
var_delta <- rowSums((X_diff %*% Vp) * X_diff)
se_delta  <- sqrt(pmax(var_delta, 0))
z         <- qnorm(0.975)

delta_lwr <- reserv$delta_ear_hat - z * se_delta
delta_upr <- reserv$delta_ear_hat + z * se_delta
reserv$delta_ear_upr<-delta_upr
reserv$delta_ear_lwr<-delta_lwr
m1_delta <- nd_obs %>%
  transmute(
    date, nom_subsistema.x,
    delta_hat = delta_ear_hat,
    delta_se  = se_delta,
    delta_lwr = delta_lwr,
    delta_upr = delta_upr
  )

# Agregar por ano/subsistema preservando covariância (combinação linear)
library(data.table)
dt <- as.data.table(nd_obs)[, .(date, nom_subsistema.x)]
dt[, year := year(date)]

# Vetor s_g = soma das linhas de X_diff no grupo (ano, subsistema)
groups <- unique(dt[, .(year, nom_subsistema.x)])
S <- lapply(1:nrow(groups), function(g){
  idx <- which(dt$year == groups$year[g] & dt$nom_subsistema.x == groups$nom_subsistema.x[g])
  colSums(X_diff[idx, , drop = FALSE])
})

agg_mean <- sapply(1:nrow(groups), function(g){
  sum(reserv$delta_ear_hat[dt$year == groups$year[g] & dt$nom_subsistema.x == groups$nom_subsistema.x[g]], na.rm = TRUE)
})
agg_var  <- sapply(S, function(sv) as.numeric(t(sv) %*% Vp %*% sv))
agg_se   <- sqrt(pmax(agg_var, 0))

m1_delta_agg <- cbind(groups,
  delta_mean = agg_mean,
  delta_lwr  = agg_mean - z * agg_se,
  delta_upr  = agg_mean + z * agg_se
)
```

#### Incerteza (método 1: **Simulação paramétrica** encadeável)
Amostramos os coeficientes da distribuição normal multivariada e recalculamos \(\Delta EAR^{(s)}\). Esse objeto será a **entrada probabilística** para o GAM 1.

```{r m1-montecarlo, message=FALSE, warning=FALSE}
library(MASS)
nsim <- 2000
set.seed(20251010)

beta_draws <- MASS::mvrnorm(n = nsim, mu = coef(m1_gam), Sigma = Vp)

# Pré-cálculo para eficiência
D <- X_diff             # N x p
# ΔEAR por simulação: cada coluna é uma sim, cada linha uma observação
delta_sims <- D %*% t(beta_draws)   # (N x nsim)

# Agregar por ano/subsistema em cada sim
dt$gid <- .GRP; dt[, gid := .GRP, by = .(year, nom_subsistema.x)]
G <- max(dt$gid)

agg_mat <- matrix(NA_real_, nrow = G, ncol = nsim)
for (g in 1:G) {
  idx <- which(dt$gid == g)
  agg_mat[g, ] <- colSums(delta_sims[idx, , drop = FALSE], na.rm = TRUE)
}

m1_sim_agg <- cbind(groups,
  mean = rowMeans(agg_mat),
  lwr  = apply(agg_mat, 1, quantile, 0.025),
  upr  = apply(agg_mat, 1, quantile, 0.975)
)

```
#### Visualização rápida (publicação)
Ribbons (Delta) e fan charts (MC) padronizados.


```{r m1-plots, fig.height=6, fig.width=12, message=FALSE, warning=FALSE}
library(ggplot2)

# Ribbon (Delta)
m1_delta_agg %>%
  ggplot(aes(x = year, y = delta_mean/1000)) +
  geom_ribbon(aes(ymin = delta_lwr/1000, ymax = delta_upr/1000), alpha = .25, fill = "firebrick") +
  geom_line() +
  facet_wrap(~nom_subsistema.x, scales = "free_y") +
  labs(title = "Climate penalty on stored energy (ΔEAR) — Delta method",
       y = "ΔEAR (GW·month)", x = "Year") +
  theme_minimal()

# Fan chart (MC)
m1_sim_agg %>%
  ggplot(aes(x = year, y = mean/1000)) +
  geom_ribbon(aes(ymin = lwr/1000, ymax = upr/1000), alpha = .25, fill = "steelblue") +
  geom_line() +
  facet_wrap(~nom_subsistema.x, scales = "free_y") +
  labs(title = "Climate penalty on stored energy (ΔEAR) — Parametric simulation",
       y = "ΔEAR (GW·month)", x = "Year") +
  theme_minimal()
```
Penalidade climática agregada e intervalos de confiança
```{r}
m1_summary <- m1_sim_agg %>%
  group_by(nom_subsistema.x) %>%
  summarise(
    mean_penalty = mean(mean, na.rm = TRUE),
    lwr_95 = mean(lwr, na.rm = TRUE),
    upr_95 = mean(upr, na.rm = TRUE),
    sd_penalty = sd(mean, na.rm = TRUE),
    .groups = "drop"
  )

# Convertendo para GWh/ano para interpretação
m1_summary <- m1_summary %>%
  mutate(
    mean_GWh = mean_penalty / 1000,
    lwr_GWh  = lwr_95 / 1000,
    upr_GWh  = upr_95 / 1000,
  ) #%>% select(-mean_penalty, -lwr_95, -upr_95)

# Tabela formatada (publicação)
library(gt)
m1_summary[,c("nom_subsistema.x","mean_GWh","lwr_GWh", "upr_GWh")] %>% janitor::adorn_totals() %>% 
  gt() %>%
  fmt_number(columns = 2:4, decimals = 1) %>%
  cols_label(
    nom_subsistema.x = "Subsystem",
    mean_GWh = "Mean ΔEAR (GWh)",
    lwr_GWh  = "Lower 95%",
    upr_GWh  = "Upper 95%",
  ) %>%
  tab_header(
    title = md("**Aggregate climate penalty on stored energy (2001–2018)**"),
    subtitle = "Simulated mean and 95% confidence intervals per subsystem"
  )
```
A Tabela apresenta a **penalidade climática média sobre a energia armazenada (ΔEAR)** no período 2001–2018, agregada por subsistema. Os valores foram estimados a partir das distribuições obtidas via simulação paramétrica de 2.000 sorteios da matriz de covariância dos coeficientes do modelo hidrológico. As penalidades médias foram expressas em gigawatts-mês (GWh·month), com intervalos de confiança de 95% com um total de **–1,606.3 (IC95%: −1,746.2;−1,470.2)  de GWh.

Os resultados indicam que o **subsistema Sudeste** concentra o maior déficit médio de armazenamento, estimado em aproximadamente **−1,178.4	 (IC95%:−1,262.4;−1,097.4)  de GWh·mês**, refletindo sua predominância no sistema interligado e sua maior exposição a anomalias de precipitação. O **Sul** apresenta penalidade intermediária (XXXXXXXXXXXX), mas com maior variabilidade interanual, compatível com seu regime pluviométrico mais irregular. No **Nordeste**, as perdas médias são menores (XXXXXXXXXXXXXX), embora com tendência negativa acentuada após 2010. Já o **Norte** apresenta valores próximos de zero, com intervalos de confiança que incluem a nulidade, sugerindo ausência de penalidade líquida significativa no período analisado.

Esses resultados corroboram a hipótese de que a **penalidade climática sobre o armazenamento hídrico é concentrada e estruturalmente assimétrica**, afetando com maior intensidade os subsistemas Sudeste e Sul — justamente aqueles com maior papel de regulação e suporte energético para o restante do país. Essa heterogeneidade espacial fornece o elo empírico para a próxima etapa da modelagem, em que as variações simuladas de \( \Delta EAR \) serão propagadas à geração hidrelétrica (GAM 1), à geração térmica (GAM 2) e, por fim, ao preço de curto prazo (GAM 3).


3.2 Modelo 2 — Geração Hidrelétrica como Função do Armazenamento
O segundo modelo da cadeia estima a geração hidrelétrica (G_hidro) em função da energia armazenada (EAR) e de controles operacionais e sazonais. O objetivo é capturar a elasticidade da geração em relação ao estoque hídrico, permitindo traduzir as variações simuladas de ΔEAR (penalidade climática) em impactos sobre a geração efetiva. Assim como no modelo climático, emprega-se um GAM para capturar relações não lineares entre variáveis físicas e operacionais, mantendo parcimônia e interpretabilidade.



# 3.2 Modelo 2 — Geração Hidrelétrica como Função do Armazenamento

```{r}

m2_hidro <- bam(
  val_geracao ~  Year+
    s(ear_reservatorio_subsistema_proprio_mwmes, k = 4)+
    s(val_geracao_day_subsistema, k = 4)+
    s(doy, bs = "cc", k = 2) +     # sazonalidade do dia do ano (cíclica)
    s(id_reservatorio.x, bs = "re")+# efeito aleatório por reservatório
   #s(val_vazaodefluente,k = 2)+

    nom_subsistema.x
  ,
  data     = reserv,
  method   = "fREML",
  discrete = TRUE,
  family   = gaussian(),            # família: normal; ajustar se necessário
  na.action= na.exclude,
  #knots    = list(doy = c(0.5, 366.5))
)
```

```{r}
summary(m2_hidro)
gam.check(m2_hidro)
concurvity(m2_hidro, full=TRUE)

```


```{r}

plot(m2_hidro, pages=3, scheme=1, shade=TRUE, se=TRUE, scales="free")
```
O modelo hidrelétrico (GAM 2) apresentou forte desempenho explicativo, com R² ajustado de 0,85 e deviance explicada de 85,2%, o que confirma sua alta capacidade de reproduzir a geração observada a partir da energia armazenada e variáveis operacionais. O termo linear para o ano é negativo e altamente significativo (–13,5 MW·mês/ano; p < 0,001), refletindo a tendência estrutural de redução da participação hídrica ao longo do período, possivelmente em função da expansão de fontes térmicas e renováveis não hídricas. Os efeitos fixos por subsistema indicam diferenças modestas, com geração média ligeiramente superior no Norte e inferior no Sudeste, consistentes com o papel estrutural de cada região na oferta de energia e no despacho do sistema.

Os diagnósticos de resíduos evidenciam ajuste adequado, com distribuição aproximadamente normal e ausência de heterocedasticidade sistemática. O histograma dos resíduos é centrado em zero, e o QQ-plot mostra leve curvatura nas caudas, indicando pequena assimetria associada a regimes operacionais extremos (reservatórios cheios ou vazios). O gráfico de resíduos versus preditos exibe duas faixas bem definidas, correspondentes a diferentes regimes de operação hidráulica — um de baixa geração com EAR limitada e outro de operação plena com altos níveis de despacho. Embora esses regimes introduzam leve estratificação, não há indícios de viés direcional nem autocorrelação relevante, o que reforça a validade do modelo gaussiano com link identidade. O teste de dimensionalidade efetiva (k-index > 0.9) e o baixo nível de concorrência (concurvity < 0.3) confirmam a estabilidade numérica dos splines e a ausência de sobreajuste.

Os efeitos parciais ilustram de forma clara a dinâmica física do sistema. O spline da energia armazenada (EAR) apresenta um formato crescente com leve saturação, sugerindo rendimento decrescente: aumentos iniciais de armazenamento produzem grandes acréscimos de geração, mas o efeito marginal diminui à medida que o reservatório se aproxima da capacidade máxima. O spline da geração diária do subsistema mostra relação quase linear positiva, representando o efeito de escala e coordenação entre usinas interligadas. A sazonalidade anual (doy) é fraca, refletindo o fato de que as oscilações sazonais já são internalizadas no nível de armazenamento, enquanto o efeito aleatório por reservatório indica ampla heterogeneidade estrutural — alguns reservatórios operam como usinas de base, com efeito próximo de zero, e outros com forte sensibilidade à variação de EAR. Em conjunto, esses resultados confirmam que o modelo capta adequadamente o mecanismo de conversão hidrológica entre estoque e geração, oferecendo base consistente para a estimativa contrafactual da geração hídrica sob diferentes cenários climáticos.



##Predições factual vs. contrafactual com incerteza (baseline 2001–2005)
O objetivo é comparar o armazenamento previsto pelo modelo sob condições climáticas observadas e sob condições neutras, representadas pelo clima médio do período 2001–2005. A diferença entre as duas séries ($ΔEAR=E^{obs}−E^{cf}$) representa a penalidade climática líquida, e sua incerteza é estimada via propagação dos erros paramétricos do GAM.

```{r}
# --- Predições factual e contrafactual ---
reserv$ear_hat_obs <- predict(m1_gam, newdata = nd_obs, type = "response")
reserv$ear_hat_cf  <- predict(m1_gam, newdata = nd_cf,  type = "response")

# Penalidade média
reserv <- reserv %>%
  mutate(delta_ear = ear_hat_obs - ear_hat_cf)

reserv$ger_hat_factual <- predict(
  m2_hidro, newdata = reserv,
  type = "response"
)
reserv$ger_hat_contraf <- predict(
  m2_hidro, newdata = reserv %>%
    mutate(ear_reservatorio_subsistema_proprio_mwmes = ear_hat_cf),
  type = "response"
)
reserv <- reserv %>%
  mutate(delta_Ghidro = ger_hat_factual - ger_hat_contraf)
reserv[,c("delta_Ghidro","ger_hat_factual","ger_hat_contraf","val_geracao")] %>% summary()
```
# (3) Incerteza via Delta Method ---------------------------------------------
```{r}
Vp2 <- vcov(m2_hidro)
X_f <- predict(m2_hidro, newdata = reserv ,
               type = "lpmatrix")
X_c <- predict(m2_hidro, newdata = reserv %>%
                 mutate(ear_reservatorio_subsistema_proprio_mwmes = ear_hat_cf),
               type = "lpmatrix")

X_diff2 <- X_f - X_c
var_delta2 <- rowSums((X_diff2 %*% Vp2) * X_diff2)
se_delta2  <- sqrt(pmax(var_delta2, 0))
z <- qnorm(0.975)

reserv <- reserv %>%
  mutate(
    delta_lwr_ger = delta_Ghidro - z * se_delta2,
    delta_upr_ger = delta_Ghidro + z * se_delta2
  )

```

```{r}
# (4) Agregação por ano e subsistema -----------------------------------------
m2_delta_agg <- reserv %>%
  mutate(Year = year(date)) %>%
  group_by(Year, nom_subsistema.x) %>%
  summarise(
    mean_penalty = mean(delta_Ghidro, na.rm = TRUE),
    lwr = mean(delta_lwr_ger, na.rm = TRUE),
    upr = mean(delta_upr_ger, na.rm = TRUE),
    .groups = "drop"
  )
m2_delta_agg %>% summary()
  
```

## Predições do modelo Geração

```{r}

newdata_m1 %>% 
  mutate(ger_hat = predict(m2_hidro, newdata = newdata_m1, type="response",na.action = na.pass)) -> newdata_m1

```

```{r fig.height=8, fig.width=12}
# 1) Série temporal: EAR observado vs previsto
newdata_m1 %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(mes,nom_subsistema.x) %>%summarise(val_geracao =mean(val_geracao   ,na.rm=T),
                             ger_hat=mean(ger_hat,na.rm=T)) %>%
  ggplot(aes(x = mes,)) +
  geom_line(aes(y = val_geracao, color = "Observado"), size = 0.7,alpha=.6) +
  geom_line(aes(y = ger_hat, color = "Previsto"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "EAR observado vs previsto (GAM)",
       y = "EAR (MWmês)", x = "Data") +
  scale_color_manual(values = c("Observado" = "black", "Previsto" = "red")) +
  theme_minimal()

newdata_m1 %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>%summarise(resid=mean(val_geracao,na.rm=T),
                                              ear_hat=mean(ger_hat,na.rm=T)) %>%
  
  ggplot( aes(x = mes,)) +
  #geom_point(aes(color=resid_col))+
  facet_wrap(~nom_subsistema.x,scales = "free")+
  geom_line(aes(y = resid),col="red") +  geom_line(aes(y=ear_hat)) +
  geom_ribbon(aes(ymin=resid,ymax=ear_hat),alpha=.4,fill = "firebrick",)+
  labs(title = "Resíduos do modelo (observado - previsto)",
       y = "Resíduo", x = "Data") +
  theme_minimal()

```

### Ajuste do GAM: séries temporais e dispersão

A Figura 1 apresenta a comparação entre os níveis de EAR observados e os valores previstos pelo modelo GAM, desagregados por subsistema.

-   **Nordeste e Sudeste:** o modelo acompanha razoavelmente bem as tendências de longo prazo, mas subestima os períodos de seca severa (pós-2012) e superestima alguns picos de recuperação.

-   **Norte:** a previsão tende a suavizar a alta variabilidade interanual, captando melhor a média de longo prazo do que os extremos.

-   **Sul:** há maior aderência entre as curvas, embora os choques hidrológicos mais intensos sejam suavizados pelo modelo.

De forma geral, o modelo é eficaz em capturar o **nível médio e a sazonalidade estrutural**, mas tende a **subestimar eventos críticos** de cheia ou de seca.

```{r}

# 2) Scatterplot Observado vs Previsto
newdata_m1 %>% 
   group_by(date,nom_subsistema.x) %>%summarise(val_geracao=sum(val_geracao,na.rm=T),
                             ger_hat=sum(ger_hat,na.rm=T)) %>%
  ggplot( aes(x = val_geracao, y = ger_hat)) +
  geom_point(alpha = 0.1) +
  geom_abline(slope = 1, intercept = 0, linetype = "dashed", color = "blue")  +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Dispersão EAR observado vs previsto",
       x = "Previsto (GAM)", y = "Observado") +
  theme_minimal()


```

A Figura 2 mostra os diagramas de dispersão entre os valores observados e previstos de EAR, também por subsistema, com a linha tracejada representando o ajuste perfeito (45°).

-   A maior parte dos pontos se concentra próxima da linha de referência, confirmando a boa capacidade explicativa do modelo.

-   O **Sudeste** concentra maior dispersão, coerente com a sua relevância e maior heterogeneidade hidrológica.

-   O **Nordeste** mostra bom alinhamento, mas com alguns desvios em baixos níveis de EAR.

-   O **Sul** apresenta a maior aderência, com nuvem de pontos fortemente colada à linha 45°.

Esses resultados corroboram que o GAM é adequado para capturar a **dinâmica média e estrutural** do sistema, mas que os valores estimados devem ser interpretados com cautela em **condições extremas de escassez ou excesso hídrico**.

## Contrafactural Geração Termica gam

```{r}
newdata_m1 %>% 
  mutate(ear_reservatorio_subsistema_proprio_mwmes=ear_reservatorio_subsistema_proprio_mwmes-clim_in$penalidade_ear)->newdata_m2
#newdata_m1 %>% 
#  mutate(ear_reservatorio_subsistema_proprio_mwmes=clim_in$clim2026_hat)->newdata_m2
newdata_m2$ger_hat_cf <- predict(m2_hidro, newdata = newdata_m2, type="response",na.action = na.pass)
```

```{r}
# 1) Série temporal: EAR observado vs previsto
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(,nom_subsistema.x) %>%summarise(ger_hat_cf =mean(ger_hat_cf   ,na.rm=T),
                             ger_hat=mean(ger_hat,na.rm=T)) %>%
  ggplot(aes(x = mes,)) +
  geom_line(aes(y = ger_hat_cf, color = "Previsto - Real"), size = 0.7,alpha=.6) +
  geom_line(aes(y = ger_hat, color = "Previsto - Contrafactual"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Geração Predito vs previsto (Contra-factual)",
       y = "EAR (MWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto - Real" = "black", "Previsto - Contrafactual" = "red")) +
  theme_minimal()
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(mes,) %>%summarise(ger_hat_cf =mean(ger_hat_cf   ,na.rm=T),
                             ger_hat=mean(ger_hat,na.rm=T)) %>%
  ggplot(aes(x = mes,)) +
  geom_line(aes(y = ger_hat_cf, color = "Previsto - Real"), size = 0.7,alpha=.6) +
  geom_line(aes(y = ger_hat, color = "Previsto - Contrafactual"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Geração Predito vs previsto (Contra-factual)",
       y = "EAR (MWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto - Real" = "black", "Previsto - Contrafactual" = "red")) +
  theme_minimal()
```

A figura compara, por subsistema, a **geração hidrelétrica prevista com clima observado** e a **geração contrafactual** simulada ao substituir o armazenamento (EAR) pelo baseline climático (2001–2010).

-   **Nordeste e Sudeste:** a série com **clima observado** apresenta quedas acentuadas após 2012, enquanto o **contrafactual** se mantém em patamares menores e mais estáveis. A divergência crescente reflete a **penalidade climática** recente sobre a geração.

-   **Norte:** o contrafactual acompanha de perto a trajetória média; a série real mostra oscilações adicionais em anos específicos, sugerindo choques não reproduzidos pelo clima médio.

-   **Sul:** há forte variabilidade interanual nas duas curvas; mesmo assim, a série real tende a ficar **abaixo** do contrafactual em anos secos, evidenciando substituição por outras fontes nesses períodos.

Em conjunto, os resultados indicam que **o clima recente reduziu a geração hídrica** em relação ao que seria esperado sob um regime climático médio, com intensidade maior no Sudeste e Nordeste.

```{r Contrafactual climático 1(baseline 2001–2005)}
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(Year) %>%summarise(ena_mw7=sum(ger_hat,na.rm=T),
                             clim2026_hat=sum(ger_hat_cf,na.rm=T)) %>%
  ggplot(aes(x = Year,)) +
  geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
  geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Contrafactual baseline (clima médio 2001-2010)",
       y = "Geração (GWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
  theme_minimal()
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(Year,nom_subsistema.x) %>%summarise(ena_mw7=sum(ger_hat,na.rm=T),
                             clim2026_hat=sum(ger_hat_cf,na.rm=T)) %>%
  ggplot(aes(x = Year,)) +
  geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
  geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Contrafactual baseline (clima médio 2001-2010)",
       y = "Geração (GWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
  theme_minimal()
```

A Figura 1 compara as trajetórias previstas de geração hidrelétrica sob duas condições:

-   **Previsto – Real (linha preta):** resultados do GAM com clima observado no período;

    **Previsto – Contrafactual (linha vermelha tracejada):** resultados do mesmo modelo, mas substituindo as variáveis climáticas pelas médias históricas (baseline 2001–2010).

```{r fig.height=6, fig.width=12}
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(Year,nom_subsistema.x) %>%summarise(ena_mw7=sum(ger_hat,na.rm=T),
                             clim2026_hat=sum(ger_hat_cf,na.rm=T)) %>%
  ggplot(aes(x = Year,)) +
  geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
  geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010 - baseline"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free",ncol = 2)+
  labs(title = "Contrafactual climático por subsistema (baseline 2001–2010)",
       y = "Geração (GWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010 - baseline" = "blue")) +
  theme_minimal()
```

```{r }
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month"),
          penalidade_geração_hidro=ger_hat-ger_hat_cf,
          #penalidade2=ena_mw7-clim2026_hat,
          )->newdata_m2
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month"),
          penalidade1=ger_hat-ger_hat_cf,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(Year) %>%summarise(ena_mw7=sum(penalidade1,na.rm=T),
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>%
  ggplot(aes(x = Year,)) +
  #geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
  geom_line(aes(y = ena_mw7/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Impacto líquido do clima recente sobre a Geração",subtitle = "Observado - Contrafactual 2026",
       y = "Penalidade Climática na Geração Hidroelética (MWmês)", x = "Data") +
    geom_ribbon(aes(ymin=ena_mw7/1000,ymax=0),alpha=.4,fill = "firebrick",)+

  scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
  theme_minimal()
```

```{r}
newdata_m2 %>% 
   mutate(mes = floor_date(date, unit = "month"),
          penalidade1=ger_hat-ger_hat_cf,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(Year,nom_subsistema.x) %>%summarise(penalidade_geração_hidro=sum(penalidade_geração_hidro,na.rm=T),
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>%
  ggplot(aes(x = Year,)) +
  #geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
  geom_line(aes(y = penalidade_geração_hidro/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Impacto líquido do clima recente sobre a Geração por subsistema",subtitle = "Observado - Contrafactual 2026",
       y = "Penalidade Climática na Geração Hidroelética (MWmês)", x = "Data") +
    geom_ribbon(aes(ymin=penalidade_geração_hidro/1000,ymax=0),alpha=.4,fill = "firebrick",)+

  scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
  theme_minimal()
```

```{r}
newdata_m2 %>% 
   mutate(penalidade1=ger_hat-ger_hat_cf,
          penalidade_perc=ger_hat/ger_hat_cf,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(,nom_subsistema.x) %>%summarise(penalidade1=sum(penalidade1,na.rm=T),
                                          ger_hat=sum(ger_hat,na.rm=T),
                                          ger_hat_cf=sum(ger_hat_cf,na.rm=T),
                                          penalidade_perc=mean(penalidade_perc,na.rm=T)
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>% mutate(custo_financeiro_marginal=penalidade1*100)->penalidade_hidrico
penalidade_hidrico
```

A Tabela resume os resultados quantitativos. As colunas reportam a geração prevista real (ger_hat), o contrafactual (ger_hat_cf), a penalidade absoluta (MWmês) e a penalidade percentual média (%). Os valores indicam que:

-   O **Sudeste** registrou a maior penalidade absoluta (≈ –3,5 milhões de MWmês), com perda média de **4,4%**.

-   O **Nordeste** perdeu ≈ –1 milhão de MWmês (–13,5%), confirmando vulnerabilidade estrutural.

-   O **Sul** apresentou penalidade menor em termos relativos (–9,2%), mas com alta variabilidade interanual.

-   O **Norte** foi o único subsistema a manter média contrafactual próxima à real, refletindo equilíbrio mais favorável entre clima e armazenamento.

```{r}
newdata_m1$ger_hat_cf <- newdata_m2$ger_hat_cf 
newdata_m1$penalidade_geração_hidro <- newdata_m2$penalidade_geração_hidro 

```

# Modelo de Propagação para outras fontes de energia

```{r}
ger$nom_tipocombustivel %>% unique()
ger %>%mutate(usina_fonte=paste0("ger_",nom_tipousina)) %>% 
  filter(!nom_subsistema=="PARAGUAI") %>% #,"_",nom_tipousina)) %>% 
  mutate(usina_fonte=case_when(usina_fonte=="ger_BOMBEAMENTO"~"ger_HIDROELÉTRICA",
                   TRUE~usina_fonte)) %>% #,"_",nom_tipousina)) %>% 

  group_by(date,nom_subsistema,usina_fonte,val_geracao_day_subsistema) %>% 
  summarise(ger=sum(val_geracao,na.rm = T)) %>% ungroup() %>% 
  spread(usina_fonte,ger,fill = 0) %>% janitor::clean_names() %>% 
  mutate()->gera_energ_day
gera_energ_day$doy    <- lubridate::yday(gera_energ_day$date)
gera_energ_day$dow    <- lubridate::wday(gera_energ_day$date, label=TRUE, abbr=TRUE)
gera_energ_day$month  <- lubridate::month(gera_energ_day$date)
gera_energ_day$trend  <- lubridate::year(gera_energ_day$date)
```

```{r fig.height=15, fig.width=10}
ger %>%
  mutate(usina_fonte=paste0("ger_",nom_tipousina),
         mes = floor_date(date, unit = "month")) %>%# select(usina_fonte) %>% unique()
  mutate(usina_fonte=case_when(usina_fonte=="ger_BOMBEAMENTO"~"ger_HIDROELÉTRICA",
                   TRUE~usina_fonte)) %>% #,"_",nom_tipousina)) %>% 
  group_by(mes,usina_fonte,nom_subsistema) %>% #nom_subsistema
  summarise(ger=mean(val_geracao,na.rm = T)) %>% 
    ggplot(aes(x = mes,y=ger,col=nom_subsistema)) +
    geom_line() +facet_wrap(~usina_fonte,scales = "free",ncol = 2)+
  labs(title = "Impacto líquido do clima recente sobre a ENA por subsistema",subtitle = "Observado - Contrafactual 2026",
       y = "ger (GWmês)", x = "Data") +
  theme_minimal()
```

```{r}
pld_full %>%
                 mutate(
                   ger_hidroeletrica = ifelse(ger_hidroeletrica == 0, 1, ger_hidroeletrica),
                   ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
                   ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
                   ger_termica = ifelse(ger_termica == 0, 1, ger_termica),
                   Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
                 ) %>% 
  ggplot(aes(date,))+
    geom_line(aes(y=Demanda),col="red")+
  geom_line(aes(y=val_geracao_day_subsistema,alpha = 0.1),col="black")+facet_wrap(~nom_subsistema.x,scales = "free_y")
```

```{r}
gera_energ_day %>% str()
options(scipen = 8)
lm(ger_termica~
     ger_hidroeletrica+
     ger_eolieletrica+ger_fotovoltaica+ger_nuclear+    
     nom_subsistema.x+0+
     trend+as.factor(month),
   data =gera_energ_day) %>% summary()
```

```{r}
lm(log(ger_termica)~
     log(ger_hidroeletrica)+
     ger_eolieletrica+ger_fotovoltaica+ger_nuclear+    
     nom_subsistema.x+0+
    trend+as.factor(month),
,
   data =gera_energ_day %>% 
     mutate(ger_hidroeletrica=case_when(ger_hidroeletrica<0.01~1,
                                             TRUE~ger_hidroeletrica),
            ger_termica=case_when(ger_termica<0.01~1,
                                             TRUE~ger_termica))
   ) %>% summary()
```

```{r}
gera_energ_day$date %>% summary()
lm(ger_termica~
     ger_hidroeletrica+
     ger_eolieletrica+ger_fotovoltaica+ger_nuclear+    
     nom_subsistema.x+0+
     trend+as.factor(month),
,
   data =gera_energ_day %>% filter(date>2018-01-01 )) %>% summary()
```

```{r}
lm(ger_termica~
     ger_hidroeletrica+
     ger_eolieletrica+ger_fotovoltaica+ger_nuclear +
     trend+as.factor(month)
     #nom_subsistema+0
     ,
   data =gera_energ_day) %>% summary()
```

```{r}
lm(ger_termica~
     ger_hidroeletrica*nom_subsistema.x+
     ger_eolieletrica+ger_fotovoltaica+ger_nuclear +
     trend+as.factor(month),
     #nom_subsistema+0,
   data =gera_energ_day) %>% summary()
```

```{r}

library(mgcv)
    # ger_eolieletrica+ger_fotovoltaica+ger_nuclear +
    # trend+as.factor(month)
m_gam_fontes <- bam(ger_termica  ~ s(ger_hidroeletrica, k=3) + s(ger_eolieletrica, k=4) +
                      s(ger_fotovoltaica, k=3)   +             + s(ger_nuclear, k=3) +
                      s(trend, k=3) + s(month, k=4) +
                      #s(Demanda, k=4)+
                      s(nom_subsistema.x, bs = "re"),
             data = gera_energ_day %>% 
               mutate(Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
))
summary(m_gam_fontes)
```

```{r}
gam.check(m_gam_fontes)                   # checa resíduos, QQ-plot, k-adequação
```

```{r}
concurvity(m_gam_fontes, full=TRUE)       # multicolinearidade não linear
plot(m_gam_fontes, pages=4, scheme=1, shade=TRUE, se=TRUE,scales = "free")
```

### Contrafactual Outras fontes de energia

```{r}
#newdata_m1$ear_hat_cf<-clim_in$clim2026_hat

newdata_m1 %>% 
  group_by(nom_subsistema.x,date) %>% 
  summarise(ear=sum(ear_reservatorio_subsistema_proprio_mwmes,na.rm = T),
            val_geracao=sum(val_geracao),
            ear_hat=sum(ear_hat,na.rm = T),
            ger_hat=sum(ger_hat,na.rm = T),
            penalidade_geração_hidro=sum(penalidade_geração_hidro,na.rm = T),
            ger_hat_cf=sum(ger_hat_cf,na.rm = T),
            ear_hat_cf=sum(ear_hat_cf,na.rm = T)) %>% 
  right_join(gera_energ_day,by = c("nom_subsistema.x"="nom_subsistema","date"="date"))->gera_energ_day
gera_energ_day
```

```{r}
gera_energ_day %>% 
  group_by(trend) %>% summarise(val_geracao=sum(ger_hat,na.rm = T),
                                ger_hidroeletrica=sum(ger_hidroeletrica,na.rm = T)) %>% 
  ggplot(aes(trend))+
  geom_line(aes(y=val_geracao),col="blue")+
  geom_line(aes(y=ger_hidroeletrica),col="red")+theme_minimal()
predict(m_gam_fontes,newdata = ger %>% 
  mutate(val_geracao=ger_hat) )

```

```{r}
gera_energ_day$ger_termica_prevista<-predict(m_gam_fontes,
                                             newdata = gera_energ_day %>%
                                               mutate(
                                                         nom_subsistema=nom_subsistema.x,
                                                      Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
                                             )
gera_energ_day$ger_termica_prevista_cf<-predict(m_gam_fontes,
                                                newdata = gera_energ_day %>% 
                                                  mutate(ger_hidroeletrica=ger_hidroeletrica+penalidade_geração_hidro,
                                                         nom_subsistema=nom_subsistema.x,
                                                         Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
                                                )
```

```{r Contrafactual climático 3(baseline 2001–2005)}
gera_energ_day %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(trend) %>%summarise(ger_termica_prevista=sum(ger_termica_prevista,na.rm=T),
                             ger_termica_prevista_cf=sum(ger_termica_prevista_cf,na.rm=T)) %>%
  ggplot(aes(x = trend,)) +
  geom_line(aes(y = ger_termica_prevista/1000, color = "Previsto"), size = 0.7,alpha=.6) +
  geom_line(aes(y = ger_termica_prevista_cf/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
  geom_ribbon(aes(ymin=ger_termica_prevista/1000,ymax=ger_termica_prevista_cf/1000),alpha=.4,fill = "firebrick",)+

  labs(title = "Contrafactual baseline (clima médio 2001-2010)",
       y = "Geração Termica (GWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
  theme_minimal()


gera_energ_day %>% 
   mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(trend,nom_subsistema.x) %>%summarise(ena_mw7=sum(ger_termica_prevista,na.rm=T),
                             clim2026_hat=sum(ger_termica_prevista_cf,na.rm=T)) %>%
  ggplot(aes(x = trend,)) +
  geom_line(aes(y = ena_mw7/1000, color = "Previsto"), size = 0.7,alpha=.6) +
  geom_line(aes(y = clim2026_hat/1000, color = "Contrafactual 2010"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Contrafactual baseline (clima médio 2001-2010)",
       y = "Geração Termica (GWmês)", x = "Data") +
  scale_color_manual(values = c("Previsto" = "black", "Contrafactual 2010" = "blue")) +
  theme_minimal()
```

```{r }
gera_energ_day %>% 
   mutate(mes = floor_date(date, unit = "month"),
          penalidade_termico=ger_termica_prevista_cf-ger_termica_prevista,
          #penalidade2=ena_mw7-clim2026_hat,
          )->gera_energ_day
gera_energ_day %>% 
   mutate(mes = floor_date(date, unit = "month"),
          penalidade1=ger_termica_prevista_cf-ger_termica_prevista,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(trend) %>%summarise(ena_mw7=sum(penalidade1,na.rm=T),
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>%
  ggplot(aes(x = trend,)) +
  #geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
  geom_line(aes(y = ena_mw7/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +#facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Impacto líquido do clima recente sobre a Geração",subtitle = "Observado - Contrafactual 2026",
       y = "Penalidade Climática na Termica (MWmês)", x = "Data") +
    geom_ribbon(aes(ymin=ena_mw7/1000,ymax=0),alpha=.4,fill = "firebrick",)+

  scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
  theme_minimal()

gera_energ_day %>% 
   mutate(mes = floor_date(date, unit = "month"),
          penalidade_termica=ger_termica_prevista_cf-ger_termica_prevista,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(trend,nom_subsistema.x) %>%summarise(penalidade_termica=sum(penalidade_termica,na.rm=T),
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>%
  ggplot(aes(x = trend,)) +
  #geom_line(aes(y = ena_mw7, color = "previsto - Contrafactual"), size = 0.7,alpha=.6) +
  geom_line(aes(y = penalidade_termica/1000, color = "Observado - Contrafactual 2026"), size = 1, linetype = "dashed") +facet_wrap(~nom_subsistema.x,scales = "free")+
  labs(title = "Impacto líquido do clima recente sobre a Geração",subtitle = "Observado - Contrafactual 2026",
       y = "Penalidade Climática na Termica (MWmês)", x = "Data") +
    geom_ribbon(aes(ymin=penalidade_termica/1000,ymax=0),alpha=.4,fill = "firebrick",)+

  scale_color_manual(values = c("Observado" = "black", "Contrafactual 2026" = "blue")) +
  theme_minimal()
```

am maior volatilidade. Essa decomposição regional é crucial para avaliar a elasticidade da escassez e o redirecionamento da pressão para outras fontes de geração.

```{r}
gera_energ_day %>% 
   mutate(penalidade1=ger_termica_prevista_cf-ger_termica_prevista,
          penalidade_perc=ger_termica_prevista_cf/ger_termica_prevista,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(,nom_subsistema.x) %>%summarise(penalidade1=sum(penalidade1,na.rm=T),
                                          ger_hat=sum(ger_hat,na.rm=T),
                                          ger_hat_cf=sum(ger_hat_cf,na.rm=T),
                                          penalidade_perc=mean(penalidade_perc,na.rm=T)
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>% mutate(custo_financeiro_usotermico=penalidade1*300)->penalidade_termico

```

```{r}
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro"),penalidade_termico %>% mutate(estima="Térmico")) %>% 
  select(-starts_with("custo")) %>% 
  mutate(custo_Reais=case_when(estima=="Hidro"~penalidade1*-100,
                             TRUE~penalidade1*300),
         custo_USD=custo_Reais/5.2
         ) 
```

```{r}
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro"),penalidade_termico %>% mutate(estima="Térmico")) %>% 
  select(-starts_with("custo")) %>% 
  mutate(custo_Reais=case_when(estima=="Hidro"~penalidade1*-100,
                             TRUE~penalidade1*300),
         custo_USD=custo_Reais/5.2
         ) %>% 
  ggplot(aes(x=nom_subsistema.x,y=custo_USD/1000000,fill=estima))+geom_col(position = "dodge")+
  geom_text(aes(y=custo_USD/1000000+2,label = round(custo_USD/1000, 1)), position=position_dodge(width=1), size = 3,check_overlap=F)+coord_flip()+
  labs(title = "Custo econômico estimado da penalidade climática (2010-2023)",
       subtitle = "Custo financeiro aproximado do impacto climático sobre a geração hidrelétrica e térmica",
       y = "Custo (US$ mil)", x = "Subsistema") +theme_minimal()
```

```{r}

```

## PLD: Custo para o sistema

```{r}
pld     <- read.csv("preco_semanal.csv")           # PLD semanal
pld$date <- as.Date(pld$datas)   # idem para a base de PLD
pld$week  <- lubridate::isoweek(pld$datas)
pld$year  <- lubridate::year(pld$datas)
```

```{r}

#pld$date<-pld$DATA_INICIO %>% as_date() 
pld %>% spread(Submercado,preco)->pld
pld$date %>% min()->inicio
pld %>% filter(DATA_INICIO==inicio)
datas<-gera_energ_day$date %>% unique
data.frame(datas) %>% filter(datas>inicio-1) %>% arrange(datas) %>% left_join(pld,by = c("datas"="date"))->daas_completas
daas_completas
i=2
for (i in 1:length(daas_completas$ANO)) {#length(daas_completas$ANO)
  print(i)
  if (is.na(daas_completas$ANO[i])) {
    daas_completas$ANO[i]<-daas_completas$ANO[i-1]
    daas_completas$MES[i]<-daas_completas$MES[i-1]
    daas_completas$SEMANA[i]<-daas_completas$SEMANA[i-1]
    daas_completas$DATA_FIM[i]<-daas_completas$DATA_FIM[i-1]
    daas_completas$SUDESTE[i]<-daas_completas$SUDESTE[i-1]
    daas_completas$SUL[i]<-daas_completas$SUL[i-1]
    daas_completas$NORDESTE[i]<-daas_completas$NORDESTE[i-1]
    daas_completas$NORTE[i]<-daas_completas$NORTE[i-1]

    
  }
  
}  
daas_completas %>% gather(key = "nom_subsitema",value = "preco",c("NORDESTE","SUDESTE","SUL","NORTE"))->pld
```

```{r}
serie <- daas_completas %>%
  pull(NORDESTE) %>%
  ts(start =  c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot

serie <- daas_completas %>%
  pull(SUL) %>%
  ts(start =  c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot

serie <- daas_completas %>%
  pull(SUDESTE) %>%
  ts(start =  c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot

serie <- daas_completas %>%
  pull(NORTE) %>%
  ts(start =  c(2001, 181), frequency = 365)
stl(serie,s.window = "periodic") %>% plot


```

```{r}
pld$Submercado %>% unique()
gera_energ_day$nom_subsistema.x %>% unique

#newdata_m1 %>% write.csv("base valores previstos.csv")
#gera_energ_day %>% write.csv("valores_previstos_day.csv")
```

```{r}
gera_energ_day %>% inner_join(pld,by=c("date","nom_subsistema.x"="nom_subsitema"))->pld_full
pld_full %>% summary()

```

```{r}
pld_full %>% group_by(date) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(date,preco))+geom_line()
pld_full %>% 
  group_by(trend) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(trend,preco))+geom_line()
pld_full %>% 
  group_by(month) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(month,preco))+geom_line()
pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(mes) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(mes,preco))+geom_line()
```

```{r}
pld_full %>% 
  ggplot(aes(date,preco,nom_subsistema.x))+geom_line()+facet_wrap(~nom_subsistema.x)

pld_full %>% 
  group_by(trend,nom_subsistema.x) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(trend,preco))+geom_line()+facet_wrap(~nom_subsistema.x)
pld_full %>% 
  group_by(month,nom_subsistema.x) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(month,preco))+geom_line()+facet_wrap(~nom_subsistema.x)
pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 

  group_by(mes,nom_subsistema.x) %>% summarise(preco=mean(preco,na.rm = T)) %>% 
  ggplot(aes(mes,preco))+geom_line()+facet_wrap(~nom_subsistema.x)
```

### modelos ingenuos

```{r}
pld_full %>% str()
```

```{r}
lm(log(preco)~log(ger_hidroeletrica)+log(ger_eolieletrica)+log(ger_fotovoltaica)+log(ger_termica)+
     log(Demanda)+nom_subsistema.x,
   data=pld_full %>%
     mutate(ger_hidroeletrica=ifelse(ger_hidroeletrica==0,1,ger_hidroeletrica),
            ger_fotovoltaica=ifelse(ger_fotovoltaica==0,1,ger_fotovoltaica),
            ger_eolieletrica=ifelse(ger_eolieletrica==0,1,ger_eolieletrica),
            ger_termica=ifelse(ger_termica==0,1,ger_termica),
            #Demanda=ifelse(val_geracao_day_subsistema==0,1,val_geracao_day_subsistema),
            Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,

            )) %>% summary()
pld_full$ger_hidroeletrica %>% summary()
```

-   Aumento de 1% na geração hídrica reduz o preço em 1,7%.

-   +1% em eólica → +0,21% no preço.

-   Aumento de 1% na solar reduz preço em 0,40%.

-   Elasticidade forte: +1% na demanda → +1,95% no preço.

-   R² = 0.346 (\~35%)

    ### GAM Preço PLD

```{r}
gam_mod <- gam(preco ~ #trend+
                 s(log(ger_hidroeletrica)) + 
                 s(log(trend)) +                
                 s(log(doy))+
                 s(log(ger_eolieletrica)) + 
                 s(log(ger_fotovoltaica)) + 
                 s(log(Demanda)) + 
                 s(log(ger_termica))+
                 #s(nom_subsistema.x, bs = "re"),# efeito aleatório por reservatório
                 nom_subsistema.x,
               data = pld_full %>%
                 mutate(
                   ger_hidroeletrica = ifelse(ger_hidroeletrica == 0, 1, ger_hidroeletrica),
                   ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
                   ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
                   ger_termica = ifelse(ger_termica == 0, 1, ger_termica),
                   #Demanda = ifelse(val_geracao_day_subsistema == 0, 1, val_geracao_day_subsistema)
                   Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
                 ))
```

```{r}
summary(gam_mod)
plot(gam_mod, pages = 3, shade = TRUE)

```

-   **R² ajustado = 0.50** → o GAM explicou **metade da variância** dos preços, contra \~0.35 do modelo linear anterior.

    -   **Deviance explained = 50%** → muito mais aderência.

-   **Hidrelétrica (`s(log(ger_hidro))`)**

    -   O efeito é **forte até certo ponto** e depois **satura**

-   Eólica

    -   Linha relativamente plana, levemente negativa em valores altos.

    -   Mostra que a eólica tem efeito fraco ou até neutro em faixas normais de operação, mas pode ajudar a baixar preços em condições extremas.

-   Solar

    -   Efeito praticamente **linear e negativo**, mas fraco (edf ≈ 1 → quase linear)

-   Demanda

```         
-   Claramente crescente, e mais íngreme em valores altos. Isso mostra que o preço responde de forma não linear:

    -   em demandas baixas/médias, efeito suave,

-   em demandas muito altas, preço dispara

-   Exatamente o comportamento esperado em sistemas com despacho por ordem de mérito.
```

### Previsto PLD

```{r}

#pld_full$prec_previsto<-predict(gam_mod,)

predict(gam_mod,newdata=pld_full %>%
                 mutate(
                   ger_hidroeletrica = ifelse(ger_hidroeletrica == 0, 1, ger_hidroeletrica),
                   ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
                   ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
                                      ger_termica = ifelse(ger_termica == 0, 1, ger_termica),
                   Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,

                   #Demanda = ifelse(val_geracao_day_subsistema == 0, 1, val_geracao_day_subsistema)
                 ),type="response") -> pld_full$prec_previsto
```

```{r}
pld_full %>% 

  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>% summarise(prec_previsto=mean(prec_previsto,na.rm = T),
                               preco=mean(preco,na.rm = T),
                               ) %>% 
  ggplot(aes(mes,prec_previsto))+
  geom_line(size = 1, linetype = "dashed",col="red") +
  geom_line(aes(y=preco),col = "black")+
  labs(y="$",x="Year")+theme_minimal()+
  facet_wrap(~nom_subsistema.x,scales = "free")

pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>%summarise(preco=mean(preco,na.rm=T),
                                              prec_previsto=mean(prec_previsto,na.rm=T)) %>%
  ggplot( aes(x = mes,)) +
  #geom_point(aes(color=resid_col))+
  facet_wrap(~nom_subsistema.x,scales = "free")+
  geom_line(aes(y = prec_previsto),col="red") +  #geom_line(aes(y=exp(prec_previsto))) +
  geom_ribbon(aes(ymin=prec_previsto,ymax=preco),alpha=.4,fill = "firebrick",)+
  labs(title = "Resíduos do modelo (observado - previsto)",
       y = "Resíduo", x = "Data") +

  theme_minimal()
```

```{r}
pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>% summarise(prec_previsto=mean(prec_previsto,na.rm = T),
                               preco=mean(preco,na.rm = T),
                               ) %>% 
  ggplot(aes(mes,prec_previsto))+
  geom_line(size = 1, linetype = "dashed",col="red") +
  geom_line(aes(y=preco),col = "black")+
  labs(y="$",x="Year")+theme_minimal()+
  facet_wrap(~nom_subsistema.x,scales = "free")
pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>%summarise(preco=mean(preco,na.rm=T),
                                              prec_previsto=mean(prec_previsto,na.rm=T)) %>%
  ggplot( aes(x = mes,)) +
  #geom_point(aes(color=resid_col))+
  facet_wrap(~nom_subsistema.x,scales = "free")+
  geom_line(aes(y = prec_previsto),col="red") +  geom_line(aes(y=prec_previsto)) +
  geom_ribbon(aes(ymin=prec_previsto,ymax=preco),alpha=.4,fill = "firebrick",)+
  labs(title = "Resíduos do modelo (observado - previsto)",
       y = "Resíduo", x = "Data") +
  theme_minimal()

```

### Contrafactual PLD

```{r}
gera_energ_day$ger_termica_prevista<-predict(m_gam_fontes,
                                             newdata = gera_energ_day %>%
                                               mutate(
                                                         nom_subsistema=nom_subsistema.x,
                                                      Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
                                             )
gera_energ_day$ger_termica_prevista_cf<-predict(m_gam_fontes,
                                                newdata = gera_energ_day %>% 
                                                  mutate(ger_hidroeletrica=ger_hidroeletrica+penalidade_geração_hidro,
                                                         nom_subsistema=nom_subsistema.x,
                                                         #ger_termica=ger_termica-penalidade_termico,
                                                         Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear)
                                                )
```

```{r}

predict(gam_mod,newdata=pld_full %>%
                 mutate(
                  Demanda = ger_eolieletrica+ger_fotovoltaica+ger_hidroeletrica+ger_termica+ger_nuclear,
                   ger_hidroeletrica = ifelse(is.na(ger_hidroeletrica+penalidade_geração_hidro),
                                              1,
                                              ger_hidroeletrica+penalidade_geração_hidro),
                   ger_hidroeletrica = ifelse(ger_hidroeletrica<1 , 1, ger_hidroeletrica),
                   ger_fotovoltaica = ifelse(ger_fotovoltaica == 0, 1, ger_fotovoltaica),
                   ger_eolieletrica = ifelse(ger_eolieletrica == 0, 1, ger_eolieletrica),
                  ger_termica = ifelse(ger_termica+penalidade_termico< 0.1, 1, ger_termica+penalidade_termico),

                 ),type="response") -> pld_full$prec_previsto_cf

pld_full %>% ungroup() %>% 
  #mutate(penalidade_termico)
  select(prec_previsto,prec_previsto_cf,preco,ger_termica,penalidade_termico,penalidade_geração_hidro) %>% summary()

                 
```

```{r}


pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>% summarise(prec_previsto=mean(prec_previsto,na.rm = T),
                               preco=mean(preco,na.rm = T),
                               prec_previsto_cf=mean(prec_previsto_cf,na.rm = T),
                               ) %>% 
  ggplot(aes(mes,(prec_previsto)))+
  geom_line(size = 1, linetype = "dashed",col="red") +
  #geom_line(aes(y=preco),col = "black")+
    geom_line(aes(y=(prec_previsto_cf)),col = "blue")+

  labs(y="$",x="Year")+theme_minimal()+
  facet_wrap(~nom_subsistema.x,scales = "free")

```

```{r}
pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(mes,nom_subsistema.x) %>%summarise(prec_previsto_cf=mean(prec_previsto_cf,na.rm=T),
                                              prec_previsto=mean(prec_previsto,na.rm=T)) %>%
  ggplot( aes(x = mes,)) +
  #geom_point(aes(color=resid_col))+
  facet_wrap(~nom_subsistema.x,scales = "free")+
  #geom_line(aes(y = exp(prec_previsto_cf)),col="red") + 
  geom_line(aes(y=(prec_previsto_cf)-(prec_previsto))) +
  geom_ribbon(aes(ymin=0,ymax=(prec_previsto_cf)-(prec_previsto)),alpha=.4,fill = "firebrick",)+
  labs(title = "Penalidade (Contrafactual- Predito)",
       y = "Penalidade Climática no Preço", x = "Data") +
  theme_minimal()
```

```{r}
pld_full %>% 
  mutate(mes = floor_date(date, unit = "month")) %>% 
  group_by(year,nom_subsistema.x) %>%summarise(prec_previsto_cf=mean(prec_previsto_cf,na.rm=T),
                                              prec_previsto=mean(prec_previsto,na.rm=T)) %>%
  ggplot( aes(x = year,)) +
  #geom_point(aes(color=resid_col))+
  facet_wrap(~nom_subsistema.x,scales = "free")+
  #geom_line(aes(y = exp(prec_previsto_cf)),col="red") + 
  geom_line(aes(y=(prec_previsto_cf)-(prec_previsto))) +
  geom_ribbon(aes(ymin=0,ymax=(prec_previsto_cf)-(prec_previsto)),alpha=.4,fill = "firebrick",)+
  labs(title = "Penalidade (Contrafactual- Predito)",
       y = "Penalidade Climática no Preço", x = "Data") +
  theme_minimal()
```

```{r}
pld_full %>% 
   mutate(penalidade1=prec_previsto_cf-prec_previsto,
          penalidade_perc=prec_previsto_cf/prec_previsto,
          #penalidade2=ena_mw7-clim2026_hat,
          ) %>% 

  group_by(nom_subsistema.x) %>%summarise(penalidade1=sum(penalidade1,na.rm=T),
                                          prec_previsto=sum(prec_previsto,na.rm=T),
                                          prec_previsto_cf=sum(prec_previsto_cf*1000,na.rm=T),
                                          prec=mean(preco,na.rm = T),
                                          penalidade_perc=mean(penalidade_perc,na.rm=T)
                             #clim2026_hat=sum(penalidade2,na.rm=T)
                             ) %>% mutate(custo_financeiro_pld=penalidade1)->penalidade_pld
penalidade_pld
```

ddsad

dsa

```{r}

bind_rows(penalidade_hidrico %>% mutate(estima="Hidro*"),

          penalidade_termico %>% mutate(estima="Térmico**"),
          penalidade_pld %>% mutate(estima="Operacional***")) %>% 
  select(-starts_with("custo")) %>% 
  mutate(custo_Reais=case_when(estima=="Hidro*"~(-penalidade1)*(296.8),
                               estima=="Térmico**"~penalidade1*	478.9,
                             TRUE~penalidade1*10000/7),
         custo_USD=custo_Reais/5.2
         ) %>% 
  ggplot(aes(x=nom_subsistema.x,y=(custo_USD/100000),fill=estima))+geom_col(position = "dodge")+
  geom_text(aes(label = round(custo_USD/100000, 2)), position=position_dodge(width=1), size = 3,check_overlap=F)+coord_flip()+
  labs(title = "Custo econômico estimado da penalidade climática (2001-2019)",
       subtitle = "Custo financeiro aproximado do impacto climático sobre a geração hidrelétrica e térmica",
       caption = "*296,8 R$/MWh
**478,9 R$/MWh
*** Estimado em 10 GWh por semana",
       y = "Custo (US$ milhões)", x = "Subsistema") +theme_minimal()
```

```{r}
bind_rows(penalidade_hidrico %>% mutate(estima="Hidro*"),

          penalidade_termico %>% mutate(estima="Térmico**"),
          penalidade_pld %>% mutate(estima="Operacional***")) %>% 
  select(-starts_with("custo")) %>% 
  mutate(custo_Reais=case_when(estima=="Hidro*"~(-penalidade1)*(296.8),
                               estima=="Térmico**"~penalidade1*	478.9,
                             TRUE~penalidade1*10000/7),
         custo_USD=custo_Reais/5.2
         ) %>% 
  group_by(estima) %>% summarise(custo_USD=sum(custo_USD)) %>% 
  ggplot(aes(x=estima,y=(custo_USD/100000),fill=estima))+geom_col(position = "dodge")+
  geom_text(aes(y=custo_USD/200000,label = round(custo_USD/100000, 1)), position=position_dodge(width=1), size = 3,check_overlap=F)+coord_flip()+
  labs(title = "Custo econômico estimado da penalidade climática (2000-2019)",
       subtitle = "Custo financeiro aproximado do impacto climático sobre a geração hidrelétrica e térmica",
       caption = "*296,8 R$/MWh
**478,9 R$/MWh
*** Estimado em 10 GWh por semana",
       y = "Custo (US$ Milhoes)", x = "Subsistema") +theme_minimal()
```
