Questão 1
O Histograma da série temporal das vazões naturais afluentes diárias a partir de 1931 em m3/s.
VNA <- read_excel("C:/Users/user/Desktop/Vida acadêmica/TS_engenharia/VAZAO_Natural_AFLUENTE.xlsx") # Importando os dados
VNA$`Vazao Afluente` <- as.numeric(VNA$`Vazao Afluente`) # Transformando a variável em numa variável numérica
str(VNA) # estrutura dos dados, veja que a variável date não está no formato data
## tibble [31,625 x 2] (S3: tbl_df/tbl/data.frame)
## $ Data : chr [1:31625] "1/jun/1932" "2/jun/1932" "3/jun/1932" "4/jun/1932" ...
## $ Vazao Afluente: num [1:31625] 98 100 102 105 106 101 98 100 98 97 ...
head(VNA) # top 10
## # A tibble: 6 x 2
## Data `Vazao Afluente`
## <chr> <dbl>
## 1 1/jun/1932 98
## 2 2/jun/1932 100
## 3 3/jun/1932 102
## 4 4/jun/1932 105
## 5 5/jun/1932 106
## 6 6/jun/1932 101
tail(VNA) # bottom 10
## # A tibble: 6 x 2
## Data `Vazao Afluente`
## <chr> <dbl>
## 1 26/dez/2018 109.
## 2 27/dez/2018 117.
## 3 28/dez/2018 130.
## 4 29/dez/2018 139.
## 5 30/dez/2018 138.
## 6 31/dez/2018 130.
summary(VNA$`Vazao Afluente`) # estatísticas descritivas da vazão
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 20.0 67.0 95.0 127.3 153.0 1253.0
sd(VNA$`Vazao Afluente`)
## [1] 95.45155
dates <- seq.Date(ymd("1932-06-01"), length.out = 31625, by = "day") # criar um vetor iniciando em 01/06/1932 já no formado "Date"
VNA <- cbind(VNA, dates) # concatenar o vetor nos nossos dados
VNA$Data <- NULL # vamos remover a variável "Data" original do banco, já que já temos uma nova no formao correto
histogramaQ1a <- VNA %>% ggplot(aes(x = `Vazao Afluente`)) + # variável X
geom_histogram(fill = "lightblue", # cor do gráfico
col = "black", # cor do contor
binwidth = 15) + # estros, aqui da pra colocar qualquer valor caso tu querias mais ou menos estratos de separação do histograma
labs(title = "Vazões Naturais Nfluentes Diárias a Partir de 1931",
subtitle = "Em m3/s") + xlab("Vazão") + ylab("Frequência") +
theme_bw() # tema mais clean
histogramaQ1a # ver o gráfico

linhaQ1a <- VNA %>% ggplot(aes(y = `Vazao Afluente`, x = dates)) + # variáveis X e Y
geom_line(col = "lightblue", lty = 1, lwd = 1.25) + # geom_line pq agora queremos uma linha e não mais um histograma
labs(title = "Vazões Naturais Nfluentes Diárias a Partir de 1931",
subtitle = "Em m3/s") + xlab("Ano") + ylab("Vazão") +
theme_bw()
linhaQ1a # ver o gráfico

grid.arrange(histogramaQ1a, linhaQ1a, nrow = 2) # ver os dois gráficos juntos

O Histograma da série das vazões afluentes diárias a partir de 2000 em m3/s.
P2020 <- read_excel("C:/Users/user/Desktop/Vida acadêmica/TS_engenharia/Prova_2020.xlsx") # Importando os dados
str(P2020)
## tibble [6,999 x 7] (S3: tbl_df/tbl/data.frame)
## $ Data : POSIXct[1:6999], format: "2000-01-01" "2000-01-02" ...
## $ Vazão Defluente(m^3/s) : num [1:6999] 89 172 211 208 204 201 206 208 207 205 ...
## $ Vazão Afluente : num [1:6999] 222 297 361 462 416 ...
## $ Diferença Afluente-Defluente(m^3/s): num [1:6999] 133 125 150 254 212 ...
## $ Nível(m) : num [1:6999] 906 907 907 907 908 ...
## $ Diferença de nível(m) : num [1:6999] 0 0.21 0.25 0.41 0.34 ...
## $ Geração(GWh) : num [1:6999] 0.348 0.683 0.837 0.84 0.839 ...
head(P2020)
## # A tibble: 6 x 7
## Data `Vazão Defluent~ `Vazão Afluente` `Diferença Aflu~
## <dttm> <dbl> <dbl> <dbl>
## 1 2000-01-01 00:00:00 89 222. 133.
## 2 2000-01-02 00:00:00 172 297. 125.
## 3 2000-01-03 00:00:00 211 361. 150.
## 4 2000-01-04 00:00:00 208 462. 254.
## 5 2000-01-05 00:00:00 204 416. 212.
## 6 2000-01-06 00:00:00 201 587. 386.
## # ... with 3 more variables: `Nível(m)` <dbl>, `Diferença de nível(m)` <dbl>,
## # `Geração(GWh)` <dbl>
summary(P2020$`Vazão Afluente`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.74 54.17 79.79 107.82 131.26 1137.22
sd(P2020$`Vazão Afluente`)
## [1] 87.87582
histogramaQ1b <- P2020 %>% ggplot(aes(x = `Vazão Afluente`)) +
geom_histogram(fill = "lightblue",
col = "black",
binwidth = 15) +
labs(title = "Vazões Naturais Nfluentes Diárias a Partir de 2000",
subtitle = "Em m3/s") + xlab("Vazão") + ylab("Frequência") +
theme_bw() # tema mais clean
histogramaQ1b

linhaQ1b <- P2020 %>% ggplot(aes(y = `Vazão Afluente`, x = Data)) + # variáveis X e Y
geom_line(col = "lightblue", lty = 1, lwd = 1.25) + # geom_line pq agora queremos uma linha e não mais um histograma
labs(title = "Vazões Naturais Nfluentes Diárias a Partir de 1931",
subtitle = "Em m3/s") + xlab("Ano") + ylab("Vazão") +
theme_bw()
linhaQ1b

grid.arrange(histogramaQ1b, linhaQ1b, nrow = 2)

O gráfico da série temporal da diferença entre a vazão afluente diária e a defluente a partir de 2000 em m3/s.
dates <- seq.Date(ymd("2000-01-01"), length.out = 6999, by = "day")
P2020 <- cbind(P2020, dates)
summary(P2020$`Diferença Afluente-Defluente(m^3/s)`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -407.4100 -30.5600 -7.4100 0.0132 22.2200 822.2200
linhaQ1c <- P2020 %>% ggplot(aes(y = P2020$`Diferença Afluente-Defluente(m^3/s)`, x = dates)) + # variáveis X e Y
geom_line(col = "lightblue", lty = 1, lwd = 1.25) + # geom_line pq agora queremos uma linha e não mais um histograma
labs(title = "Diferença Afluente-Defluente",
subtitle = "Em m^3/s") + xlab("Ano") + ylab("Vazão") +
theme_bw()
linhaQ1c

O gráfico da série temporal da variação de nível do reservatório a partir de 2000.
linhaQ1d <- P2020 %>% ggplot(aes(y = P2020$`Diferença de nível(m)`, x = dates)) + # variáveis X e Y
geom_line(col = "lightblue", lty = 1, lwd = 1.25) + # geom_line pq agora queremos uma linha e não mais um histograma
labs(title = "Diferença Afluente-Defluente",
subtitle = "Em m^3/s") + xlab("Ano") + ylab("Vazão") +
theme_bw()
linhaQ1d

O gráfico da correlação entre os gráficos dos ítens c e d.
cor(P2020$`Diferença Afluente-Defluente(m^3/s)`, P2020$`Diferença de nível(m)`)
## [1] 0.9861266
cor.test(P2020$`Diferença Afluente-Defluente(m^3/s)`, P2020$`Diferença de nível(m)`) # Correlação muito forte entra as variáveis
##
## Pearson's product-moment correlation
##
## data: P2020$`Diferença Afluente-Defluente(m^3/s)` and P2020$`Diferença de nível(m)`
## t = 496.93, df = 6997, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9854658 0.9867576
## sample estimates:
## cor
## 0.9861266
# rho = 0.9861266; correlação muito forte e positiva
# p < 0.01; (2.2e-16) a correlação é estatisticamente significativa
mean(P2020$`Diferença Afluente-Defluente(m^3/s)`)
## [1] 0.01315188
Cor <- cor(P2020[,c(4,6)])
corrplot(Cor, method = "number")

ggpairs(P2020[,c(4,6)],lower = list(continuous="smooth"))

O gráfico da variação de nível do reservatório em função da diferença entre as vazões afluente e defluente.
P2020 %>% ggplot(aes(y = P2020$`Diferença Afluente-Defluente(m^3/s)`, x = P2020$`Diferença de nível(m)`)) +
geom_point(col = "lightblue") +
theme_bw() +
geom_smooth(method = "lm", color = "red") +
geom_hline(yintercept = 0.01315188, linetype="dashed", color = "darkgreen") +
labs(title = "Correlação entre a Diferença Afluente-Defluente e Nível",
subtitle = "Em m3/s e m") + xlab("Nível") + ylab("Diferença Afluente-Defluente") +
theme_bw()

# veja que a linha da regressão demonstra uma relação quase perfeita e positiva. Em verde destaque a previsão pela média
Análise os gráficos e apresente conclusões.
# Dai é contigo
Questão 2
FdC <- read_excel("C:/Users/user/Desktop/Vida acadêmica/TS_engenharia/Fator_de_capacidade.xlsx")
str(FdC)
## tibble [6,824 x 3] (S3: tbl_df/tbl/data.frame)
## $ Data : POSIXct[1:6824], format: "2000-01-01" "2000-01-02" ...
## $ Fator de Capacidade: num [1:6824] 0.582 0.596 0.596 0.585 0.585 ...
## $ Geração(Mwmed) : num [1:6824] 26.2 26.8 26.8 26.3 26.3 ...
dates <- seq.Date(ymd("2000-01-01"), length.out = 6824, by = "day")
FdC <- cbind(FdC, dates)
FdC$Data <- NULL
str(FdC)
## 'data.frame': 6824 obs. of 3 variables:
## $ Fator de Capacidade: num 0.582 0.596 0.596 0.585 0.585 ...
## $ Geração(Mwmed) : num 26.2 26.8 26.8 26.3 26.3 ...
## $ dates : Date, format: "2000-01-01" "2000-01-02" ...
o gráfico do fator de capacidade diário da usina;
FdC %>% ggplot(aes(x = FdC$dates, y = FdC$`Fator de Capacidade`)) +
geom_line(col = "lightblue", lty = 1, lwd = 1.25) +
labs(title = "Variação diária do Fator de capacidade",
subtitle = "Em XXXX (sei lá a escala disso)") + xlab("Ano") + ylab("Fator de Capacidade") +
theme_bw()
## Warning: Use of `FdC$dates` is discouraged. Use `dates` instead.
## Warning: Use of `FdC$`Fator de Capacidade`` is discouraged. Use `Fator de
## Capacidade` instead.

o histograma do fator de capacidade da usina
FdC %>% ggplot(aes(x = `Fator de Capacidade`)) +
geom_histogram(fill = "lightblue",
col = "black",
bins = 30) +
labs(title = "Histograma do fator de capacidade da usina",
subtitle = "Em XXXX (sei lá a escala disso") +
xlab("Fator de Capacidade") + ylab("Frequência") +
theme_bw()

O sumário estatístico do fator de capacidade da usina
summary.psych(FdC$`Fator de Capacidade`)
describe(FdC$`Fator de Capacidade`)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 6824 0.39 0.21 0.37 0.37 0.21 0 1.33 1.33 0.77 0.16 0
summary(FdC$`Fator de Capacidade`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.2129 0.3671 0.3899 0.4832 1.3329
pairs.panels(FdC[,-3]) # Correlação perfeita entre Fator de Capacidade e Geração
