Resumo

Este é um exemplo de documento R Markdown que inclui informações do autor, subtítulo e uma formatação mais elaborada. Você pode personalizar ainda mais este documento de acordo com suas necessidades.

Introdução

Aqui está uma introdução ao seu relatório. Você pode usar formatação em Markdown para enfatizar palavras (itálico ou negrito), criar listas, inserir links como este e muito mais.

Conjunto de dados Ralie Unidade Geradora

summary(ralie_unidade_geradora)
 DatGeracaoConjuntoDados    DatRalie           IdeNucleoCEG      CodCEG          DatEmissaoAto       
 Min.   :2023-09-16      Min.   :2021-06-17   Min.   :  273   Length:4099733     Min.   :1975-06-13  
 1st Qu.:2023-09-16      1st Qu.:2022-09-28   1st Qu.:40775   Class :character   1st Qu.:2021-03-30  
 Median :2023-09-16      Median :2023-02-16   Median :48906   Mode  :character   Median :2022-03-22  
 Mean   :2023-09-16      Mean   :2023-01-17   Mean   :47047                      Mean   :2021-11-20  
 3rd Qu.:2023-09-16      3rd Qu.:2023-06-30   3rd Qu.:51516                      3rd Qu.:2022-10-18  
 Max.   :2023-09-16      Max.   :2023-09-16   Max.   :72955                      Max.   :2023-09-15  
                                                                                 NA's   :1808        
 SigUFPrincipal     DscOrigemCombustivel SigTipoGeracao     NomEmpreendimento    NumUgUsina     MdaPotenciaUnitaria
 Length:4099733     Length:4099733       Length:4099733     Length:4099733     Min.   :  1.00   Min.   :     5955  
 Class :character   Class :character     Class :character   Class :character   1st Qu.:  9.00   1st Qu.:    19842  
 Mode  :character   Mode  :character     Mode  :character   Mode  :character   Median : 30.00   Median :    22500  
                                                                               Mean   : 65.64   Mean   :   140069  
                                                                               3rd Qu.:109.00   3rd Qu.:   163700  
                                                                               Max.   :745.00   Max.   :321428000  
                                                                                                                   
 MdaPotenciaLiberadaTeste NumDespachoTeste   DatDescidaRotorOutorgada DatDescidaRotorRealizada
 Min.   :      29         Length:4099733     Mode:logical             Mode:logical            
 1st Qu.:   17500         Class :character   NA's:4099733             NA's:4099733            
 Median :   19841         Mode  :character                                                    
 Mean   :  156557                                                                             
 3rd Qu.:  137600                                                                             
 Max.   :56550000                                                                             
 NA's   :4024112                                                                              
 DatInicioOpTesteOutorgada DatLiberOpTesteRealizado DatUGInicioOpComerOutorgado DatPrevisaoOpComercialSFG
 Min.   :0202-02-12        Min.   :0202-04-05       Min.   :0202-03-01          Min.   :2021-06-30       
 1st Qu.:2022-12-30        1st Qu.:2022-03-30       1st Qu.:2023-09-15          1st Qu.:2024-11-15       
 Median :2023-11-01        Median :2022-09-09       Median :2025-05-01          Median :2027-04-15       
 Mean   :2023-02-15        Mean   :2022-05-24       Mean   :2023-12-08          Mean   :2026-09-13       
 3rd Qu.:2024-12-01        3rd Qu.:2023-03-23       3rd Qu.:2027-04-13          3rd Qu.:2028-06-10       
 Max.   :2058-12-01        Max.   :2023-09-15       Max.   :2029-12-29          Max.   :2029-12-29       
 NA's   :1884559           NA's   :4023610                                      NA's   :199039           

Análise Exploratória de Dados

Nesta seção, realizaremos uma análise exploratória de dados (EDA) do conjunto de dados mtcars. Vamos verificar vetores, criar resumos estatísticos e criar gráficos descritivos.

Verificar Vetores

Primeiro, vamos verificar os primeiros registros do conjunto de dados e listar os nomes das variáveis (vetores) disponíveis.

skim(ralie_unidade_geradora)
── Data Summary ────────────────────────
                           Values                
Name                       ralie_unidade_geradora
Number of rows             4099733               
Number of columns          19                    
_______________________                          
Column type frequency:                           
  character                6                     
  Date                     7                     
  logical                  2                     
  numeric                  4                     
________________________                         
Group variables            None                  

Reclassificar colunas:

skim(ralie_unidade_geradora)
── Data Summary ────────────────────────
                           Values                
Name                       ralie_unidade_geradora
Number of rows             4099733               
Number of columns          19                    
_______________________                          
Column type frequency:                           
  character                5                     
  Date                     7                     
  factor                   3                     
  logical                  2                     
  numeric                  2                     
________________________                         
Group variables            None                  
ralie_unidade_geradora %>%   select_if(is.numeric) %>% 
  pivot_longer(cols = everything(), names_to = "Variavel", values_to = "Valor") %>% 
  ggplot(aes(y=Valor, x=Variavel))+geom_boxplot()+geom_violin() +
  facet_wrap(~ Variavel, scales = "free") +coord_flip()+
  labs(
    title = "Gráfico de Frequência para Variáveis Numéricas",
    x = "Valor",
    y = "Frequência"
  ) +
  theme_minimal()

ralie_unidade_geradora %>%   select_if(is.factor) %>% 
  pivot_longer(cols = everything(), names_to = "Categoria", values_to = "Valor") %>% 
  ggplot(aes(x = reorder(Valor, -table(Valor)[Valor]))) +coord_flip()+
  geom_bar() +  facet_wrap(~ Categoria, scales = "free") +

  labs(
    title = "Gráfico de Barras da Variável Categórica",
    x = "Categoria",
    y = "Frequência"
  ) +
  theme_minimal()

#variaveis data
ralie_unidade_geradora %>%   select_if(is.Date) %>%  
  pivot_longer(cols = everything(), names_to = "Categoria", values_to = "Data") %>% 
  group_by(Data, Categoria) %>% summarise(n=n()) %>% 
  ggplot(aes(x = Data,n)) +
  geom_line() +  facet_wrap(~ Categoria, scales = "free") +

  labs(
    title = "Gráfico de Linha da Variável Categórica",
    x = "data",
    y = "Frequência"
  ) +
  theme_minimal()
`summarise()` has grouped output by 'Data'. You can override using the `.groups` argument.

Conjunto de dados Abril

X06_InfoHorário_Abr21 <- read_excel("01.InfoHorário_Abr21.xlsx", 
    sheet = "006 Hidráulicas MRE", skip = 14)
Warning: Expecting numeric in B496097 / R496097C2: got 'Topo'Warning: Expecting numeric in B496099 / R496099C2: got 'Nota(1): As informações disponibilizadas nesse relatório consideram o evento de contabilização de cada mês.'Warning: Expecting numeric in B496100 / R496100C2: got 'Nota(2): Esta aba possui 1 tabela.'Warning: Expecting numeric in B496101 / R496101C2: got 'A Câmara de Comercialização de Energia Elétrica - CCEE não se responsabiliza, em qualquer tempo, sob qualquer condição e hipótese, por estudos, projeções e/ou negociações que sejam realizadas com fundamento'Warning: Expecting numeric in B496102 / R496102C2: got 'nos dados constantes do presente relatório.'
X06_InfoHorário_Abr21 <- read_excel("01.InfoHorário_Abr21.xlsx", 
    sheet = "006 Hidráulicas MRE", skip = 14)
Warning: Expecting numeric in B496097 / R496097C2: got 'Topo'Warning: Expecting numeric in B496099 / R496099C2: got 'Nota(1): As informações disponibilizadas nesse relatório consideram o evento de contabilização de cada mês.'Warning: Expecting numeric in B496100 / R496100C2: got 'Nota(2): Esta aba possui 1 tabela.'Warning: Expecting numeric in B496101 / R496101C2: got 'A Câmara de Comercialização de Energia Elétrica - CCEE não se responsabiliza, em qualquer tempo, sob qualquer condição e hipótese, por estudos, projeções e/ou negociações que sejam realizadas com fundamento'Warning: Expecting numeric in B496102 / R496102C2: got 'nos dados constantes do presente relatório.'
X07_InfoHorário_Abr21 <- read_excel("01.InfoHorário_Abr21.xlsx", 
    sheet = "007 Demais usinas", skip = 14)
Warning: Expecting numeric in B139217 / R139217C2: got 'Topo'Warning: Expecting numeric in B139219 / R139219C2: got 'Nota(1): As informações disponibilizadas nesse relatório consideram o evento de contabilização de cada mês.'Warning: Expecting numeric in B139220 / R139220C2: got 'Nota(2): Esta aba possui 1 tabela.'Warning: Expecting numeric in B139221 / R139221C2: got 'A Câmara de Comercialização de Energia Elétrica - CCEE não se responsabiliza, em qualquer tempo, sob qualquer condição e hipótese, por estudos, projeções e/ou negociações que sejam realizadas com fundamento'Warning: Expecting numeric in B139222 / R139222C2: got 'nos dados constantes do presente relatório.'Warning: Expecting numeric in B139223 / R139223C2: got 'OBS: Nesta aba estão presentes os dados das usinas não contempladas nas demais abas.'
rbind(colnames(X01_InfoHorário_Abr21),
      colnames(X02_InfoHorário_Abr21),
      colnames(X03_InfoHorário_Abr21),
      colnames(X04_InfoHorário_Abr21),
      colnames(X05_InfoHorário_Abr21),
      colnames(X06_InfoHorário_Abr21),
      colnames(X07_InfoHorário_Abr21)
      )->A
Warning: number of columns of result is not a multiple of vector length (arg 1)
skim(resultado_final)
── Data Summary ────────────────────────
                           Values         
Name                       resultado_final
Number of rows             1659548        
Number of columns          8              
_______________________                   
Column type frequency:                    
  factor                   3              
  numeric                  4              
  POSIXct                  1              
________________________                  
Group variables            None           
resultado_final %>%   select_if(is.numeric) %>% 
  pivot_longer(cols = everything(), names_to = "Variavel", values_to = "Valor") %>% 
  ggplot(aes(y=Valor, x=Variavel))+geom_boxplot()+geom_violin() +
  facet_wrap(~ Variavel, scales = "free") +coord_flip()+
  labs(
    title = "Gráfico de Frequência para Variáveis Numéricas",
    x = "Valor",
    y = "Frequência"
  ) +
  theme_minimal()

