#Producción mensual de energía en Chile El conjunto de datos proporciona estadísticas mensuales de electricidad de la Agencia Internacional de Energía (AIE) para múltiples países y territorios en todo el mundo. La producción de energía se mide en gigavatios-hora (GWh) y abarca una variedad de productos energéticos, incluyendo hidroeléctrica, eólica, solar, geotérmica, nuclear, combustibles fósiles y otros. Estos datos pueden ser útiles para analizar las tendencias de consumo y producción de electricidad a nivel mundial y regional, así como para evaluar el impacto ambiental de la industria eléctrica.

Se procede a cargar la base de datos

library(readxl)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(lubridate)
## 
## Adjuntando el paquete: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(tibble)   
library(ggplot2)  
library(readr)
df <-read.csv("dataset_energy.csv")

Lectura de la información de la base de datos

str(df)
## 'data.frame':    47159 obs. of  12 variables:
##  $ COUNTRY           : chr  "Argentina" "Argentina" "Argentina" "Argentina" ...
##  $ CODE_TIME         : chr  "JAN2020" "JAN2020" "JAN2020" "JAN2020" ...
##  $ TIME              : chr  "January 2020" "January 2020" "January 2020" "January 2020" ...
##  $ YEAR              : int  2020 2020 2020 2020 2020 2020 2020 2020 2020 2020 ...
##  $ MONTH             : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ MONTH_NAME        : chr  "January" "January" "January" "January" ...
##  $ PRODUCT           : chr  "Hydro" "Wind" "Solar" "Geothermal" ...
##  $ VALUE             : num  2393 677 106 0 0 ...
##  $ DISPLAY_ORDER     : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ yearToDate        : num  23614 9318 1331 0 0 ...
##  $ previousYearToDate: num  2694.1 285.6 40.1 0 0 ...
##  $ share             : num  0.192 0.0543 0.0085 0 0 ...

Se observan los países implicados en la base

unique(df$COUNTRY)
##  [1] "Argentina"           "Australia"           "Austria"            
##  [4] "Belgium"             "Brazil"              "Bulgaria"           
##  [7] "Canada"              "Chile"               "Colombia"           
## [10] "Croatia"             "Cyprus"              "Czech Republic"     
## [13] "Denmark"             "Estonia"             "Finland"            
## [16] "France"              "Germany"             "Greece"             
## [19] "Hungary"             "IEA Total"           "Iceland"            
## [22] "India"               "Ireland"             "Italy"              
## [25] "Japan"               "Korea"               "Latvia"             
## [28] "Lithuania"           "Luxembourg"          "Malta"              
## [31] "Mexico"              "Netherlands"         "New Zealand"        
## [34] "North Macedonia"     "Norway"              "OECD Americas"      
## [37] "OECD Asia Oceania"   "OECD Europe"         "OECD Total"         
## [40] "Poland"              "Portugal"            "Republic of Turkiye"
## [43] "Romania"             "Serbia"              "Slovak Republic"    
## [46] "Slovenia"            "Spain"               "Sweden"             
## [49] "Switzerland"         "United Kingdom"      "United States"      
## [52] "Costa Rica"

Se observa la variable productos

unique(df$PRODUCT)
##  [1] "Hydro"                            "Wind"                            
##  [3] "Solar"                            "Geothermal"                      
##  [5] "Other renewables"                 "Nuclear"                         
##  [7] "Total combustible fuels"          "Coal"                            
##  [9] "Oil"                              "Natural gas"                     
## [11] "Combustible renewables"           "Other combustible non-renewables"
## [13] "Not specified"                    "Net electricity production"      
## [15] "Total imports"                    "Total exports"                   
## [17] "Electricity supplied"             "Used for pumped storage"         
## [19] "Distribution losses"              "Final consumption"               
## [21] "Electricity trade"                "Renewables"                      
## [23] "Non-renewables"                   "Others"                          
## [25] "Other renewables aggregated"      "Low carbon"                      
## [27] "Fossil fuels"

Se analizan las dimensiones

dim(df)
## [1] 47159    12

Preprocesamiento

df <- df %>% select(-CODE_TIME, -TIME, -DISPLAY_ORDER, -yearToDate, -previousYearToDate)

Se renombran las columnas

df <- df %>% rename( country = COUNTRY, year = YEAR, month = MONTH, month_name = MONTH_NAME, product = PRODUCT, value = VALUE )

df <- df %>% mutate(product = recode(product, 'Other renewables aggregated' = 'Other renew. agg.'))

Se crea la columna datetime con el día 1 por defecto

df$datetime <- make_date(year = df$year, month = df$month, day = 1)

Se escoge el pais a trabajar, en este caso Chile

df <- df %>% filter(country == 'Chile')

head(df)
##   country year month month_name          product      value      share
## 1   Chile 2020     1    January            Hydro 2132.37755 0.29222813
## 2   Chile 2020     1    January             Wind  406.78153 0.05574670
## 3   Chile 2020     1    January            Solar  677.48018 0.09284414
## 4   Chile 2020     1    January       Geothermal   18.38944 0.00252015
## 5   Chile 2020     1    January Other renewables    0.00000 0.00000000
## 6   Chile 2020     1    January          Nuclear    0.00000 0.00000000
##     datetime
## 1 2020-01-01
## 2 2020-01-01
## 3 2020-01-01
## 4 2020-01-01
## 5 2020-01-01
## 6 2020-01-01
str(df)
## 'data.frame':    876 obs. of  8 variables:
##  $ country   : chr  "Chile" "Chile" "Chile" "Chile" ...
##  $ year      : int  2020 2020 2020 2020 2020 2020 2020 2020 2020 2020 ...
##  $ month     : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ month_name: chr  "January" "January" "January" "January" ...
##  $ product   : chr  "Hydro" "Wind" "Solar" "Geothermal" ...
##  $ value     : num  2132.4 406.8 677.5 18.4 0 ...
##  $ share     : num  0.29223 0.05575 0.09284 0.00252 0 ...
##  $ datetime  : Date, format: "2020-01-01" "2020-01-01" ...

Gráfica Clasificación de Energía en Chile

# Calcular la media por tipo de producto y ordenarlo
order <- df %>%
  group_by(product) %>%
  summarise(mean_value = mean(value, na.rm = TRUE)) %>%
  arrange(desc(mean_value)) %>%
  pull(product)

# Crear el gráfico
ggplot(data = df, aes(x = value, y = product)) +
  stat_summary(fun = mean, geom = "bar", fill = "green", width = 0.7) + 
  labs(title = "Cantidad de energía clasificada según tipo",
       x = "Cantidad de Energía [GWh]",
       y = "Tipo de energía") +
    theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5),  # Centrar el título
        axis.text.y = element_text(size = 10)) + # Ajustar el tamaño de los textos en el eje y
  scale_y_discrete(limits = order)  # Ordenar según la media calculada

La gráfica muestra la distribución de la cantidad de energía en Chile según diferentes tipos de fuentes. Las mayores cantidades de energía provienen de fuentes no renovables como el carbón y los combustibles fósiles, acercándose a los 4.000 GWh, seguidas por la energía hidroeléctrica, con una producción significativa cerca de los 2.000 GWh. Las fuentes renovables, como la energía solar y eólica, tienen una menor participación, rondando los 1.000 GWh. Además, la producción final de electricidad, la electricidad suministrada y el consumo final son las categorías con las mayores cantidades, mientras que las fuentes como la energía geotérmica, nuclear y el almacenamiento por bombeo presentan valores mínimos. En resumen, Chile depende principalmente de fuentes no renovables para su suministro energético.

filt <- df$product == "Net electricity production"
df_net <- df[filt, ]
# Crear el gráfico con líneas
ggplot(data = df_net, aes(x = year, y = value)) +
  stat_summary(fun = mean, geom = "point", size = 2) +
  stat_summary(fun = mean, geom = "line", size = 1) +
  labs(title = "Evolución de la producción neta de energía en Chile (Resolución Anual)",
       x = "Año",
       y = "Energía Promedio [GWh]") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

En esta gráfica se puede observar la evolución producción neta de energía en chile, se muestra un ascenso desde el inicio de la fecha del estudio, 2020, aumentando de manera constante hasta que comienza 2021, donde tuvo su mayor pico, a partir de aquí se observa un descenso de igual proporción al aumento anterior.

# Crear el gráfico con líneas
ggplot(data = df_net, aes(x = month_name, y = value)) +
  stat_summary(fun = mean, geom = "point", size = 2) +
  stat_summary(fun = mean, geom = "line", size = 1) +
  labs(title = "Producción neta mensual de energía en Chile",
       x = "Mes",
       y = "Energía Promedio [GWh]") +
  ylim(5000, 8000) +
  theme_minimal()
## `geom_line()`: Each group consists of only one observation.
## ℹ Do you need to adjust the group aesthetic?

Podemos observar en la tercera gráfica la producción neta mensual de energía, se observa que a lo largo del año la producción se mantiene sin mayores fluctuaciones hasta diciembre que es donde muestra su mayor pico. En febrero disminuye de manera drástica teniendo en cuenta el resto de los meses, ya que este es el punto más bajo de producción de energía en todo el año.

filt <- c('Wind', 'Solar', 'Other renew. agg.', 'Others', 'Nuclear', 'Natural gas', 'Hydro', 'Coal')
df_gen <- df[df$product %in% filt, ]
head(df_gen)
##    country year month month_name     product     value      share   datetime
## 1    Chile 2020     1    January       Hydro 2132.3776 0.29222813 2020-01-01
## 2    Chile 2020     1    January        Wind  406.7815 0.05574670 2020-01-01
## 3    Chile 2020     1    January       Solar  677.4802 0.09284414 2020-01-01
## 6    Chile 2020     1    January     Nuclear    0.0000 0.00000000 2020-01-01
## 8    Chile 2020     1    January        Coal 2114.7388 0.28981085 2020-01-01
## 10   Chile 2020     1    January Natural gas 1420.8625 0.19471974 2020-01-01
# Calcular los porcentajes
matrix <- df_gen %>%
  group_by(product) %>%
  summarise(total_value = sum(value, na.rm = TRUE)) %>%
  arrange(desc(total_value))

# Crear el gráfico de pastel
ggplot(matrix, aes(x = "", y = total_value, fill = product)) +
  geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar("y") +
  labs(title = "Matriz energética de Chile", fill = "Tipo de Energía") +
  theme_void() +
  theme(legend.position = "right") +
  scale_fill_brewer(palette = "Pastel2")  

La gráfica de la matriz energética de Chile presenta la distribución porcentual de los tipos de energía utilizados. El carbón representa la mayor proporción, siendo el tipo de energía dominante, seguido por la energía hidroeléctrica, que también tiene una participación significativa. Otras fuentes, como el gas natural , y fuentes renovables como la energía solar y eólica tienen un menor peso en el total, mientras que la energía nuclear y otros tipos de energía renovable agregados tienen una representación más pequeña. Esto sugiere una matriz energética aún dependiente en gran medida de fuentes no renovables, especialmente el carbón, con un creciente uso de fuentes renovables.

# Calcular el orden basado en la media de energía por tipo de generación
order <- df_gen %>%
  group_by(product) %>%
  summarise(mean_value = mean(value, na.rm = TRUE)) %>%
  arrange(desc(mean_value)) %>%
  pull(product)

# Crear el gráfico de barras
ggplot(data = df_gen, aes(x = value, y = product)) +
  stat_summary(fun = mean, geom = "bar", fill = "red", width = 0.7) +
  labs(title = "Energía según tipo de generación",
       x = "Energía promedio [GWh]",
       y = "Tipo de generación") +
  scale_y_discrete(limits = order) +
  theme_minimal()

Podemos observar en esta gráfica un complemento de la anterior, vemos cómo el carbón es el tipo de energía que más se genera con cierta diferencia, estando cerca de los 2000 GWh en promedio, seguida por la hidroeléctrica que se sitúa entre los 1500 y 2000 GWh en promedio. Energías renovables como la solar o la eólica se alejan de ser las más producidas en promedio, pero también representan un porcentaje importante en la gráfica. Podemos decir entonces que chile depende del carbón como su mayor fuente de producción de energía, pero también va en camino hacia el uso de energías renovables.

df_gen_year <- df_gen %>%
  group_by(year, product) %>%
  summarise(mean_value = mean(value, na.rm = TRUE), .groups = "drop")
head(df_gen_year, 14)
## # A tibble: 14 × 3
##     year product           mean_value
##    <int> <chr>                  <dbl>
##  1  2020 Coal                   2097.
##  2  2020 Hydro                  1828.
##  3  2020 Natural gas            1228.
##  4  2020 Nuclear                   0 
##  5  2020 Other renew. agg.       461.
##  6  2020 Others                  123.
##  7  2020 Solar                   627.
##  8  2020 Wind                    462.
##  9  2021 Coal                   2120.
## 10  2021 Hydro                  1453.
## 11  2021 Natural gas            1303.
## 12  2021 Nuclear                   0 
## 13  2021 Other renew. agg.       478.
## 14  2021 Others                  247.
# Crear el gráfico de barras
ggplot(data = df_gen_year, aes(x = year, y = mean_value, fill = product)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Evolución de la producción de energía en Chile según tipo de generación",
       x = "Año",
       y = "Energía Promedio [GWh]") +
  theme_minimal() +
  theme(legend.position = "right")

La gráfica muestra la evolución de la producción de energía en Chile desde 2020 hasta 2022, desglosada por tipo de generación. El carbón sigue siendo la fuente dominante en los tres años, con una disminución en la producción de 2021 a 2022. La energía hidroeléctrica mantiene una producción constante y alta en los tres años, superando de manera importante al carbón en el 2022, mientras que el gas natural muestra un aumento en la generación en 2021. Otras fuentes, como la solar y eólica, tienen una participación pequeña, pero en 2022 se observa un leve crecimiento en su producción. Las fuentes nucleares y “otros” tienen una presencia marginal durante el período observado. En resumen, aunque las fuentes renovables están ganando participación, el carbón sigue siendo la principal fuente de generación energética en Chile.

#Actividad Tomar la base de datos y aplicar las distribuciones de la media de la variable Value en cualquier país de tu interés.

Modelo de ejemplo. Planteamiento del problema: Tomando como país de referencia se toman los datos correspondientes a Chile en la base de datos. El objetivo es entender la variabilidad de las muestras tomadas de la variable VALUE relacionada con los valores de producción/consumo de energía para Chile.

Pregunta del problema: ¿Cuál es la media esperada de la variable VALUE para Chile, y cuál es la distribución muestral de la media si tomamos muestras de tamaño 𝑛=40?

Este análisis permitirá estimar con mayor precisión el valor promedio de energía en Chile y analizar la variabilidad de las medias obtenidas a partir de diferentes muestras.

Pasos a seguir: 1. Filtrar los datos para Chile. 2. Calcular la media y desviación estándar de la variable VALUE para Chile. 3. Simular la distribución muestral de la media con un tamaño de muestra de n=40. 4. Calcular la media y error estándar de la distribución muestral. 5. Graficar la distribución muestral de la media.

# Paso 1: Cargar los datos y filtrar por Chile
chile_data <- subset(df, country == "Chile")

# Paso 2: Calcular la media y desviación estándar poblacional
population_mean_chl <- mean(chile_data$value, na.rm = TRUE)
population_std_chl <- sd(chile_data$value, na.rm = TRUE)

# Paso 3: Configurar el tamaño de muestra y número de simulaciones
sample_size <- 40
num_samples <- 1000
set.seed(123)  # Para reproducibilidad

# Simular la distribución muestral de la media
sample_means_chl <- replicate(num_samples, {
  sample_data <- sample(chile_data$value, sample_size, replace = TRUE)
  mean(sample_data)
})

# Paso 4: Calcular la media muestral y el error estándar
sampling_mean_chl <- mean(sample_means_chl)
sampling_std_error_chl <- sd(sample_means_chl)

# Paso 5: Graficar la distribución muestral de la media
hist(sample_means_chl, breaks = 30, main = "Distribución Muestral de la Media (Chile)", 
     xlab = "Media Muestral", col = "lightblue", border = "black")
abline(v = sampling_mean_chl, col = "red", lwd = 2, lty = 2)

#Conclusión

En conclusión, la situación energética de Chile se caracteriza por una fuerte dependencia de fuentes no renovables, especialmente el carbón, que domina la producción energética. Aunque la energía hidroeléctrica también desempeña un papel significativo, las fuentes renovables, como la solar y eólica, aún tienen una participación menor, aunque en crecimiento. La evolución de la producción de energía desde 2020 muestra un aumento constante hasta 2021, seguido de un descenso, mientras que la producción mensual revela fluctuaciones notables, con un pico en diciembre y una caída en febrero. En resumen, aunque hay un avance hacia la incorporación de energías renovables, el carbón sigue siendo fundamental para el suministro energético en el país.