📘 Desigualdades Energéticas Globales en el Año 2000

Autores: Mildred Dayana Rodriguez Muñoz, Isabella Ramirez Valencia, Valeria Muñoz Peña, Camilo Andres Aristizabal

Universidad del Valle, Facultad de Ingeniería


1 Introducción

El acceso y uso sostenible de la energía constituyen pilares fundamentales para el desarrollo económico, social y ambiental de las naciones. La energía impulsa la productividad, mejora la calidad de vida y es clave para la reducción de la pobreza; sin embargo, también se relaciona con la degradación ambiental y la emisión de gases contaminantes. En este sentido, el año 2000 representa un punto de referencia crucial, pues con la Declaración del Milenio de las Naciones Unidas se establecieron los Objetivos de Desarrollo del Milenio (ODM), que promovieron el acceso equitativo a los recursos básicos y la sostenibilidad ambiental como metas globales.

Aunque los Objetivos de Desarrollo del Milenio (ODM) establecidos en el año 2000 no incluían metas específicas sobre energía o minería, su implementación promovió la recopilación y estandarización de una gran cantidad de indicadores globales relacionados con el desarrollo sostenible, lo que dio lugar a una amplia disponibilidad de información en fuentes como los Indicadores de Desarrollo Mundial del Banco Mundial (WDI). Estos datos permiten analizar de manera comparativa la situación energética de los países, evaluando tanto la disponibilidad como la eficiencia y sostenibilidad de sus fuentes energéticas.

El estudio de las dinámicas energéticas es además fundamental para comprender la transición hacia modelos sostenibles, una preocupación que se profundizó en 2015 con la creación de los Objetivos de Desarrollo Sostenible (ODS), en particular el ODS 7: Energía asequible y no contaminante y el ODS 12: Producción y consumo responsables. Analizar la situación del año 2000 ofrece así una mirada al punto de partida global hacia la sostenibilidad energética y los retos que se mantienen hasta la actualidad. A través de técnicas de aprendizaje no supervisado, específicamente el Análisis de Componentes Principales (ACP) y los métodos de agrupamiento, se pretende identificar patrones y similitudes entre naciones para así escoger a beneficencia las dimensiones necesarias para hacer un análisis adecuado del modelo

1.1 Contexto

La elección del año 2000 como referencia para este estudio responde a razones tanto históricas como analíticas. Este período constituye un punto crítico en la agenda internacional, pues coincide con la implementación de la Declaración del Milenio y los primeros compromisos globales orientados a reducir la pobreza, mejorar el acceso a servicios básicos y promover la sostenibilidad ambiental. En consecuencia, múltiples organismos comenzaron a estandarizar y consolidar bases de datos energéticas comparables entre países, lo que hace del año 2000 una plataforma adecuada para analizar la situación energética global con información robusta.

Desde la perspectiva energética, este año revela marcadas desigualdades entre naciones. Mientras algunos países contaban con altos niveles de acceso a electricidad y tecnologías limpias, otros dependían casi exclusivamente de combustibles fósiles o carecían de infraestructura energética suficiente. Asimismo, la transición hacia energías renovables era apenas incipiente, y las brechas en eficiencia energética entre regiones eran amplias y persistentes. Esta heterogeneidad inicial es especialmente relevante para el propósito de este informe. Comprender el punto de partida global permite identificar patrones estructurales de producción, consumo y acceso a la energía antes de que las políticas internacionales sobre sostenibilidad comenzaran a influir de manera marcada en los indicadores.

Sin embargo, la complejidad y diversidad de las variables energéticas del año 2000 hacen difícil interpretar de manera directa qué factores explican las diferencias entre países o cómo se agrupan según sus características energéticas. Por ello, se requiere un enfoque analítico capaz de sintetizar grandes volúmenes de información, identificar relaciones internas y revelar estructuras no evidentes a simple vista.

En este sentido, el aprendizaje no supervisado proporciona herramientas estadísticas idóneas para descubrir relaciones naturales con diferentes niveles de desarrollo y sin necesidad de una variable dependiente.

1.2 Objetivo General

El propósito central de esta investigación es determinar las principales dimensiones que explican las diferencias en los patrones energéticos de los países durante el año 2000, mediante la aplicación del Análisis de Componentes Principales (ACP). A través de esta técnica estadística se busca sintetizar la información contenida en múltiples indicadores energéticos, reduciendo la complejidad del conjunto de datos sin perder su variabilidad esencial. El análisis tiene como objetivo revelar las relaciones más relevantes entre los distintos aspectos del desarrollo energético e identificar los factores estructurales que determinan la posición relativa de cada país dentro del panorama energético mundial. De esta manera, se construye una visión más clara y estructurada de las diferencias existentes en términos de eficiencia, sostenibilidad y disponibilidad de recursos energéticos. Complementariamente, mediante la aplicación de técnicas de análisis no supervisado, específicamente la clusterización (análisis de conglomerados), se pretende agrupar los países según sus similitudes en los patrones de producción, consumo y generación de energía, con el fin de identificar tipologías energéticas y establecer perfiles característicos que reflejen distintos niveles de desarrollo y transición energética. Esta fase del estudio permite interpretar de forma integral los resultados del ACP, ya que los clusters obtenidos revelan cómo las dimensiones latentes como el consumo y la generación energética se combinan para estructurar grupos de países con comportamientos energéticos comparables, aportando así una comprensión más profunda de las desigualdades y dinámicas globales del sistema energético.

1.3 Pregunta problema integrada al desarrollo del modelo no supervisado

¿Cómo se manifiestan las desigualdades energéticas entre países en el año 2000 y cuáles son los factores estructurales que las explican, según las dimensiones de consumo y generación identificadas mediante Análisis de Componentes Principales (ACP)?

Este enfoque permite usar el ACP para resumir las variables (acceso, consumo, tipo de fuente) y luego el clustering para ver grupos de países con distintos niveles de desarrollo energético.

2 Metodología

La metodología de este estudio se estructura en varias fases, abordando desde la recopilación y preparación de datos hasta la aplicación de técnicas avanzadas de análisis multivariado como el Análisis de Componentes Principales (ACP) y la Clusterización. Aplicando esta metodología se espera Reducir la complejidad del conjunto de datos, identificando los ejes principales que explican la variabilidad de los indicadores energéticos del año 2000.

Interpretar las componentes principales en términos de dimensiones clave del desarrollo energético. Agrupar los países en clústeres según sus similitudes energéticas (por ejemplo: países con alta dependencia fósil, países con alta participación renovable, o países con baja cobertura eléctrica). Visualizar patrones y relaciones que permitan comprender la situación energética mundial.

De esta manera, el modelo no solo aplica los conceptos de aprendizaje no supervisado vistos en clase, sino que contribuye a comprender las dinámicas energéticas globales y su relación con los procesos de desarrollo sostenible.

2.1 Fuentes,procesamiento y preparación de datos

La información utilizada en este estudio proviene de la página del Banco Mundial, específicamente de la base de datos “Indicadores de desarrollo mundial”,siendo esta página una de las fuentes más completas y reconocidas a nivel internacional para el análisis comparativo de países. Esta fuente ofrece estadísticas oficiales sobre temas económicos, sociales, ambientales y energéticos, compiladas a partir de organismos nacionales e internacionales, lo que garantiza su fiabilidad, consistencia metodológica y comparabilidad temporal y geográfica. Para nuestro presente análisis, se seleccionaron indicadores correspondientes al año 2000, periodo que representa un punto de referencia fundamental en materia de políticas globales de desarrollo sostenible, al coincidir con la adopción de los Objetivos de Desarrollo del Milenio . Los datos extraídos reflejan las condiciones iniciales en términos de producción, consumo y acceso a la energía, así como el grado de incorporación de fuentes renovables y tecnologías limpias en los sistemas energéticos de los países. Los datos fueron extraídos en formato Excel y posteriormente depurados para eliminar observaciones incompletas o inconsistentes (N/A), esto implicó la selección exclusiva de variables cuantitativas, dado que el Análisis de Componentes Principales (ACP) requiere de información numérica para calcular correlaciones y combinaciones lineales entre las variables. Con el fin de garantizar un manejo más eficiente y organizado del conjunto de datos durante el análisis estadístico, se optó por abreviar los nombres de las variables originales. Esta decisión responde a varias razones metodológicas y prácticas que contribuyen a mejorar tanto la ejecución del código como la interpretación de los resultados.

2.2 Descripción de variables

library(kableExtra)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following object is masked from 'package:kableExtra':
## 
##     group_rows
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Crear tabla de variables
tabla_variables <- data.frame(
  Variable = c("ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", "PFN", 
               "PFH", "PFR", "IE", "CEF", "CF", "NIE", "CER"),
  Descripción = c(
    "Acceso a combustibles limpios y tecnologías para cocinar",
    "Acceso a la electricidad",
    "Energías alternativas y nucleares",
    "Energías renovables combustibles y residuos",
    "Consumo de energía eléctrica",
    "Pérdidas en la transmisión y distribución de energía eléctrica",
    "Producción de electricidad a partir de fuentes de gas natural",
    "Producción de electricidad a partir de fuentes nucleares",
    "Producción de electricidad a partir de fuentes hidroeléctricas",
    "Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica",
    "Importaciones netas de energía",
    "Consumo de energía",
    "Consumo de energía procedente de combustibles fósiles",
    "Nivel de intensidad energética de la energía primaria",
    "Consumo de energía renovable"
  ),
  TipoVariable = rep("Cuantitativa (Input)", 15),
  Notas = c(
    "% de la población",
    "% de la población",
    "% del consumo total de energía",
    "% de la energía total",
    "kWh per cápita",
    "% de la población",
    "% del total",
    "% del total",
    "% del total",
    "% del total",
    "% del consumo de energía",
    "kg de equivalente de petróleo per cápita",
    "% del total",
    "Índice o razón (sin unidades)",
    "% del consumo total de energía final"
  )
)

# Crear tabla estilizada
tabla_variables %>%
  kbl(
    caption = "Tabla de Variables del Modelo de Aprendizaje No Supervisado",
    align = "lccc",
    col.names = c("Variable", "Descripción", "Tipo de Variable", "Notas")
  ) %>%
  kable_classic(full_width = FALSE, html_font = "Segoe UI") %>%
  column_spec(1, bold = TRUE, color = "#004085") %>% # azul académico en variable
  column_spec(2, width = "9cm") %>%
  row_spec(0, bold = TRUE, background = "#69E2FF", color = "white") %>% # encabezado azul
  row_spec(1:15, background = c("#f8f9fa", "#ffffff")) %>% # filas alternadas
  kable_styling(bootstrap_options = c("hover", "condensed", "responsive"))
Tabla de Variables del Modelo de Aprendizaje No Supervisado
Variable Descripción Tipo de Variable Notas
ACT Acceso a combustibles limpios y tecnologías para cocinar Cuantitativa (Input) % de la población
ACE Acceso a la electricidad Cuantitativa (Input) % de la población
EAN Energías alternativas y nucleares Cuantitativa (Input) % del consumo total de energía
ERC Energías renovables combustibles y residuos Cuantitativa (Input) % de la energía total
CE Consumo de energía eléctrica Cuantitativa (Input) kWh per cápita
PTD Pérdidas en la transmisión y distribución de energía eléctrica Cuantitativa (Input) % de la población
PGN Producción de electricidad a partir de fuentes de gas natural Cuantitativa (Input) % del total
PFN Producción de electricidad a partir de fuentes nucleares Cuantitativa (Input) % del total
PFH Producción de electricidad a partir de fuentes hidroeléctricas Cuantitativa (Input) % del total
PFR Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica Cuantitativa (Input) % del total
IE Importaciones netas de energía Cuantitativa (Input) % del consumo de energía
CEF Consumo de energía Cuantitativa (Input) kg de equivalente de petróleo per cápita
CF Consumo de energía procedente de combustibles fósiles Cuantitativa (Input) % del total
NIE Nivel de intensidad energética de la energía primaria Cuantitativa (Input) Índice o razón (sin unidades)
CER Consumo de energía renovable Cuantitativa (Input) % del consumo total de energía final

ACT: El acceso a combustibles y tecnologías limpios para cocinar es la proporción de la población total que utiliza principalmente combustibles y tecnologías limpios para cocinar. Según las directrices de la OMS, el queroseno no se considera un combustible limpio para cocinar.

ACE: El acceso a la electricidad es el porcentaje de población con acceso a la electricidad. Los datos sobre electrificación se recopilan de la industria, encuestas nacionales y fuentes internacionales.

EAN: La energía limpia es energía no derivada de carbohidratos que no produce dióxido de carbono al generarse. Incluye la energía hidroeléctrica y nuclear, la geotérmica y la solar, entre otras. Es la parte del suministro energético total que no procede de combustibles fósiles.

ERC: Combustible renewables and waste comprise solid biomass, liquid biomass, biogas, industrial waste, and municipal waste, measured as a percentage of total energy use. The indicator expresses the share of total energy supply.

CE: El consumo de energía eléctrica mide la producción de las centrales eléctricas y las centrales de cogeneración, menos las pérdidas por transmisión, distribución y transformación, y el uso propio de las centrales térmicas y eléctricas.

PTD: Las pérdidas en la transmisión y distribución de energía eléctrica incluyen las pérdidas en la transmisión entre las fuentes de suministro y los puntos de distribución, y en la distribución a los consumidores, incluido el hurto. Las pérdidas se expresan como porcentaje de la producción total.

PGN: Porcentaje de la producción total de electricidad procedente de fuentes de gas natural. Las fuentes de electricidad se refieren a los insumos utilizados para generar electricidad. El gas se refiere al gas natural, pero excluye los líquidos de gas natural.

PFN: Porcentaje de la producción eléctrica procedente de fuentes nucleares respecto al total de la producción eléctrica. Las fuentes de electricidad se refieren a los insumos utilizados para generar electricidad. La energía nuclear se refiere a la electricidad producida por centrales nucleares.

PFH: Porcentaje de la producción eléctrica procedente de fuentes hidroeléctricas respecto al total de la producción eléctrica. Las fuentes de electricidad se refieren a los insumos utilizados para generar electricidad. La energía hidroeléctrica se refiere a la electricidad producida por centrales hidroeléctricas.

PFR: Porcentaje de la producción eléctrica procedente de fuentes renovables respecto al total de la producción eléctrica. La producción eléctrica procedente de fuentes renovables, excluida la hidroeléctrica, incluye la geotérmica, la solar, la mareomotriz, la eólica, la biomasa y los biocombustibles.

IE: Las importaciones netas de energía se calculan restando las exportaciones brutas a las importaciones brutas, ambas medidas en toneladas equivalentes de petróleo (tep). Un valor negativo indica que el país es exportador neto. El uso de energía se refiere al uso de energía primaria antes de su transformación en otros combustibles de uso final, que es igual a la producción interna más las importaciones y las variaciones de existencias, menos las exportaciones y los combustibles suministrados a buques y aeronaves dedicados al transporte internacional.

CEF: El consumo de energía se refiere al uso de energía primaria antes de su transformación en otros combustibles de uso final, que es igual a la producción nacional más las importaciones y los cambios en las existencias, menos las exportaciones y los combustibles suministrados a buques y aeronaves dedicados al transporte internacional.

CF: Los combustibles fósiles comprenden el carbón, el petróleo y los productos derivados del gas natural.

NIE: El nivel de intensidad energética de la energía primaria es la relación entre el suministro de energía y el producto interno bruto medido en paridad de poder adquisitivo. La intensidad energética es una indicación de la cantidad de energía que se utiliza para producir una unidad de producción económica. Una relación más baja indica que se utiliza menos energía para producir una unidad de producción.

CER: El consumo de energía renovable es la proporción de energía renovable en el consumo final total de energía.

2.3 Técnicas de Análisis multivariado

El Análisis de Componentes Principales (ACP)

Es una técnica estadística de análisis multivariado que tiene como finalidad reducir la dimensión de un conjunto de datos formado por múltiples variables interrelacionadas, conservando la mayor cantidad posible de información original. Consiste en transformar las variables originales en un nuevo conjunto de variables llamadas componentes principales, que son combinaciones lineales de las variables iniciales. Estos componentes son no correlacionados entre sí y están ordenados de acuerdo con la varianza que explican: el primero concentra la mayor parte de la variabilidad total de los datos, el segundo explica la siguiente porción más grande, y así sucesivamente. De esta manera, el ACP permite representar la estructura de los datos en un espacio de menor dimensión, facilitando su interpretación, visualización y análisis. Esta técnica es muy útil cuando se trabaja con bases de datos extensas, ya que elimina la redundancia entre variables correlacionadas, permite identificar patrones, clasificar observaciones y simplificar la información sin perder su esencia. Sin embargo, es importante tener en cuenta que el ACP es un método lineal, por lo que no detecta relaciones no lineales, y su interpretación puede resultar compleja debido a que los componentes no siempre tienen un significado directo. El objetivo del ACP en este estudio fue reducir la complejidad de la base de datos original, simplificando un número grande de variables en un conjunto menor de componentes que retuvieron la información esencial. Además, se buscó identificar patrones subyacentes entre los países analizados, revelando las dimensiones principales de variabilidad que pueden interpretarse como factores que influyen en las características socioeconómicas o de desarrollo de las naciones. Finalmente, se pretendió facilitar la visualización de las relaciones entre los países y las variables, proyectando la información en un espacio de baja dimensión (dos o tres componentes principales) que permitiera observar agrupaciones, similitudes y diferencias de manera clara. Siguiendo la ecuación del modelo:

plot.new()
text(0.5, 0.5, expression(Z == lambda[1]*X[1] + lambda[2]*X[2] + " + ... + " + lambda[p]*X[p]))

Clusterización

La clusterización es una técnica de aprendizaje no supervisado cuyo propósito es agrupar un conjunto de objetos de manera que aquellos pertenecientes a un mismo grupo (cluster) sean más similares entre sí que respecto a los de otros grupos. En este estudio, la clusterización se aplicó sobre los factores obtenidos del Análisis de Componentes Principales (ACP), lo que permite conformar grupos de países a partir de las dimensiones latentes que sintetizan la información multivariada original.

Dado que se empleó un método de clusterización jerárquica basado en Ward, la determinación del número adecuado de clusters se realizó exclusivamente mediante la inspección del dendrograma, identificando el punto de corte donde se observan separaciones claras y consistentes entre grupos. Este criterio es especialmente apropiado en métodos jerárquicos, ya que el dendrograma refleja visualmente cómo se van fusionando los objetos y permite reconocer las particiones más estables de la estructura de los datos.

La implementación del procedimiento mediante el método de Ward resulta particularmente adecuada cuando se trabaja con factores del ACP, pues estos concentran la mayor parte de la variabilidad relevante y reducen el ruido, facilitando la formación de grupos más coherentes y bien diferenciados. Finalmente, la interpretación de los clusters se llevó a cabo analizando las medias de las variables originales en cada grupo, con el propósito de caracterizar los perfiles de los países y describir sus diferencias estructurales.

3 Resultados descriptivos y análisis de componentes principales (ACP)

En esta sección se presentan los resultados obtenidos del Análisis de Componentes Principales (ACP) aplicado a la base de datos del estudio. A partir de este análisis, se identificaron las principales dimensiones de variabilidad entre los países, así como las relaciones más relevantes entre las variables consideradas. Asimismo, se muestran los valores, la varianza explicada por cada componente y las representaciones gráficas que permiten visualizar las similitudes y diferencias entre las naciones analizadas.

3.1 Estadísticas descriptivas de las variables

#analisis descriptivo
######################################################
library(readxl)       # Leer Excel
library(tidyverse)    # Manipulación de datos
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.1     ✔ readr     2.1.5
## ✔ ggplot2   4.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.4     ✔ tibble    3.2.1
## ✔ purrr     1.0.4     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter()     masks stats::filter()
## ✖ dplyr::group_rows() masks kableExtra::group_rows()
## ✖ dplyr::lag()        masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(skimr)        # Estadísticas descriptivas detalladas y bonitas
library(knitr)        # Tablas presentables
library(kableExtra)   # Estilo visual en HTML o PDF

base <- read_excel("base.xlsx")

# Ver las primeras filas para confirmar
head(base)
## # A tibble: 6 × 18
##     Año Pais      `COD Pais` Acceso a combustibles limp…¹ Acceso a la electric…²
##   <dbl> <chr>     <chr>                             <dbl>                  <dbl>
## 1  2000 Albania   ALB                                35.2                   99.4
## 2  2000 Algeria   DZA                                96.4                   98.6
## 3  2000 Angola    AGO                                40.9                   24.2
## 4  2000 Argentina ARG                                95.7                   95.7
## 5  2000 Armenia   ARM                                78.1                   98.9
## 6  2000 Australia AUS                               100                    100  
## # ℹ abbreviated names:
## #   ¹​`Acceso a combustibles limpios y tecnologías para cocinar (% de la población)`,
## #   ²​`Acceso a la electricidad (% de la población)`
## # ℹ 13 more variables:
## #   `Energías alternativas y nucleares (% del consumo total de energía)` <dbl>,
## #   `Energías renovables combustibles y residuos (% de la energía total)` <dbl>,
## #   `Consumo de energía eléctrica (kWh per cápita)` <dbl>, …
base_num <- base %>%
  select(where(is.numeric)) %>%
  select(-Año) 

# Resumen general
summary(base_num)
##  Acceso a combustibles limpios y tecnologías para cocinar (% de la población)
##  Min.   :  0.10                                                              
##  1st Qu.: 33.90                                                              
##  Median : 84.20                                                              
##  Mean   : 65.64                                                              
##  3rd Qu.:100.00                                                              
##  Max.   :100.00                                                              
##  Acceso a la electricidad (% de la población)
##  Min.   :  3.10                              
##  1st Qu.: 69.80                              
##  Median : 97.70                              
##  Mean   : 79.39                              
##  3rd Qu.:100.00                              
##  Max.   :100.00                              
##  Energías alternativas y nucleares (% del consumo total de energía)
##  Min.   :  0.00                                                    
##  1st Qu.:  1.13                                                    
##  Median :  4.69                                                    
##  Mean   : 10.20                                                    
##  3rd Qu.: 13.96                                                    
##  Max.   :100.00                                                    
##  Energías renovables combustibles y residuos (% de la energía total)
##  Min.   : 0.000                                                     
##  1st Qu.: 2.443                                                     
##  Median : 8.678                                                     
##  Mean   :23.543                                                     
##  3rd Qu.:41.707                                                     
##  Max.   :95.261                                                     
##  Consumo de energía eléctrica (kWh per cápita)
##  Min.   :    7.049                            
##  1st Qu.:  488.767                            
##  Median : 1805.475                            
##  Mean   : 3470.515                            
##  3rd Qu.: 5167.711                            
##  Max.   :24993.726                            
##  Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)
##  Min.   : 1.140                                                                     
##  1st Qu.: 7.236                                                                     
##  Median :12.262                                                                     
##  Mean   :14.853                                                                     
##  3rd Qu.:19.017                                                                     
##  Max.   :86.622                                                                     
##  Producción de electricidad a partir de fuentes de gas natural (% del total)
##  Min.   :  0.000                                                            
##  1st Qu.:  0.000                                                            
##  Median :  9.975                                                            
##  Mean   : 19.955                                                            
##  3rd Qu.: 24.336                                                            
##  Max.   :100.000                                                            
##  Producción de electricidad a partir de fuentes nucleares (% del total)
##  Min.   : 0.000                                                        
##  1st Qu.: 0.000                                                        
##  Median : 0.000                                                        
##  Mean   : 6.659                                                        
##  3rd Qu.: 0.000                                                        
##  Max.   :76.888                                                        
##  Producción de electricidad a partir de fuentes hidroeléctricas (% del total)
##  Min.   :  0.000                                                             
##  1st Qu.:  4.503                                                             
##  Median : 21.165                                                             
##  Mean   : 36.195                                                             
##  3rd Qu.: 63.114                                                             
##  Max.   :100.000                                                             
##  Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)
##  Min.   :-71.0569                                                                                   
##  1st Qu.:  0.0000                                                                                   
##  Median :  0.4951                                                                                   
##  Mean   :  2.7004                                                                                   
##  3rd Qu.:  2.7772                                                                                   
##  Max.   : 87.3351                                                                                   
##  Importaciones de energía, netas (% del consumo de energía)
##  Min.   :-2382.89                                          
##  1st Qu.:  -40.05                                          
##  Median :   22.78                                          
##  Mean   :  -64.18                                          
##  3rd Qu.:   57.12                                          
##  Max.   :  218.73                                          
##  Consumo de energía (kg de equivalente de petróleo per cápita)
##  Min.   :  135.9                                              
##  1st Qu.:  486.9                                              
##  Median : 1153.0                                              
##  Mean   : 2207.3                                              
##  3rd Qu.: 3281.1                                              
##  Max.   :16938.7                                              
##  Consumo de energía procedente de combustibles fósiles (% del total)
##  Min.   : 0.00                                                      
##  1st Qu.:46.27                                                      
##  Median :75.75                                                      
##  Mean   :64.71                                                      
##  3rd Qu.:88.40                                                      
##  Max.   :99.98                                                      
##  Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)
##  Min.   : 1.340                                                          
##  1st Qu.: 3.690                                                          
##  Median : 5.080                                                          
##  Mean   : 6.136                                                          
##  3rd Qu.: 7.010                                                          
##  Max.   :26.910                                                          
##  Consumo de energía renovable (% del consumo total de energía final)
##  Min.   : 0.00                                                      
##  1st Qu.: 5.90                                                      
##  Median :21.80                                                      
##  Mean   :32.01                                                      
##  3rd Qu.:57.70                                                      
##  Max.   :97.90
tabla_desc <- base_num %>%
  summarise(across(
    everything(),
    list(
      Media = mean,
      Mediana = median,
      Mínimo = min,
      Máximo = max,
      `Desv. Estándar` = sd
    ),
    na.rm = TRUE
  )) %>%
  pivot_longer(
    everything(),
    names_to = c("Variable", ".value"),
    names_pattern = "(.*)_(.*)"
  )
## Warning: There was 1 warning in `summarise()`.
## ℹ In argument: `across(...)`.
## Caused by warning:
## ! The `...` argument of `across()` is deprecated as of dplyr 1.1.0.
## Supply arguments directly to `.fns` through an anonymous function instead.
## 
##   # Previously
##   across(a:b, mean, na.rm = TRUE)
## 
##   # Now
##   across(a:b, \(x) mean(x, na.rm = TRUE))
# --------------------------------------------------
# 4️⃣ Tabla estilo académico (azul claro, letra negra)
# --------------------------------------------------
tabla_desc %>%
  kbl(
    caption = "Estadísticas descriptivas de las variables energéticas (Año 2000)",
    align = "c",
    digits = 2,
    booktabs = TRUE
  ) %>%
  kable_styling(
    full_width = FALSE,
    position = "center",
    bootstrap_options = c("hover", "condensed"),
    font_size = 13
  ) %>%
  row_spec(0, bold = TRUE, color = "black", background = "#B3D7F5") %>%  # Encabezado azul claro
  column_spec(1, bold = TRUE, color = "black") %>%                      # Variables en negrita
  kable_paper("hover", full_width = FALSE, lightable_options = "striped") %>%
  add_header_above(c(" " = 1, "Medidas descriptivas" = 5), bold = TRUE, color = "black", background = "#D6EAF8")
Estadísticas descriptivas de las variables energéticas (Año 2000)
Medidas descriptivas
Variable Media Mediana Mínimo Máximo Desv. Estándar
Acceso a combustibles limpios y tecnologías para cocinar (% de la población) 65.64 84.20 0.10 100.00 37.60
Acceso a la electricidad (% de la población) 79.39 97.70 3.10 100.00 29.79
Energías alternativas y nucleares (% del consumo total de energía) 10.20 4.69 0.00 100.00 14.61
Energías renovables combustibles y residuos (% de la energía total) 23.54 8.68 0.00 95.26 28.88
Consumo de energía eléctrica (kWh per cápita) 3470.51 1805.48 7.05 24993.73 4554.28
Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción) 14.85 12.26 1.14 86.62 12.59
Producción de electricidad a partir de fuentes de gas natural (% del total) 19.96 9.97 0.00 100.00 27.68
Producción de electricidad a partir de fuentes nucleares (% del total) 6.66 0.00 0.00 76.89 15.59
Producción de electricidad a partir de fuentes hidroeléctricas (% del total) 36.19 21.16 0.00 100.00 35.13
Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) 2.70 0.50 -71.06 87.34 12.00
Importaciones de energía, netas (% del consumo de energía) -64.18 22.78 -2382.89 218.73 330.00
Consumo de energía (kg de equivalente de petróleo per cápita) 2207.27 1153.05 135.95 16938.72 2619.16
Consumo de energía procedente de combustibles fósiles (% del total) 64.71 75.75 0.00 99.98 29.92
Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA) 6.14 5.08 1.34 26.91 3.84
Consumo de energía renovable (% del consumo total de energía final) 32.01 21.80 0.00 97.90 29.34

En la tabla de estadísticas descriptivas se observan diferencias importantes entre los valores mínimos y máximos de las variables energéticas analizadas, lo que evidencia la alta heterogeneidad entre los países en términos de acceso, consumo y producción de energía.

En algunas variables energéticas pueden aparecer valores negativos, lo cual no implica un error en los datos, sino que refleja la forma en que se mide el indicador. En particular, los valores negativos suelen representar diferencias netas, en el caso de la variable IE (Importaciones netas de energía), un valor negativo indica que el país exporta más energía de la que importa, es decir, es un exportador neto, o indicadores relativos que pueden adquirir signo según la dirección del flujo energético o económico.

En la variable de consumo energético (CE), este comportamiento puede deberse a la forma en que el indicador fue registrado en la fuente del Banco Mundial, ya que algunos países presentan balances energéticos negativos al ser exportadores netos de energía. En tales casos, el valor negativo no representa un consumo inexistente, sino un superávit energético, es decir, una producción superior a la demanda interna. No obstante, dado que el consumo energético, en términos per cápita, no puede ser negativo, este valor se considera atípico y se interpreta con cautela en el análisis.

Las variables ACT (acceso a combustibles limpios para cocinar) y ACE (acceso a la electricidad) presentan medias elevadas en comparación con sus mínimos, lo cual sugiere que, aunque muchos países cuentan con una cobertura energética amplia, existen otros con niveles muy bajos o incluso nulos, reflejando desigualdades en el acceso básico a la energía. En contraste, las variables relacionadas con la producción energética —como PFH (participación hidroeléctrica), PFN (fuentes nucleares) y PFR (fuentes renovables)— muestran altos niveles de dispersión, evidenciados por desviaciones estándar amplias. Esto indica que los países adoptan matrices energéticas muy distintas, algunas centradas en fuentes limpias y otras en combustibles fósiles. Por su parte, el consumo de energía (CE y CEF) exhibe valores promedio altos, aunque en algunos casos se identificaron valores mínimos negativos, asociados posiblemente a países exportadores netos de energía o a diferencias en los métodos de contabilización de la energía final consumida. Estos valores fueron considerados atípicos, pero no invalidan el análisis general, ya que reflejan la diversidad estructural de los sistemas energéticos nacionales. Finalmente, la variable NIE (intensidad energética) muestra un rango amplio entre países, lo cual sugiere diferencias en la eficiencia del uso de la energía: los países con menor intensidad energética son más eficientes, mientras que los de mayor intensidad requieren más energía para producir una unidad de PIB.

3.2 Boxplots

Con el fin de realizar un acercamiento un poco más exploratorio a las variables energéticas incluidas en la base de datos, se construyeron diagramas de caja (boxplots) para cada una de ellas. Este tipo de gráfico es especialmente útil cuando se trabaja con múltiples unidades territoriales, en nuestro caso países, y las variables se encuentran en diferentes escalas, ya que permite visualizar de manera resumida la distribución, la mediana, la dispersión y la presencia de valores atípicos sin requerir una normalización previa. Dado que las variables presentan unidades de medida heterogéneas (porcentajes, kilovatios-hora per cápita, equivalentes de petróleo, tasas, entre otros), se optó por agrupar los boxplots en dos conjuntos, de modo que la visualización fuera más clara y facilitara la comparación dentro de cada grupo. Esta separación permite resaltar el comportamiento particular de cada indicador sin perder legibilidad en los gráficos.

library(dplyr)
library(tidyr)
library(ggplot2)


names(base)[c(1,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] <-
  c("A", "ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", 
    "PFN", "PFH", "PFR", "IE", "CEF", "CF", "NIE", "CER")

primeros7 <- base %>%
  select(ACT, ACE, EAN, ERC, CE, PTD, PGN) %>%
  pivot_longer(cols = everything(),
               names_to = "Variable",
               values_to = "Valor")

ggplot(primeros7, aes(x = "", y = Valor)) +
  geom_boxplot(fill = "skyblue") +
  facet_wrap(~ Variable, scales = "free_y", ncol = 4) +
  labs(title = "Boxplots ", x = "", y = "") +
  theme_minimal() +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank())

library(dplyr)
library(tidyr)
library(ggplot2)


names(base)[c(1,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] <-
  c("A", "ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", 
    "PFN", "PFH", "PFR", "IE", "CEF", "CF", "NIE", "CER")

segundas8 <- base %>%
  select(PFN, PFH, PFR, IE, CEF, CF, NIE, CER) %>%
  pivot_longer(cols = everything(),
               names_to = "Variable",
               values_to = "Valor")

ggplot(segundas8, aes(x = "", y = Valor)) +
  geom_boxplot(fill = "skyblue") +
  facet_wrap(~ Variable, scales = "free_y", ncol = 4) +
  labs(title = "Boxplots ", x = "", y = "") +
  theme_minimal() +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank())

Ahora analizando los resultados de estos boxplots, podemos inferir que: ACE: Muestra valores predominantemente altos, con una mediana cercana al 100%. Sin embargo, la presencia de valores inferiores al 50% indica que, para el año 2000, todavía existían países con importantes carencias en acceso eléctrico. La dispersión moderada y los outliers inferiores reflejan desigualdad en infraestructura básica. ACT: La distribución presenta una amplia variabilidad, con una mediana alrededor del 80%, pero con observaciones que caen cerca de cero. Esto sugiere que muchas naciones aún dependían de combustibles sólidos y prácticas de cocción tradicionales, generalmente asociadas con impactos negativos en salud y medio ambiente. CE: Es una de las variables con mayor dispersión y con múltiples valores atípicos altos. Esto refleja las diferencias extremas entre países altamente industrializados con consumos muy elevados frente a economías en desarrollo con consumos reducidos. La presencia de outliers superiores es coherente con países de gran ingreso y actividad industrial. EAN: La distribución está fuertemente concentrada en valores bajos, con una mediana cercana al cero, lo que indica que en el año 2000 la participación de energías alternativas y nucleares era limitada en la mayoría de las naciones. Los outliers superiores corresponden a países con políticas energéticas más avanzadas o con infraestructura nuclear consolidada. ERC: Presenta valores bajos y dispersión limitada en la mayoría de países, evidenciando un uso aún incipiente de este tipo de energía. No obstante, algunos outliers muestran países con una dependencia notable de biomasa o residuos, generalmente naciones con menor desarrollo tecnológico. PGN: Se observa una variabilidad importante y varios valores atípicos superiores. Esto sugiere que ciertos países, especialmente aquellos con reservas de gas o infraestructura moderna, tenían una fuerte dependencia del gas natural como fuente principal de generación eléctrica. PTD: La mediana relativamente baja indica que en la mayoría de países las pérdidas eran moderadas; sin embargo, los outliers altos reflejan problemas significativos de eficiencia energética en sistemas eléctricos deteriorados o insuficientemente mantenidos. CEF: La distribución muestra concentraciones altas, indicando que el uso de combustibles fósiles era la norma dominante. Los pocos valores bajos corresponden a países con un mayor peso de energías renovables o estrategias de diversificación temprana. CER: Se observan valores predominantemente bajos, complementando lo encontrado en CEF. Esta relación opuesta entre ambas variables refleja una estructura energética donde el uso de renovables es minoritario frente a los combustibles fósiles. Este contraste evidencia que, en la mayoría de países analizados, la transición hacia fuentes más limpias aún era incipiente y coexistió con una fuerte dependencia de energías tradicionales. CF: Refleja la dependencia global de combustibles fósiles. La dispersión moderada indica que algunas regiones estaban comenzando una transición, pero la predominancia de valores altos refleja una matriz energética aún poco sostenible. IE: Es una de las variables con mayor rango y presencia de outliers negativos o muy altos. Esto indica diferencias significativas en eficiencia energética: economías más eficientes requieren menos energía por unidad de producción, mientras que naciones con estructuras productivas ineficientes muestran valores elevados de intensidad. NIE:La distribución sugiere que la mayoría de países se concentran en valores relativamente bajos, con algunos casos excepcionales que indican altos niveles de ineficiencia energética. PFH:Presenta alta variabilidad, con países que dependen fuertemente de lo hidroeléctrico y otros con valores cercanos a cero. Esto evidencia diferencias estructurales en acceso a recursos hídricos y en infraestructura de generación. PFN:La mayoría de observaciones están cerca de cero, reflejando que solo unos pocos países cuentan con infraestructura nuclear. Los outliers superiores corresponden a naciones con centrales nucleares operativas o con modelos energéticos basados en energía atómica. PFR: Los valores bajos predominantes sugieren que, para el año 2000, las energías renovables distintas a la hidroeléctrica (como solar, eólica o geotérmica) se encontraban en una fase temprana de adopción global.

3.3 Análisis de componentes pincipales

El análisis de componentes principales se realizó utilizando el software R, mediante las librerías readxl, FactoMineR, factoextra y openxlsx. En primer lugar, se importó la base de datos y se seleccionaron únicamente las variables numéricas, ya que el ACP requiere datos cuantitativos para calcular las correlaciones y combinaciones lineales. Posteriormente, se llevó a cabo la estandarización de las variables, asignando una media igual a cero y una desviación estándar igual a uno, con el fin de garantizar que todas las variables tuvieran la misma importancia en el análisis y que las distancias entre observaciones fueran comparables. A continuación, se calculó el ACP utilizando la función PCA() del paquete FactoMineR, especificando la estandarización de los datos (scale.unit = TRUE) y solicitando el cálculo de todas las componentes principales (ncp = ncol(datos_num)). Este procedimiento permitió obtener los autovalores, que indican la proporción de varianza explicada por cada componente, y los autovectores, que definen la dirección de las nuevas dimensiones.

Antes de aplicar el ACP, se calculó la matriz de correlaciones entre las variables, con el propósito de identificar el grado de relación lineal existente entre ellas. Este paso resulta fundamental, ya que permite determinar si las variables están suficientemente asociadas como para que el ACP sea una técnica apropiada. Además, la matriz de correlaciones ayuda a detectar posibles redundancias entre variables (correlaciones altas) y relaciones inversas (correlaciones negativas), lo que facilita la interpretación de los resultados posteriores.

library(readxl)
library(corrplot)
## corrplot 0.95 loaded
library(openxlsx)

base <- read_excel("base.xlsx", sheet = "Hoja1")


names(base)[c(1,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] <-
  c("A", "ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", 
    "PFN", "PFH", "PFR", "IE", "CEF", "CF", "NIE", "CER")

datos_num <- base[, sapply(base, is.numeric)]


datos_cor <- subset(datos_num, select = -A)


matriz_cor <- cor(datos_cor, use = "pairwise.complete.obs", method = "pearson")

print(round(matriz_cor, 2))
##       ACT   ACE   EAN   ERC    CE   PTD   PGN   PFN   PFH   PFR    IE   CEF
## ACT  1.00  0.84  0.15 -0.83  0.58 -0.45  0.26  0.36 -0.38 -0.04  0.14  0.58
## ACE  0.84  1.00  0.26 -0.90  0.47 -0.43  0.24  0.29 -0.34 -0.06  0.12  0.45
## EAN  0.15  0.26  1.00 -0.13  0.22 -0.17 -0.28  0.42  0.37  0.03  0.10  0.02
## ERC -0.83 -0.90 -0.13  1.00 -0.45  0.37 -0.27 -0.27  0.47  0.07 -0.14 -0.46
## CE   0.58  0.47  0.22 -0.45  1.00 -0.39  0.15  0.29 -0.15 -0.02  0.00  0.85
## PTD -0.45 -0.43 -0.17  0.37 -0.39  1.00 -0.18 -0.21  0.22 -0.05 -0.24 -0.39
## PGN  0.26  0.24 -0.28 -0.27  0.15 -0.18  1.00 -0.09 -0.42 -0.08 -0.16  0.38
## PFN  0.36  0.29  0.42 -0.27  0.29 -0.21 -0.09  1.00 -0.25 -0.05  0.15  0.25
## PFH -0.38 -0.34  0.37  0.47 -0.15  0.22 -0.42 -0.25  1.00 -0.05 -0.06 -0.31
## PFR -0.04 -0.06  0.03  0.07 -0.02 -0.05 -0.08 -0.05 -0.05  1.00  0.31 -0.03
## IE   0.14  0.12  0.10 -0.14  0.00 -0.24 -0.16  0.15 -0.06  0.31  1.00 -0.03
## CEF  0.58  0.45  0.02 -0.46  0.85 -0.39  0.38  0.25 -0.31 -0.03 -0.03  1.00
## CF   0.75  0.78 -0.15 -0.90  0.32 -0.34  0.39  0.08 -0.57 -0.15  0.18  0.42
## NIE -0.20 -0.25 -0.09  0.17 -0.02 -0.06  0.08  0.02  0.01 -0.05  0.12  0.09
## CER -0.84 -0.82  0.06  0.93 -0.40  0.36 -0.35 -0.31  0.63  0.09 -0.11 -0.50
##        CF   NIE   CER
## ACT  0.75 -0.20 -0.84
## ACE  0.78 -0.25 -0.82
## EAN -0.15 -0.09  0.06
## ERC -0.90  0.17  0.93
## CE   0.32 -0.02 -0.40
## PTD -0.34 -0.06  0.36
## PGN  0.39  0.08 -0.35
## PFN  0.08  0.02 -0.31
## PFH -0.57  0.01  0.63
## PFR -0.15 -0.05  0.09
## IE   0.18  0.12 -0.11
## CEF  0.42  0.09 -0.50
## CF   1.00 -0.12 -0.91
## NIE -0.12  1.00  0.15
## CER -0.91  0.15  1.00
corrplot(matriz_cor,
         method = "color",
         type = "upper",
         tl.cex = 0.8,                  # tamaño del texto
         tl.col = "black",              # color de etiquetas
         addCoef.col = "black",         # mostrar valores numéricos
         number.cex = 0.7,
         col = colorRampPalette(c("blue", "white", "red"))(200),
         )

La matriz de correlaciones evidencia relaciones de distinta intensidad y signo entre las variables analizadas. Se observa una correlación positiva muy fuerte entre ACT y ACE (r = 0.84), lo que indica que ambas variables tienden a variar en el mismo sentido y podrían estar asociadas a una misma dimensión del fenómeno estudiado. Asimismo, se identifican correlaciones positivas moderadas entre ACT y CE (r = 0.58) y entre ACT y CEF (r = 0.75), lo que sugiere que estas variables comparten cierta información común. En contraste, la variable CER presenta una correlación negativa alta con ACT (r = -0.84) y con ACE (r = -0.82), evidenciando una relación inversa: a medida que aumentan los valores de ACT y ACE, disminuyen los de CER. Otras correlaciones, como las observadas entre PFN, PFH y PFR, son bajas o cercanas a cero, lo que indica independencia lineal entre estas variables. En conjunto, la matriz confirma la existencia de asociaciones significativas entre varios indicadores, lo que justifica la aplicación del Análisis de Componentes Principales para sintetizar la información y reducir la dimensionalidad del conjunto de datos.

library(readxl)
library(FactoMineR)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(openxlsx)


base <- read_excel("base.xlsx", sheet = "Hoja1")

datos_num <- base[, sapply(base, is.numeric)]

acp <- PCA(datos_num, 
           scale.unit = TRUE, 
           ncp = ncol(datos_num),   # <- calcula todas las componentes
           graph = FALSE)
desviaciones <- sqrt(acp$eig[, 1])
names(desviaciones) <- paste0("PC", 1:length(desviaciones))

cat("\n📏 === Desviaciones estándar de cada componente ===\n")
## 
## 📏 === Desviaciones estándar de cada componente ===
print(round(desviaciones, 4))
##    PC1    PC2    PC3    PC4    PC5    PC6    PC7    PC8    PC9   PC10   PC11 
## 2.4296 1.3992 1.2009 1.1689 1.0067 1.0000 0.9331 0.8241 0.7725 0.6876 0.5199 
##   PC12   PC13   PC14   PC15   PC16 
## 0.3663 0.3417 0.3260 0.2138 0.1569
rotacion_nxk <- as.data.frame(acp$var$coord)
colnames(rotacion_nxk) <- paste0("PC", 1:ncol(rotacion_nxk))
rownames(rotacion_nxk) <- rownames(acp$var$coord)

cat("\n📈 === Matriz completa de rotaciones (n×k) ===\n")
## 
## 📈 === Matriz completa de rotaciones (n×k) ===
print(round(rotacion_nxk, 4))
##                                                                                                         PC1
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.9094
## Acceso a la electricidad (% de la población)                                                         0.8836
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0827
## Energías renovables combustibles y residuos (% de la energía total)                                 -0.9239
## Consumo de energía eléctrica (kWh per cápita)                                                        0.6265
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.5286
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.3996
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.3710
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                        -0.5741
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.0690
## Importaciones de energía, netas (% del consumo de energía)                                           0.1496
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.6797
## Consumo de energía procedente de combustibles fósiles (% del total)                                  0.8694
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                            -0.1378
## Consumo de energía renovable (% del consumo total de energía final)                                 -0.9339
##                                                                                                         PC2
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.1260
## Acceso a la electricidad (% de la población)                                                         0.1479
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.8473
## Energías renovables combustibles y residuos (% de la energía total)                                  0.0031
## Consumo de energía eléctrica (kWh per cápita)                                                        0.3139
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.2333
## Producción de electricidad a partir de fuentes de gas natural (% del total)                         -0.5686
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.5104
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.4762
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.1712
## Importaciones de energía, netas (% del consumo de energía)                                           0.3019
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.0552
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.2886
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                            -0.0743
## Consumo de energía renovable (% del consumo total de energía final)                                  0.1621
##                                                                                                         PC3
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                        -0.0600
## Acceso a la electricidad (% de la población)                                                        -0.1865
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0091
## Energías renovables combustibles y residuos (% de la energía total)                                  0.2154
## Consumo de energía eléctrica (kWh per cápita)                                                        0.5411
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.1391
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.3064
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.0680
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.1080
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.3058
## Importaciones de energía, netas (% del consumo de energía)                                          -0.4492
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.6003
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.2395
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.4324
## Consumo de energía renovable (% del consumo total de energía final)                                  0.1870
##                                                                                                         PC4
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                        -0.0847
## Acceso a la electricidad (% de la población)                                                        -0.1878
## Energías alternativas y nucleares (% del consumo total de energía)                                  -0.2049
## Energías renovables combustibles y residuos (% de la energía total)                                  0.1235
## Consumo de energía eléctrica (kWh per cápita)                                                        0.0216
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.3400
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.1004
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.0383
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                        -0.2506
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.5821
## Importaciones de energía, netas (% del consumo de energía)                                           0.6450
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.1345
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.0406
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.5460
## Consumo de energía renovable (% del consumo total de energía final)                                  0.0587
##                                                                                                         PC5
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.0594
## Acceso a la electricidad (% de la población)                                                         0.0399
## Energías alternativas y nucleares (% del consumo total de energía)                                  -0.0667
## Energías renovables combustibles y residuos (% de la energía total)                                  0.0451
## Consumo de energía eléctrica (kWh per cápita)                                                        0.2826
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.0492
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.0916
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.4747
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.1770
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.5700
## Importaciones de energía, netas (% del consumo de energía)                                          -0.1116
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.2175
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.0795
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                            -0.5029
## Consumo de energía renovable (% del consumo total de energía final)                                  0.1030
##                                                                                                     PC6
## Año                                                                                                   1
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                          0
## Acceso a la electricidad (% de la población)                                                          0
## Energías alternativas y nucleares (% del consumo total de energía)                                    0
## Energías renovables combustibles y residuos (% de la energía total)                                   0
## Consumo de energía eléctrica (kWh per cápita)                                                         0
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                   0
## Producción de electricidad a partir de fuentes de gas natural (% del total)                           0
## Producción de electricidad a partir de fuentes nucleares (% del total)                                0
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                          0
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)   0
## Importaciones de energía, netas (% del consumo de energía)                                            0
## Consumo de energía (kg de equivalente de petróleo per cápita)                                         0
## Consumo de energía procedente de combustibles fósiles (% del total)                                   0
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                              0
## Consumo de energía renovable (% del consumo total de energía final)                                   0
##                                                                                                         PC7
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.0261
## Acceso a la electricidad (% de la población)                                                         0.1409
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0482
## Energías renovables combustibles y residuos (% de la energía total)                                 -0.1044
## Consumo de energía eléctrica (kWh per cápita)                                                       -0.0349
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.2754
## Producción de electricidad a partir de fuentes de gas natural (% del total)                         -0.0172
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.5580
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.4549
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.2888
## Importaciones de energía, netas (% del consumo de energía)                                           0.2110
## Consumo de energía (kg de equivalente de petróleo per cápita)                                       -0.0704
## Consumo de energía procedente de combustibles fósiles (% del total)                                  0.1961
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.2616
## Consumo de energía renovable (% del consumo total de energía final)                                  0.0380
##                                                                                                         PC8
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.0611
## Acceso a la electricidad (% de la población)                                                        -0.0522
## Energías alternativas y nucleares (% del consumo total de energía)                                  -0.2443
## Energías renovables combustibles y residuos (% de la energía total)                                 -0.0618
## Consumo de energía eléctrica (kWh per cápita)                                                        0.2555
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.4988
## Producción de electricidad a partir de fuentes de gas natural (% del total)                         -0.4323
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.0775
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.0618
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.0285
## Importaciones de energía, netas (% del consumo de energía)                                           0.1665
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.1981
## Consumo de energía procedente de combustibles fósiles (% del total)                                  0.0946
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.1274
## Consumo de energía renovable (% del consumo total de energía final)                                 -0.0728
##                                                                                                         PC9
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.0204
## Acceso a la electricidad (% de la población)                                                         0.1338
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.2950
## Energías renovables combustibles y residuos (% de la energía total)                                 -0.1517
## Consumo de energía eléctrica (kWh per cápita)                                                       -0.1096
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.4009
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.2901
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.0352
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.1342
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.2803
## Importaciones de energía, netas (% del consumo de energía)                                          -0.1170
## Consumo de energía (kg de equivalente de petróleo per cápita)                                       -0.0314
## Consumo de energía procedente de combustibles fósiles (% del total)                                  0.0241
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.3117
## Consumo de energía renovable (% del consumo total de energía final)                                 -0.0359
##                                                                                                        PC10
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                        -0.0056
## Acceso a la electricidad (% de la población)                                                        -0.0508
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0464
## Energías renovables combustibles y residuos (% de la energía total)                                  0.0932
## Consumo de energía eléctrica (kWh per cápita)                                                        0.0449
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.2027
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.3570
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.0731
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.0874
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.2001
## Importaciones de energía, netas (% del consumo de energía)                                           0.4093
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.0935
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.0048
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                            -0.2304
## Consumo de energía renovable (% del consumo total de energía final)                                  0.0798
##                                                                                                        PC11
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.2519
## Acceso a la electricidad (% de la población)                                                         0.0095
## Energías alternativas y nucleares (% del consumo total de energía)                                  -0.2533
## Energías renovables combustibles y residuos (% de la energía total)                                  0.0447
## Consumo de energía eléctrica (kWh per cápita)                                                       -0.1026
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                 -0.0296
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.0531
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.1819
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.2875
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.0595
## Importaciones de energía, netas (% del consumo de energía)                                          -0.0392
## Consumo de energía (kg de equivalente de petróleo per cápita)                                       -0.0249
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.0587
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.0204
## Consumo de energía renovable (% del consumo total de energía final)                                 -0.0326
##                                                                                                        PC12
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.2464
## Acceso a la electricidad (% de la población)                                                         0.0611
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0460
## Energías renovables combustibles y residuos (% de la energía total)                                  0.1122
## Consumo de energía eléctrica (kWh per cápita)                                                        0.0052
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.0354
## Producción de electricidad a partir de fuentes de gas natural (% del total)                         -0.0115
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.1016
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                        -0.1362
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.0422
## Importaciones de energía, netas (% del consumo de energía)                                           0.0196
## Consumo de energía (kg de equivalente de petróleo per cápita)                                       -0.0542
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.1191
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.0393
## Consumo de energía renovable (% del consumo total de energía final)                                  0.0628
##                                                                                                        PC13
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                        -0.0997
## Acceso a la electricidad (% de la población)                                                         0.2362
## Energías alternativas y nucleares (% del consumo total de energía)                                  -0.1039
## Energías renovables combustibles y residuos (% de la energía total)                                 -0.0118
## Consumo de energía eléctrica (kWh per cápita)                                                        0.1099
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.0122
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.0221
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.0460
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                        -0.0084
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.0012
## Importaciones de energía, netas (% del consumo de energía)                                           0.0106
## Consumo de energía (kg de equivalente de petróleo per cápita)                                       -0.1019
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.0463
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.0201
## Consumo de energía renovable (% del consumo total de energía final)                                  0.1101
##                                                                                                        PC14
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                        -0.0511
## Acceso a la electricidad (% de la población)                                                         0.1499
## Energías alternativas y nucleares (% del consumo total de energía)                                  -0.0030
## Energías renovables combustibles y residuos (% de la energía total)                                  0.0648
## Consumo de energía eléctrica (kWh per cápita)                                                       -0.1781
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.0039
## Producción de electricidad a partir de fuentes de gas natural (% del total)                         -0.0483
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.0105
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                        -0.0084
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total) -0.0100
## Importaciones de energía, netas (% del consumo de energía)                                           0.0103
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.2011
## Consumo de energía procedente de combustibles fósiles (% del total)                                 -0.0445
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                            -0.0108
## Consumo de energía renovable (% del consumo total de energía final)                                 -0.0047
##                                                                                                        PC15
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                         0.0264
## Acceso a la electricidad (% de la población)                                                         0.0061
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0139
## Energías renovables combustibles y residuos (% de la energía total)                                  0.0766
## Consumo de energía eléctrica (kWh per cápita)                                                       -0.0082
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.0040
## Producción de electricidad a partir de fuentes de gas natural (% del total)                         -0.0112
## Producción de electricidad a partir de fuentes nucleares (% del total)                               0.0289
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                        -0.0037
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.0195
## Importaciones de energía, netas (% del consumo de energía)                                          -0.0244
## Consumo de energía (kg de equivalente de petróleo per cápita)                                        0.0090
## Consumo de energía procedente de combustibles fósiles (% del total)                                  0.1590
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.0013
## Consumo de energía renovable (% del consumo total de energía final)                                  0.1073
##                                                                                                        PC16
## Año                                                                                                  0.0000
## Acceso a combustibles limpios y tecnologías para cocinar (% de la población)                        -0.0230
## Acceso a la electricidad (% de la población)                                                         0.0246
## Energías alternativas y nucleares (% del consumo total de energía)                                   0.0121
## Energías renovables combustibles y residuos (% de la energía total)                                  0.1070
## Consumo de energía eléctrica (kWh per cápita)                                                        0.0301
## Pérdidas en la transmisión y distribución de energía eléctrica (% de la producción)                  0.0030
## Producción de electricidad a partir de fuentes de gas natural (% del total)                          0.0041
## Producción de electricidad a partir de fuentes nucleares (% del total)                              -0.0035
## Producción de electricidad a partir de fuentes hidroeléctricas (% del total)                         0.0143
## Producción de electricidad a partir de fuentes renovables, excluida la hidroeléctrica (% del total)  0.0066
## Importaciones de energía, netas (% del consumo de energía)                                          -0.0017
## Consumo de energía (kg de equivalente de petróleo per cápita)                                       -0.0278
## Consumo de energía procedente de combustibles fósiles (% del total)                                  0.0193
## Nivel de intensidad energética de la energía primaria (MJ/$2017 PIB PPA)                             0.0057
## Consumo de energía renovable (% del consumo total de energía final)                                 -0.0977

En este apartado se analizan los componentes principales obtenidos mediante el ACP. Estos se encuentran ordenados de mayor a menor desviación estándar, lo que equivale a un orden decreciente de la varianza explicada. En consecuencia, el primer componente principal (PC1) presenta la mayor desviación estándar, indicando que concentra la mayor proporción de la variabilidad total de los datos. A partir de este criterio, los componentes siguientes aportan información adicional pero en menor medida. Para la matriz de rotaciones (n × k), el análisis se centrará en los dos primeros componentes principales, por ser los que explican la mayor parte de la varianza y, por tanto, ofrecen una representación más interpretable de la estructura de los datos. Para el PC1, observamos que las variables con cargas positivas altas son: acceso a la electricidad (0.9094), energías alternativas y nucleares (0.8836), consumo energía combustibles fósiles (0.8694) y consumo de energía (kg de equivalente de petróleo per cápita) (0.6797); mientras que las variables con cargas negativas altas son: consumo energía renovable (-0.9339) y energías renovables combustibles y residuos (% de la energía total) (-0.9239). Esto agrupa estas variables en cada extremo del PC1, más adelante Dim 1, sugiriendo un nombre o etiqueta para este como puede ser “Consumo”. Para el PC2, observamos que las variables con cargas positivas altas son: energías alternativas y nucleares (0.8473), producción de electricidad a partir de fuentes nucleares (% del total) (0.5104) y producción de electricidad a partir de fuentes hidroeléctricas (% del total) (0.4762); mientras que la variables con carga negativas alta es: producción de electricidad a partir de fuentes de gas natural (% del total) (-0.5686).Esto agrupa estas variables en cada extremo del PC2, más adelante Dim 2, sugiriendo un nombre o etiqueta para este como puede ser “Generación”.

library(readxl)
library(FactoMineR)
library(factoextra)

# --- Cargar la base de datos ---
base <- read_excel("base.xlsx", sheet = "Hoja1")

# --- Seleccionar solo las variables numéricas ---
datos_num <- base[, sapply(base, is.numeric)]

# --- Realizar el Análisis de Componentes Principales ---
res.pca <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)

# --- Graficar el Scree Plot ---
fviz_eig(res.pca, 
         addlabels = TRUE,        # Muestra las etiquetas con el % de varianza
         barfill = "steelblue",   # Color de las barras
         barcolor = "black",      # Borde de las barras
         linecolor = "red")       # Línea que conecta los puntos
## Warning in geom_bar(stat = "identity", fill = barfill, color = barcolor, :
## Ignoring empty aesthetic: `width`.

El gráfico interactivo de los eigenvalores (eig_plot) permite observar visualmente la “regla del codo”, donde la pendiente de la curva disminuye bruscamente. En este caso, el codo parece situarse después del segundo o tercer componente, sugiriendo que retener los dos o tres primeros componentes sería razonable para capturar la mayor parte de la información relevante con una reducción significativa de la dimensionalidad.

Visualización de individuos (Países)

library(FactoMineR)
library(factoextra)
library(plotly)
## 
## Adjuntando el paquete: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(readxl)


base <- read_excel("base.xlsx", sheet = "Hoja1")


datos_num <- base[, sapply(base, is.numeric)]

acp <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)

var_exp_2d <- sum(acp$eig[1:2, 2])
cat("Las dos primeras dimensiones explican:", round(var_exp_2d, 2), "% de la varianza total\n")
## Las dos primeras dimensiones explican: 49.13 % de la varianza total
coord <- as.data.frame(acp$ind$coord)
coord$Pais<- rownames(acp$ind$coord)
coord$cos2 <- apply(acp$ind$cos2[, 1:2], 1, sum)  # cos² solo para Dim1 y Dim2

fig <- plot_ly(
  coord,
  x = ~Dim.1,
  y = ~Dim.2,
  text = ~Pais,
  color = ~cos2,
  colors = c("#00AFBB", "#E7B800", "#FC4E07"),
  type = "scatter",
  mode = "markers+text",
  textposition = "top center",
  marker = list(size = 6)
)

# --- Personalizar diseño ---
fig <- fig %>% layout(
  title = paste0("Individuos (Paises) en el plano principal interactivo ",
                 round(var_exp_2d, 2), "% de varianza explicada"),
  xaxis = list(title = paste0("Dim 1 (", round(acp$eig[1, 2], 1), "%)")),
  yaxis = list(title = paste0("Dim 2 (", round(acp$eig[2, 2], 1), "%)"))
)

# --- Mostrar el gráfico interactivo ---
fig
## Warning: textfont.color doesn't (yet) support data arrays
## Warning: textfont.color doesn't (yet) support data arrays

El gráfico representa a los países analizados en el ACP, en lugar de los nombres de los países, se enumeró cada país por orden alfabético en la base de datos, ya que esto facilitaba la comprensión y organización dentro del plano factorial. La enumeración quedó de la siguiente manera:

library(readxl)
library(dplyr)
library(openxlsx)
library(knitr)
library(kableExtra)


base <- read_excel("base.xlsx")

tabla_paises <- base %>%
  select(Pais) %>%           
  distinct() %>%            
  arrange(Pais) %>%          
  mutate(numero = row_number()) %>%  
  select(numero, Pais)       


cat("🌍 Total de paises unicos:", nrow(tabla_paises), "\n\n")
## 🌍 Total de paises unicos: 117
tabla_paises %>%
  kable(col.names = c("num", "pais"), align = c("c", "l"), caption = "Listado de paises incluidos en el analisis") %>%
  kable_styling(full_width = FALSE, position = "center", bootstrap_options = c("striped", "hover", "condensed", "responsive"))
Listado de paises incluidos en el analisis
num pais
1 Albania
2 Algeria
3 Angola
4 Argentina
5 Armenia
6 Australia
7 Austria
8 Azerbaijan
9 Bahrain
10 Bangladesh
11 Belarus
12 Belgium
13 Benin
14 Bosnia and Herzegovina
15 Brazil
16 Brunei Darussalam
17 Cameroon
18 Canada
19 Chad
20 Chile
21 China
22 Colombia
23 Congo, Dem. Rep. 
24 Congo, Rep. 
25 Costa Rica
26 Cote d’Ivoire
27 Croatia
28 Czechia
29 Denmark
30 Ecuador
31 Egypt, Arab Rep. 
32 El Salvador
33 Equatorial Guinea
34 Estonia
35 Eswatini
36 Finland
37 France
38 Gabon
39 Georgia
40 Germany
41 Ghana
42 Greece
43 Guatemala
44 Honduras
45 Hungary
46 India
47 Indonesia
48 Iran, Islamic Rep. 
49 Iraq
50 Ireland
51 Israel
52 Italy
53 Jamaica
54 Japan
55 Jordan
56 Kazakhstan
57 Kenya
58 Korea, Rep. 
59 Kyrgyz Republic
60 Lao PDR
61 Latvia
62 Lithuania
63 Luxembourg
64 Madagascar
65 Malaysia
66 Mexico
67 Mongolia
68 Morocco
69 Mozambique
70 Myanmar
71 Namibia
72 Nepal
73 Netherlands
74 New Zealand
75 Nicaragua
76 Nigeria
77 North Macedonia
78 Norway
79 Pakistan
80 Panama
81 Paraguay
82 Peru
83 Philippines
84 Poland
85 Portugal
86 Qatar
87 Romania
88 Russian Federation
89 Rwanda
90 Saudi Arabia
91 Senegal
92 Serbia
93 Singapore
94 Slovak Republic
95 Slovenia
96 South Africa
97 Spain
98 Sri Lanka
99 Sudan
100 Suriname
101 Sweden
102 Switzerland
103 Tajikistan
104 Thailand
105 Trinidad and Tobago
106 Tunisia
107 Turkiye
108 Uganda
109 Ukraine
110 United Kingdom
111 United States
112 Uruguay
113 Venezuela, RB
114 Viet Nam
115 Yemen, Rep. 
116 Zambia
117 Zimbabwe

Si analizamos solo teniendo en cuenta la Dim1 obtenemos la confirmación de que “Consumo” es un buen nombre para esta dimensión ya que en el extremo derecho (Altos PC1): 37 (Francia), 100 (Suriname), 77(North Macedonia) y 101 (Sweden) son países que presentan niveles de desarrollo energético y patrones de consumo muy distintos, pero estos cuentan con un acceso a la energía significativo por habitante, por ejemplo Suriname aunque no se trata de un país altamente desarrollado, su posición puede explicarse por su baja población y alta demanda energética asociada a actividades mineras y petroleras, lo que eleva significativamente su consumo per cápita. Mientras que en el extremo izquierdo (Bajos PC1): 24 (Congo), 33(Equatorial Guinea), 10(Bangladesh) son países que cuentan con un menor desarrollo, y por ende menores niveles de acceso a la energía.

Por otra parte tenemos la Dim2 donde confirmamos que “Generación“ es un buen nombre para esta dimensión ya que representa las diferencias entres los países según la capacidad y la forma de producir energía, en la parte superior tenemos a países como 80 (Panamá), 102(Switzerland), los cuales se caracterizan por contar con una matriz energética altamente diversificada y una mayor participación de fuentes renovables o limpias en sus sistema de generación; en la parte inferior tenemos países como 2(Algeria), 104(Thailand), 16(Brunei Darussalam) y 85(Portugal), que presentan una menor participación de fuentes renovables en su producción energética y una mayor dependencia de combustibles fósiles o de estructuras energéticas convencionales, aunque la inclusión de Portugal en el grupo de baja participación renovable no es del todo exacta ya que se considera como uno de los líderes europeos en generación limpia.

Entonces el gráfico tendría la siguiente etiquetas:

library(FactoMineR)
library(factoextra)
library(plotly)
library(readxl)


base <- read_excel("base.xlsx", sheet = "Hoja1")


datos_num <- base[, sapply(base, is.numeric)]

acp <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)

var_exp_2d <- sum(acp$eig[1:2, 2])
cat("Las dos primeras dimensiones explican:", round(var_exp_2d, 2), "% de la varianza total\n")
## Las dos primeras dimensiones explican: 49.13 % de la varianza total
coord <- as.data.frame(acp$ind$coord)
coord$Pais <- rownames(acp$ind$coord)
coord$cos2 <- apply(acp$ind$cos2[, 1:2], 1, sum)  # cos² solo para Dim1 y Dim2

fig <- plot_ly(
  coord,
  x = ~Dim.1,
  y = ~Dim.2,
  text = ~Pais,
  color = ~cos2,
  colors = c("#00AFBB", "#E7B800", "#FC4E07"),
  type = "scatter",
  mode = "markers+text",
  textposition = "top center",
  marker = list(size = 6)
)

# --- Personalizar diseño ---
fig <- fig %>% layout(
  title = paste0("Individuos (Paises) en el plano principal interactivo ",
                 round(var_exp_2d, 2), "% de varianza explicada"),
  xaxis = list(title = paste0("Consumo (", round(acp$eig[1, 2], 1), "%)")),
  yaxis = list(title = paste0("Generacion (", round(acp$eig[2, 2], 1), "%)"))
)

# --- Mostrar el gráfico interactivo ---
fig
## Warning: textfont.color doesn't (yet) support data arrays
## Warning: textfont.color doesn't (yet) support data arrays

La ubicación de los países en el plano refuerza los nombres asignados a las dimensiones y respalda las interpretaciones propuestas. En el primer cuadrante (alto PC1 y alto PC2) se ubican países como Francia (37), Surinam (100), Macedonia del Norte (77), Suecia (101), Panamá (80) y Suiza (102). Estos países combinan un elevado acceso y consumo de energía por habitante con una matriz de generación diversificada y un fuerte componente de energías renovables. Su posición refleja un desarrollo energético avanzado, en el que la eficiencia, la innovación tecnológica y la sostenibilidad son pilares de sus políticas energéticas. En el segundo cuadrante (bajo PC1 y alto PC2) encontramos países como Bangladesh (10) y otros de características similares, que aunque presentan niveles de consumo energético bajos, muestran una transición hacia fuentes más limpias y renovables. Este grupo representa economías en desarrollo que buscan mejorar su acceso a la energía sin incrementar significativamente su dependencia de combustibles fósiles, lo que evidencia un cambio estructural hacia la sostenibilidad a pesar de sus limitaciones económicas. En el tercer cuadrante (bajo PC1 y bajo PC2) aparecen países como Congo (24) y Guinea Ecuatorial (33), que se caracterizan por bajo acceso a la energía y una producción basada principalmente en fuentes tradicionales o poco diversificadas. Estos países enfrentan importantes desafíos en infraestructura, inversión y estabilidad institucional, lo que limita su capacidad de desarrollo energético y económico. En general, este cuadrante agrupa a naciones con niveles bajos tanto en consumo como en generación renovable, reflejando contextos de desigualdad y dependencia tecnológica. Finalmente, en el cuarto cuadrante (alto PC1 y bajo PC2) se ubican países como Argelia (2), Tailandia (104), Brunei Darussalam (16) y Portugal (85). Estos presentan un alto consumo energético, asociado a su desarrollo industrial y urbano, pero una matriz de generación menos diversificada y fuertemente dependiente de fuentes fósiles (exceptuando Portugal). En este sentido, representan economías desarrolladas o en transición que aún mantienen estructuras energéticas convencionales y enfrentan el reto de avanzar hacia modelos más sostenibles.

# --- Librerías necesarias ---
library(FactoMineR)
library(factoextra)
library(ggplot2)
library(ggrepel)
library(readxl)


base <- read_excel("base.xlsx", sheet = "Hoja1")

names(base)[c(1, 4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] <-
  c("A", "ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", "PFN", "PFH", "PFR", "IE", "CE", "CEF", "NIE", "CER")

datos_num <- base[, sapply(base, is.numeric)]

acp <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)


var_coord <- as.data.frame(acp$var$coord)
var_coord$contrib <- apply(acp$var$contrib[, 1:2], 1, sum)
var_coord$Variable <- rownames(var_coord)


var_plot <- ggplot(var_coord, aes(x = Dim.1, y = Dim.2, color = contrib)) +
 
  geom_segment(aes(xend = 0, yend = 0),
               arrow = arrow(length = unit(0.2, "cm")),
               alpha = 0.7, linewidth = 0.6) +
  
  geom_point(size = 3) +

  geom_text_repel(aes(label = Variable),
                  size = 4,
                  color = "black",
                  nudge_x = 0.03, nudge_y = 0.03,
                  segment.color = "grey80") +
  
  scale_color_gradient(low = "#00AFBB", high = "#FC4E07") +
  
  labs(title =  "circulo de correlacion de variables - interactivo",
       x = paste0("consumo (", round(acp$eig[1,2], 1), "%)"),
       y = paste0("generacion (", round(acp$eig[2,2], 1), "%)"),
       color = "Contrib (%)") +
  coord_fixed() +  # Escala igual en ambos ejes
  theme_minimal()

print(var_plot) 

library(FactoMineR)
library(factoextra)
library(ggplot2)
library(ggrepel)
library(readxl)


base <- read_excel("base.xlsx", sheet = "Hoja1")

# --- Renombrar las variables numéricas ---
names(base)[c(1,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] <-
  c("A","ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", "PFN", "PFH", "PFR", "IE", "CEF", "CF", "NIE", "CER")

# --- Seleccionar solo las variables numéricas ---
datos_num <- base[, sapply(base, is.numeric)]

# --- Realizar el ACP ---
acp <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)

# --- Crear círculo de correlación con flechas, puntos y nombres ---
var_coord <- as.data.frame(acp$var$coord)
var_coord$contrib <- apply(acp$var$contrib[, 1:2], 1, sum)
var_coord$Variable <- rownames(var_coord)

# --- Construcción del gráfico ---
var_plot <- ggplot(var_coord, aes(x = Dim.1, y = Dim.2, color = contrib)) +
  # Círculo negro (radio = 1)
  geom_path(data = data.frame(
    x = cos(seq(0, 2 * pi, length.out = 200)),
    y = sin(seq(0, 2 * pi, length.out = 200))
  ),
  aes(x = x, y = y),
  color = "black", linewidth = 0.5) +
  
  # Flechas desde el origen hasta el punto
  geom_segment(aes(xend = 0, yend = 0),
               arrow = arrow(length = unit(0.2, "cm")),
               alpha = 0.7, linewidth = 0.6) +
  
  # Punto al final de cada flecha
  geom_point(size = 3) +
  
  # Nombre de la variable junto al punto
  geom_text_repel(aes(label = Variable),
                  size = 4,
                  color = "black",
                  nudge_x = 0.03, nudge_y = 0.03,
                  segment.color = "grey80") +
  
  # Escala de color (contribucion)
  scale_color_gradient(low = "#00AFBB", high = "#FC4E07") +
  
  # Títulos personalizados
  labs(title = "Circulo de correlacion de variables",
       x = paste0("Consumo (", round(acp$eig[1,2], 1), "%)"),
       y = paste0("Generacion (", round(acp$eig[2,2], 1), "%)"),
       color = "Contrib (%)") +
  
  
  coord_fixed() +
  theme_minimal()


print(var_plot)

Si analizamos solo teniendo en cuenta la Dim1 obtenemos la confirmación de que “Consumo” es un buen nombre para esta dimensión ya que en el extremo derecho (Altos PC1): 37 (Francia), 100 (Suriname), 77(North Macedonia) y 101 (Sweden) son países que presentan niveles de desarrollo energético y patrones de consumo muy distintos, pero estos cuentan con un acceso a la energía significativo por habitante, por ejemplo Suriname aunque no se trata de un país altamente desarrollado, su posición puede explicarse por su baja población y alta demanda energética asociada a actividades mineras y petroleras, lo que eleva significativamente su consumo per cápita. Mientras que en el extremo izquierdo (Bajos PC1): 24 (Congo), 33(Equatorial Guinea), 10(Bangladesh) son países que cuentan con un menor desarrollo, y por ende menores niveles de acceso a la energía.

Por otra parte tenemos la Dim2 donde confirmamos que “Generación“ es un buen nombre para esta dimensión ya que representa las diferencias entres los países según la capacidad y la forma de producir energía, en la parte superior tenemos a países como 80 (Panamá), 102(Switzerland), los cuales se caracterizan por contar con una matriz energética altamente diversificada y una mayor participación de fuentes renovables o limpias en sus sistema de generación; en la parte inferior tenemos países como 2(Algeria), 104(Thailand), 16(Brunei Darussalam) y 85(Portugal), que presentan una menor participación de fuentes renovables en su producción energética y una mayor dependencia de combustibles fósiles o de estructuras energéticas convencionales, aunque la inclusión de Portugal en el grupo de baja participación renovable no es del todo exacta ya que se considera como uno de los líderes europeos en generación limpia.

library(FactoMineR)
library(factoextra)
library(plotly)
library(readxl)
library(dplyr)


base <- read_excel("base.xlsx", sheet = "Hoja1")


names(base)[c(1,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18)] <-
  c("A", "ACT", "ACE", "EAN", "ERC", "CE", "PTD", "PGN", "PFN", "PFH", "PFR", "IE", "CE", "CEF", "NIE", "CER")

datos_num <- base[, sapply(base, is.numeric)]

# --- Realizar el ACP ---
acp <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)

# --- Coordenadas de individuos (puntos) ---
coord_ind <- as.data.frame(acp$ind$coord)
coord_ind$Individuo <- rownames(acp$ind$coord)
coord_ind$cos2 <- apply(acp$ind$cos2[, 1:2], 1, sum)

# --- Coordenadas de variables (flechas) ---
coord_var <- as.data.frame(acp$var$coord)
coord_var$Variable <- rownames(coord_var)
coord_var$contrib <- apply(acp$var$contrib[, 1:2], 1, sum)

# --- Escalamos las flechas para que se vean bien ---
# Ajustamos la longitud de las variables al rango de los individuos
max_ind <- max(abs(coord_ind[, 1:2]))
max_var <- max(abs(coord_var[, 1:2]))
escala <- max_ind / max_var * 0.7  # Escalado a 70% del rango de individuos
coord_var[, 1:2] <- coord_var[, 1:2] * escala

# --- Crear figura interactiva ---
fig <- plot_ly(type = "scatter", mode = "markers+text")

# --- Añadir individuos (puntos) ---
fig <- fig %>%
  add_trace(
    data = coord_ind,
    x = ~Dim.1,
    y = ~Dim.2,
    text = ~Individuo,
    color = ~cos2,
    colors = c("#00AFBB", "#E7B800", "#FC4E07"),
    type = "scatter",
    mode = "markers+text",
    textposition = "top center",
    marker = list(size = 6, opacity = 0.8),
    name = "Individuos"
  )

# --- Añadir flechas de variables ---
for (i in 1:nrow(coord_var)) {
  fig <- fig %>%
    add_trace(
      x = c(0, coord_var$Dim.1[i]),
      y = c(0, coord_var$Dim.2[i]),
      mode = "lines+markers+text",
      text = coord_var$Variable[i],
      textposition = "top center",
      line = list(color = "red", width = 2),
      marker = list(size = 3, color = "red"),
      name = "Variables",
      showlegend = FALSE
    )
}

# --- Personalizar diseño ---
var_exp_2d <- sum(acp$eig[1:2, 2])

fig <- fig %>%
  layout(
    title = paste0("Biplot Interactivo de individuos y variables (", round(var_exp_2d, 2), "% de varianza explicada)"),
    xaxis = list(title = paste0("Consumo (", round(acp$eig[1, 2], 1), "%)")),
    yaxis = list(title = paste0("Generacion (", round(acp$eig[2, 2], 1), "%)")),
    showlegend = TRUE
  )

# --- Mostrar el gráfico interactivo ---
fig
## Warning: textfont.color doesn't (yet) support data arrays
## Warning: textfont.color doesn't (yet) support data arrays

El biplot corrobora las interpretaciones del gráfico de individuos y del círculo de correlación. Permite ver cómo los países se relacionan con las variables: “Consumo (36.9%)” Este eje representa principalmente un gradiente de consumo energético: los individuos (países, regiones o unidades) situados hacia la derecha tienen mayores niveles de consumo o acceso energético, mientras que los de la izquierda muestran valores más bajos. “Generación (12.2%)” Explica el 12.2% de la variabilidad y está asociado con las formas de generación de energía (por ejemplo, renovables, nucleares, etc.). Los puntos en la parte superior se relacionan con mayor participación de fuentes renovables o alternativas, mientras que los de la parte inferior reflejan menor diversificación o dependencia de fuentes convencionales.

Contribución de Variables e Individuos a las Componentes Es fundamental analizar la contribución de cada variable e individuo en la construcción de las componentes principales, ya que esto permite identificar su relevancia en la definición y caracterización de cada dimensión del modelo.

library(readxl)
library(FactoMineR)
library(factoextra)
library(openxlsx)

# --- Cargar la base de datos ---
base <- read_excel("base.xlsx", sheet = "Hoja1")

# --- Seleccionar solo las variables numéricas ---
datos_num <- base[, sapply(base, is.numeric)]

# --- Realizar el Análisis de Componentes Principales con TODAS las PCs ---
acp <- PCA(datos_num, 
           scale.unit = TRUE, 
           ncp = ncol(datos_num),   # <- calcula todas las componentes
           graph = FALSE)

eig_table <- as.data.frame(acp$eig)
colnames(eig_table) <- c("Eigenvalue", "%Varianza", "%Varianza_Acumulada")
eig_table$Desviacion_Estandar <- sqrt(eig_table$Eigenvalue)
rownames(eig_table) <- paste0("PC", 1:nrow(eig_table))

cat("\n📊 === Autovalores y desviaciones Estandar de TODAS las PCs ===\n")
## 
## 📊 === Autovalores y desviaciones Estandar de TODAS las PCs ===
print(eig_table)
##      Eigenvalue  %Varianza %Varianza_Acumulada Desviacion_Estandar
## PC1  5.90313352 36.8945845            36.89458           2.4296365
## PC2  1.95782443 12.2364027            49.13099           1.3992228
## PC3  1.44213468  9.0133417            58.14433           1.2008891
## PC4  1.36631848  8.5394905            66.68382           1.1688963
## PC5  1.01346164  6.3341353            73.01795           1.0067083
## PC6  1.00000000  6.2500000            79.26795           1.0000000
## PC7  0.87062188  5.4413868            84.70934           0.9330712
## PC8  0.67906999  4.2441875            88.95353           0.8240570
## PC9  0.59677611  3.7298507            92.68338           0.7725129
## PC10 0.47278035  2.9548772            95.63826           0.6875902
## PC11 0.27028675  1.6892922            97.32755           0.5198911
## PC12 0.13419495  0.8387184            98.16627           0.3663263
## PC13 0.11676077  0.7297548            98.89602           0.3417027
## PC14 0.10630663  0.6644165            99.56044           0.3260470
## PC15 0.04570339  0.2856462            99.84608           0.2137835
## PC16 0.02462643  0.1539152           100.00000           0.1569281

Los autovalores (eigenvalues) se encuentran ordenados de mayor a menor, lo que significa que las primeras componentes principales son las que explican la mayor parte de la varianza total del conjunto de datos. En este caso, la primera componente (PC1) concentra el 36.89% de la variabilidad, seguida por la PC2 con un 12.23%, y la PC3 con un 9.01%. A medida que avanzan las dimensiones, la cantidad de varianza explicada por cada componente disminuye progresivamente, lo cual es natural, ya que las primeras dimensiones capturan los patrones más importantes de la información, mientras que las últimas explican aspectos más específicos o residuales. En conjunto, las primeras cinco componentes explican aproximadamente el 73% de la varianza total, lo que indica una adecuada reducción de la dimensionalidad conservando la mayor parte de la información original. Aplicando el criterio de Kaiser, se retienen únicamente las componentes con autovalores superiores a 1. En este caso, las componentes PC1 a PC5 cumplen con dicha condición, por lo que se consideran las más relevantes para la interpretación y caracterización del modelo. Por lo tanto, reducimos el número de dimensiones a analizar de 16 a 5.

La decisión de retener y analizar las dos primeras Componentes Principales (PC1, PC2) se fundamenta en criterios estadísticos y de interpretabilidad del modelo. De acuerdo con los valores propios obtenidos, la PC1 explica el 36.89% de la varianza total, la PC2 aporta un 12.26% adicional. En conjunto, estas tres dimensiones acumulan aproximadamente el 49.12% de la varianza total, lo que representa una proporción considerable de la información original contenida en las variables.

Si bien las componentes PC3 y PC4 también presentan autovalores mayores a 1 (según el criterio de Kaiser), su aporte incremental a la varianza explicada disminuye progresivamente, lo que indica una menor relevancia para la descripción global del fenómeno. En el gráfico de sedimentación (Scree Plot) se observa un cambio notorio en la pendiente de un “codo” a partir del tercer componente, lo que sugiere que la mayor parte de la estructura informativa del conjunto de datos se concentra en las tres primeras dimensiones.

Optar por trabajar con tres componentes principales permite mantener un equilibrio adecuado entre simplificación y capacidad explicativa, conservando más del 58% de la varianza total y garantizando una representación robusta de la estructura multivariada. Esto posibilita, además, una interpretación más completa de los factores que diferencian a los países analizados, sin sacrificar la claridad de los resultados.

El análisis de las contribuciones de las variables respalda esta decisión, ya que las variables con mayor peso en la PC1 como acceso a la electricidad, consumo de energía eléctrica y energías alternativas y nucleares se asocian con un eje de modernización energética y desarrollo económico. Las variables que predominan en la PC2, tales como energías renovables y acceso a combustibles limpios y tecnologías para cocinar, conforman un eje vinculado con la transición hacia la sostenibilidad y la equidad energética.

4 Determinación del número óptimo de clusters y clusterización

El método de Ward es un procedimiento aglomerativo, es decir, comienza tratando cada observación como un cluster independiente y, en cada paso, fusiona los dos grupos cuya unión produce el menor incremento en la varianza total dentro de los clusters. En otras palabras, Ward busca minimizar la suma de cuadrados intra–cluster, lo que garantiza que los grupos resultantes sean internamente similares y externamente diferentes.

Esta característica lo convierte en un método altamente robusto para análisis exploratorios, especialmente cuando se trabaja con variables cuantitativas estandarizadas y se desea obtener estructuras de agrupamiento bien definidas. Además, su uso suele complementarse con técnicas como el Análisis de Componentes Principales (ACP), lo cual facilita la visualización de los clusters en un espacio reducido y mejora la interpretación global del fenómeno estudiado.

library(readxl)
library(FactoMineR)
library(factoextra)
library(openxlsx)


base <- read_excel("base.xlsx", sheet = "Hoja1")


nombres_paises <- base$Pais


datos_num <- base[, sapply(base, is.numeric)]


acp <- PCA(datos_num,
           scale.unit = TRUE,
           ncp = ncol(datos_num),
           graph = FALSE)


coord_pc12 <- as.data.frame(acp$ind$coord[, 1:2])
rownames(coord_pc12) <- nombres_paises  # Asignar los nombres de los países


distancia <- dist(coord_pc12, method = "euclidean")


cluster_ward <- hclust(distancia, method = "ward.D2")

fviz_dend(cluster_ward,
          k = 4,                     # número de clusters (ajústalo si quieres)
          cex = 0.6,                 # tamaño del texto (ajústalo si son muchos paises)
          palette = "jco",           # colores agradables
          rect = TRUE,               # mostrar los rectángulos de los clusters
          rect_border = "blue",      # líneas azules
          rect_lty = 2,              # línea discontinua
          rect_fill = FALSE,         # solo mostrar las líneas
          main = "Dendrograma - Metodo Ward (usando PC1 y PC2)",
          xlab = "Paises",
          ylab = "Distancia (Ward.D2)")
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## Visualización

library(readxl)
library(FactoMineR)
library(ade4)
## 
## Adjuntando el paquete: 'ade4'
## The following object is masked from 'package:FactoMineR':
## 
##     reconst
library(car)    
## Cargando paquete requerido: carData
## 
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:purrr':
## 
##     some
## The following object is masked from 'package:dplyr':
## 
##     recode
base <- read_excel("base.xlsx", sheet = "Hoja1")

datos_num <- base[, sapply(base, is.numeric)]

acp <- PCA(datos_num, scale.unit = TRUE, graph = FALSE)

coord <- acp$ind$coord[, 1:2]

distancia <- dist(coord)
cluster_ward <- hclust(distancia, method = "ward.D2")

# ---- CAMBIO AQUÍ → 4 CLUSTERS ----
grupos <- cutree(cluster_ward, k = 4)

dudi_obj <- dudi.pca(datos_num, scannf = FALSE, nf = 2)
xy <- dudi_obj$li[, 1:2]
colnames(xy) <- c("Dim1", "Dim2")

# Ahora 4 colores para los 4 clusters
col_puntos <- c("red", "cyan", "blue", "orange")

s.class(xy,
        fac = factor(grupos),
        xax = 1, yax = 2,
        col = col_puntos,
        grid = TRUE,
        cell = 0,
        clabel = 0,
        cstar = 1,
        cpoint = 1.5,
        addaxes = TRUE,
        axesell = FALSE,
        sub = "Consumo y generación energética",
        possub = "bottomright")

mtext("1", side = 1, line = 2.5, cex = 1.2)  
mtext("2", side = 2, line = 2.5, cex = 1.2)  

# Dibujar elipses o círculos
k <- length(unique(grupos))
for (i in seq_len(k)) {
  inds <- which(grupos == i)
  if (length(inds) >= 3) {
    car::dataEllipse(xy[inds,1], xy[inds,2],
                     add = TRUE,
                     levels = 0.95,
                     plot.points = FALSE,
                     lwd = 2,
                     lty = 1,
                     col = adjustcolor(col_puntos[i], alpha.f = 0.9),
                     fill = TRUE,
                     fill.alpha = 0.1)
  } else {
    centro <- colMeans(xy[inds, , drop = FALSE])
    symbols(centro[1], centro[2],
            circles = 0.5,
            add = TRUE,
            inches = FALSE,
            lwd = 2,
            lty = 1,
            col = adjustcolor(col_puntos[i], alpha.f = 0.9))
  }
}

# Centroides
centroides <- aggregate(xy, by = list(Cluster = grupos), FUN = mean)
points(centroides[,2], centroides[,3], pch = 16, cex = 1.3, col = "black")
text(centroides[,2], centroides[,3],
     labels = centroides[,1],
     col = "black",
     cex = 1.6,
     font = 2)

A partir del dendrograma generado mediante el método de Ward y la visualización se identificó que los países se agrupan de manera natural en cuatro clusters claramente diferenciados. Esta estructura se observa cuando el árbol se corta a una altura en la que aparecen rupturas marcadas entre los grupos, lo que permite formar conjuntos internamente homogéneos y externamente heterogéneos.

Cluster 1 El primer cluster corresponde al grupo más numeroso y homogéneo, ubicado en el extremo izquierdo del dendrograma. Este conjunto se caracteriza por valores relativamente bajos en el componente principal 1, lo que indica niveles moderados o reducidos de consumo energético y actividad económica asociada. Su posición compacta en el dendrograma sugiere que los países del grupo comparten rasgos muy similares en las variables analizadas, generando un perfil estable y coherente dentro del contexto energético. En el espacio del PCA, este cluster se concentra hacia la zona negativa del PC1 y cercana a valores bajos del PC2, lo que significa que también presentan capacidades de generación eléctrica moderadas o bajas. En conjunto, estos elementos permiten afirmar que el Cluster 1 agrupa países con estructuras energéticas menos intensivas, posiblemente con menor desarrollo industrial o eficiencia energética limitada.

Cluster 2

El segundo cluster se encuentra en una posición intermedia tanto en el dendrograma como en el PCA. Este grupo muestra valores más altos en PC1 que el cluster azul, lo cual indica mayores niveles de consumo energético o mayor actividad económica. Sin embargo, su dispersión interna sugiere una heterogeneidad mayor, lo que refleja que estos países se encuentran en situaciones transicionales o con comportamientos energéticos variados. En términos de generación eléctrica (PC2), los países del Cluster 2 presentan valores también intermedios, lo que permite interpretarlos como naciones que han desarrollado parcialmente su infraestructura energética, pero sin alcanzar niveles extremos. Su ubicación en el dendrograma, claramente separada del cluster azul, evidencia diferencias estructurales consistentes que justifican su agrupación independiente.

Cluster 3

El tercer cluster es el más pequeño y compacto, lo que sugiere que los países que lo conforman presentan similitudes muy marcadas entre sí y, al mismo tiempo, grandes diferencias respecto a los demás grupos. Su posición en el PCA es atípica en relación con los clusters principales, ubicándose en zonas alejadas del centro, lo que indica patrones energéticos particulares o extremos.Este cluster suele representar países con características energéticas poco comunes: pueden ser naciones con una alta capacidad de generación pero bajo consumo, o casos inversos donde el consumo es elevado pero la producción no acompaña esa demanda. La estructura cerrada y breve del cluster en el dendrograma confirma que comparten una dinámica energética distintiva, justificando su separación como un grupo propio.

Cluster 4

El cuarto cluster agrupa países con valores elevados tanto en consumo energético (PC1) como en generación (PC2). Su ubicación en el extremo derecho del dendrograma evidencia que estos países se encuentran claramente diferenciados de los demás, presentando niveles energéticos y económicos significativamente superiores. Este patrón indica mayor desarrollo industrial, sistemas energéticos robustos y mayor complejidad en sus demandas y capacidades.Aunque el cluster muestra una mayor dispersión interna que los clusters azul y gris, esta variabilidad puede explicarse por diferencias en las estructuras económicas o en la mezcla de fuentes energéticas de cada país. No obstante, la posición dominante en ambos componentes principales permite caracterizar este grupo como el de mayor desarrollo energético del conjunto analizado.

5 Interpretación de los factores y descripción de los clusters

Mediante el Análisis de Componentes Principales (ACP) y la clusterización, se pueden identificar los factores latentes que explican la variabilidad de los datos y describir los perfiles característicos de los clusters de países.

5.1 Interpretación de los factores (Componentes principales)

El Análisis de Componentes Principales (ACP) permitió identificar los ejes latentes que estructuran la variabilidad de los patrones energéticos de los países analizados. De acuerdo con los resultados, las dos primeras componentes principales concentran aproximadamente el 49.12% de la varianza total (PC1: 36.89% y PC2: 12.23%), lo que evidencia que estos dos factores capturan cerca de la mitad de la información contenida en las 16 variables originales, ofreciendo una representación clara y comprensible de las diferencias energéticas globales. La reducción dimensional obtenida facilita la comprensión de las dinámicas subyacentes en los datos, al sintetizar múltiples indicadores energéticos en dos dimensiones conceptualmente interpretables: “Consumo energético y desarrollo” (PC1) y “Generación energética y transición hacia fuentes limpias” (PC2). Estas dimensiones constituyen los principales factores explicativos de la heterogeneidad energética entre países y permiten analizar su posición relativa en función de su estructura de consumo y producción de energía. Primera Componente Principal (PC1): “Consumo energético y desarrollo”: La primera componente principal (PC1), que explica el 36.89% de la varianza, agrupa variables asociadas al nivel de consumo energético, acceso y dependencia de fuentes fósiles, lo que refleja un eje fuertemente vinculado con el grado de desarrollo económico e industrial de los países. Las cargas positivas elevadas en acceso a la electricidad (0.9094), energías alternativas y nucleares (0.8836), consumo de energía procedente de combustibles fósiles (0.8694) y consumo total de energía (0.6797) caracterizan a los países con infraestructura energética consolidada, alta demanda per cápita y dependencia de fuentes no renovables. Este perfil suele corresponder a economías desarrolladas o industrializadas, en las que el crecimiento económico está sustentado en un modelo energético intensivo y tecnológicamente avanzado, aunque con mayores emisiones y presiones ambientales. En el extremo opuesto, las variables con cargas negativas elevadas —consumo de energía renovable (-0.9339) y energías renovables combustibles y residuos (-0.9239)— identifican a países con menor consumo energético per cápita, pero con matrices más sostenibles y mayor participación de fuentes renovables. Este grupo se asocia principalmente con naciones en desarrollo o emergentes, donde las limitaciones de acceso y la menor industrialización reducen la demanda energética, pero a la vez propician un uso más equilibrado y sostenible de los recursos. En conjunto, el PC1 puede interpretarse como un eje de modernización energética y desarrollo económico, que diferencia a los países de alto consumo y dependencia fósil frente a aquellos con modelos energéticos más sostenibles y de menor intensidad energética. Esta dimensión refleja, por tanto, las asimetrías estructurales del sistema energético mundial, donde el consumo energético actúa como un indicador indirecto del nivel de desarrollo y del modelo productivo predominante. No obstante, es importante señalar que el modelo incluye ciertos países cuya ubicación resulta contraintuitiva respecto a su nivel de desarrollo o a sus políticas energéticas reales. Esto puede deberse a que el Análisis de Componentes Principales (ACP), al reducir la complejidad multidimensional de los datos a ejes sintéticos, agrupa países según patrones estadísticos y no necesariamente según su contexto socioeconómico o institucional. En consecuencia, algunas posiciones pueden reflejar anomalías derivadas del peso desigual de las variables o de particularidades nacionales específicas, como una alta producción extractiva o un bajo consumo residencial. Por ello, esta dimensión debe entenderse como un indicador global de consumo relativo, más que como una clasificación definitiva del nivel de desarrollo energético.

Segunda Componente Principal (PC2): “Generación energética y transición hacia fuentes limpias”: La segunda componente principal (PC2), que explica el 12.23% de la varianza, representa un eje relacionado con la estructura de generación eléctrica y la diversificación de las fuentes utilizadas en cada país. Las cargas positivas en energías alternativas y nucleares (0.8473), producción hidroeléctrica (0.4762) y producción de electricidad a partir de fuentes nucleares (0.5104) evidencian un patrón de transición energética y modernización tecnológica, característico de países con mayor capacidad de inversión, políticas de sostenibilidad y diversificación en sus matrices energéticas. Este perfil refleja un esfuerzo por reducir la dependencia de los combustibles fósiles mediante la incorporación de fuentes de baja emisión y tecnologías limpias. En contraste, la carga negativa alta en producción de electricidad a partir de gas natural (-0.5686) identifica economías cuya generación energética aún depende significativamente de recursos fósiles, reflejando una menor diversificación y un avance más lento hacia la transición energética. Por tanto, el PC2 puede interpretarse como un eje de generación y estructura de la matriz energética, que distingue a los países según su capacidad productiva y la composición de sus fuentes de energía. En el extremo superior se ubican naciones con matrices energéticas diversificadas y una mayor participación de fuentes limpias o renovables, como Suiza o Panamá, las cuales reflejan una transición consolidada hacia la sostenibilidad y la eficiencia en la generación eléctrica. En contraste, en el extremo inferior se agrupan países con una mayor dependencia de combustibles fósiles o fuentes convencionales, como Argelia, Tailandia o Brunéi Darussalam, evidenciando modelos energéticos aún centrados en la extracción y quema de hidrocarburos. Sin embargo, el modelo también incluye casos aparentemente contradictorios, como Portugal, cuya posición no coincide con su reconocido liderazgo en energía renovable. Este comportamiento se explica porque el ACP sintetiza múltiples variables en ejes estadísticos, priorizando las correlaciones internas de los datos sobre el contexto particular de cada país, también el año de referencia de los datos puede influir significativamente en los resultados, dado que los procesos de transición energética son dinámicos y varían entre países: algunos avanzan rápidamente hacia fuentes limpias, mientras que otros presentan retrasos estructurales. Así, esta dimensión no debe entenderse como una clasificación categórica del nivel de sostenibilidad, sino como un indicador comparativo de la orientación estructural de la generación energética, que revela las diferencias tecnológicas y de diversificación entre las naciones.

5.2 Interpretación de los clusters

El análisis de clusters permitió agrupar a los países según sus similitudes en consumo, generación y condiciones estructurales asociadas al desarrollo económico y social. Bajo este enfoque, cada grupo refleja patrones comunes que permiten interpretar su posición relativa en el plano del ACP.

El Cluster 1

Agrupa a países que comparten un patrón de desarrollo caracterizado por niveles reducidos de consumo y generación, tanto en términos energéticos como productivos. En este grupo se encuentran Angola, Ghana, Kenia, Sudán, Zimbabue, Nicaragua e Indonesia. La mayoría de estos países son africanos, lo que explica en buena medida las similitudes estructurales que exhiben, especialmente en relación con sus sistemas energéticos, sus modelos económicos y sus desafíos sociales. Este cluster se distingue por una industrialización aún incipiente, con economías que dependen principalmente de actividades extractivas, agrícolas o de baja transformación productiva. Sus sistemas energéticos presentan limitaciones importantes: redes de distribución más restringidas, menor capacidad instalada y una dependencia significativa de fuentes térmicas o tradicionales, lo que reduce tanto la eficiencia como la disponibilidad energética per cápita. En el ámbito social, estos países enfrentan rezagos persistentes en indicadores como pobreza, acceso a servicios básicos, desigualdad y desarrollo humano. Tales condiciones se relacionan directamente con la limitada inversión en infraestructura y con la dificultad para sostener altos niveles de consumo energético. Incluso en casos donde existen abundantes recursos naturales, como petróleo o minerales, estas rentas no se traducen completamente en una expansión de la capacidad de generación ni en mejoras sustanciales en el bienestar de la población. En suma, el Cluster 1 representa un conjunto de economías en desarrollo que en el año 2000 se encontraban en etapas de consolidación productiva y social, compartiendo perfiles de bajo o medio desarrollo que las ubican lejos de los niveles de consumo, generación y diversificación económica característicos de los clusters asociados con países más industrializados, no muy distinto a la actualidad.

El Cluster 2

Está conformado por países como Colombia, Jamaica, Azerbaijan, Bahrain, Irlanda, Australia y Rumania, los cuales, a pesar de su diversidad geográfica y económica, muestran patrones similares de consumo y generación de energía en el año 2000. Esto indica que el agrupamiento refleja más características estructurales de sus economías y sistemas energéticos que factores geográficos o culturales. En términos de consumo energético, estos países presentan niveles moderados a relativamente altos, pero no extremos. En 2000, naciones como Australia e Irlanda ya contaban con economías desarrolladas y un consumo per cápita significativo, mientras que países como Colombia y Jamaica mostraban un consumo menor, aunque creciente, asociado a su industrialización y demanda urbana en expansión. Respecto a la generación de energía, los países del cluster muestran una capacidad suficiente para abastecer gran parte de su demanda interna, combinando fuentes locales y, en algunos casos, importaciones energéticas. Por ejemplo:Azerbaijan y Bahrain dependían en gran medida de recursos fósiles propios (petróleo y gas), asegurando su capacidad de generación.Rumania, como economía europea post-transición, mezclaba generación nacional con algunas importaciones.Colombia y Jamaica dependían parcialmente de recursos hidroeléctricos y térmicos locales, cubriendo una parte importante de la demanda doméstica. Desde la perspectiva del análisis de componentes principales (PCA), es probable que los países en este cluster tuvieran puntuaciones moderadas en PC1 (consumo) y PC2 (generación). Esto refleja un equilibrio relativo, donde ninguno de los países presenta extremos en consumo o generación, diferenciándolos de los grandes consumidores mundiales o de países con generación excesiva para su consumo interno. La diversidad geográfica de los países en este cluster evidencia que la similitud se da por estructuras económicas y energéticas comparables, más que por cercanía regional. En 2000, este grupo representaba economías con cierta estabilidad en la relación consumo-generación, lo que podía favorecer la resiliencia frente a crisis energéticas o fluctuaciones en precios internacionales.

El Cluster 3

Está conformado por países como El Salvador, Albania, Georgia, Filipinas, Panamá y Costa Rica, los cuales, a pesar de su diversidad geográfica, presentan un perfil energético y de consumo notablemente homogéneo en el año 2000. En el dendrograma, este cluster se muestra como pequeño horizontalmente, lo que indica que la distancia entre los países es baja, es decir, comparten características muy similares en las variables utilizadas para el análisis, que en este caso están relacionadas con consumo y generación de energía. En términos de consumo energético, los países de este cluster presentan niveles moderados a bajos, coherentes con economías de tamaño medio o pequeño durante el año 2000. Por ejemplo, países centroamericanos como El Salvador, Panamá y Costa Rica tenían una demanda interna limitada, impulsada principalmente por sectores doméstico e industrial en crecimiento, pero sin alcanzar niveles de consumo de economías más grandes o altamente industrializadas. De manera similar, naciones como Albania y Georgia, en ese período post-transición económica, mostraban un consumo relativamente bajo pero estable, asociado a su estructura industrial y a la recuperación económica después de décadas de cambios políticos. Por su parte, Filipinas, aunque con un consumo mayor que algunos de los demás países del cluster, mantenía un patrón de demanda moderada, concentrado en centros urbanos y zonas industriales clave. Respecto a la generación de energía, los países en el Cluster 3 dependían principalmente de fuentes locales, como hidroeléctricas, plantas térmicas de pequeña a mediana escala y, en algunos casos, importaciones limitadas de energía. Esta capacidad de generación permitía cubrir la mayor parte de la demanda interna, aunque de manera más restringida que en países de clusters con niveles más altos de consumo y generación. En conjunto, esto evidencia que el Cluster 3 representa economías energéticamente equilibradas pero de menor escala, con patrones muy similares entre sí, lo que explica la compactación horizontal del cluster en el dendrograma. Desde la perspectiva del análisis de componentes principales (PCA), los países de este cluster probablemente presentan puntuaciones cercanas en PC1 y PC2, lo que indica que tanto su nivel de consumo como su capacidad de generación son comparables y homogéneos. Esta similitud refleja estructuras energéticas y económicas parecidas, independientemente de su ubicación geográfica, lo que permite agruparlos en un mismo cluster de manera consistente.

El cluster 4

Compuesto por Estados Unidos, Paraguay, Alemania, Luxemburgo, Lituania, Hungría, Nueva Zelanda, Eslovenia y Armenia, reúne a países que para el año 2000 mostraban niveles relativamente altos de consumo y generación, así como una infraestructura energética más estable en comparación con otros grupos del análisis. Aunque combina economías altamente industrializadas con países en transición post-soviética o de ingreso medio, todos comparten una capacidad instalada suficiente para sostener su demanda interna, así como estructuras económicas más diversificadas que las observadas en clusters de menor desarrollo. Desde la perspectiva ambiental, este cluster refleja países que, hacia el año 2000, ya estaban dando pasos hacia la regulación ambiental y la adopción inicial de políticas de mitigación, especialmente en el caso de Estados Unidos, Alemania, Nueva Zelanda y Luxemburgo. Por su parte, los países de Europa del Este y Armenia se encontraban en procesos de modernización de sus sistemas productivos y energéticos tras la disolución soviética, lo que significaba avances desiguales en materia ambiental, pero una clara tendencia hacia la integración de normativas europeas más estrictas. En términos sociales, los países de este cluster presentan indicadores de bienestar superiores al promedio global para ese año: mayores niveles de urbanización, acceso a servicios públicos, educación más extendida y sistemas sanitarios relativamente consolidados. Incluso en los países que atravesaban procesos de reorganización institucional, los avances sociales eran más marcados que aquellos observados en economías de menor desarrollo del análisis. En el plano político, el año 2000 mostraba a los países de Europa Central y del Este —como Hungría, Eslovenia y Lituania— en pleno proceso de integración hacia la Unión Europea, consolidando instituciones democráticas y transformando sus economías hacia modelos de mercado. Estados Unidos, Alemania y Nueva Zelanda ya contaban con marcos institucionales estables y capacidad estatal elevada. Paraguay y Armenia, aunque con trayectorias más complejas, presentaban procesos de estabilización política y transición democrática.

6 Conclusiones

El análisis no supervisado aplicado, que integro el Analisis de Componentes Principales (ACP) y la clusterización jerárquica, permitió revelar de manera clara cómo se manifiestan las desigualdades energéticas entre los países en el año 2000 y cuales son los factores estructurales que explican dichas brechas. La reducción dimensional obtenida a partir del ACP sintetizó la complejidad del sistema energético global en dos ejes fundamentales: el consumo energético asociado al desarrollo económico y la estructura de generación vinculada a la diversificación y transición hacia fuentes limpias. Estos dos factores reflejan de manera precisa las diferencias sistémicas que separan las naciones en términos de acceso, intensidad energética, dependencia de combustibles fósiles y capacidad tecnológica para transformar sus matrices energéticas. Así, el ACP no sólo simplificó el conjunto de variables sino que permitió las fuerzas principales que moldean la desigualdad energética global.

En primer lugar, el eje de consumo energético, asociado al PC1 evidencio que la mayor parte de la desigualdad energética en el año 2000 tiene un carácter estructural: los países con mayores niveles de consumo energético per cápita, acceso a la electricidad y uso intensivo de combustibles fósiles corresponden a economías industrializadas o en etapas avanzadas de desarrollo económico. En contraste, los países con valores bajos en este componente mostraron limitaciones significativas de acceso, menor infraestructura y un consumo energético más asociado a necesidades básicas que a procesos productivos, lo que confirma que la desigualdad energética es un reflejo directo de la desigualdad económica global. Esta dimensión demuestra que la energía actúa simultáneamente como condición y consecuencia del desarrollo: a mayor ingreso y capacidad industrial, mayor posibilidad de acceder, consumir y transformar la energía.

En segundo lugar, el eje de generación energética, capturado en el PC2, reveló una desigualdad de naturaleza tecnológica y ambiental. Los países situados en el extremo positivo de este eje poseen matrices energéticas diversificadas, con uso significativo de fuentes hidroeléctricas, nucleares o alternativas, lo cual evidencia inversiones sostenidas y políticas públicas orientadas hacia la sostenibilidad. En contraste, los países ubicados en el extremo opuesto mantienen una generación eléctrica centrada en el gas natural u otros combustibles fósiles, lo que evidencia limitaciones en capacidad financiera, institucional o tecnológica para avanzar en procesos de transición energética. Esta dimensión muestra que la desigualdad energética no solo se manifiesta en cuánto se consume, sino también en cómo se produce y en el grado de sofisticación tecnológica disponible para diversificar la matriz energética.

La clusterización confirmó y profundizó estos patrones al identificar cuatro grupos energéticos claramente diferenciados. Los países del primer cluster, caracterizados por bajo consumo y escasa diversificación en la generación, representan territorios con fuertes limitaciones estructurales, instituciones débiles y rezagos históricos en infraestructura. Este grupo tiene una particularidad importante, es el único donde se observa una concentración geográfica marcada, con una alta presencia de países africanos. Sin embargo, esta concentración no implica que las diferencias energéticas sean geográficas por naturaleza; más bien evidencia cómo las desigualdades históricas del desarrollo económico en África se traducen en rezagos energéticos persistentes. En los demás clusters no existe un patrón regional fijo: países de Europa, América, Asia y Oceanía aparecen mezclados, lo que demuestra que los patrones energéticos responden más a niveles de desarrollo, estructuras económicas y trayectorias tecnológicas, que a la localización geográfica.

El segundo cluster agrupa economías en transición, con mejoras parciales en acceso y consumo, pero con matrices energéticas aún poco diversificadas. Representa países que avanzan hacia el desarrollo, pero que enfrentan barreras tecnológicas y dificultades para ampliar su infraestructura. El tercer cluster, más reducido y conformado por países con patrones atípicos, refleja estructuras energéticas poco comunes ya sea por características productivas específicas, por dependencia extrema de una fuente energética o por condiciones geográficas singulares lo que demuestra que no todas las naciones siguen los patrones dominantes. Por último, el cuarto cluster reúne a los países de mayor desarrollo energético, con altos niveles de consumo y una matriz diversificada que combina eficiencia, capacidad industrial y una transición más avanzada hacia fuentes limpias.

En conjunto, los hallazgos muestran que las desigualdades energéticas entre países en el año 2000 se manifiestan simultáneamente en el acceso, el consumo, la intensidad energética, la diversificación y la capacidad tecnológica, y que estas brechas están determinadas por factores estructurales profundamente vinculados al desarrollo económico, la disponibilidad de recursos, la inversión en infraestructura, la estabilidad institucional y las trayectorias históricas de cada país. La energía funciona así como un espejo del desarrollo, al reflejar inequidades históricas, condicionar oportunidades de crecimiento y definir la vulnerabilidad de las naciones frente a los retos ambientales y tecnológicos. El análisis no supervisado permitió identificar patrones claros y consistentes entre los países, respondiendo plenamente a la pregunta planteada; las desigualdades energéticas del año 2000 no se organizan por continentes, sino por patrones estructurales asociados al nivel de desarrollo, las capacidades tecnológicas y la intensidad productiva, sin embargo, también se identificaron casos en los que algunos países fueron agrupados junto a otros con perfiles energéticos claramente opuestos, lo que refleja las limitaciones propias de los métodos de clusterización y sugiere que ciertos patrones pueden superponerse, no ser plenamente captados por las dimensiones reducidas del ACP o incluso deberse a particularidades del año analizado y a dinámicas contextuales específicas.

En definitiva, las dimensiones obtenidas mediante estas técnicas de análisis multivariado explican con contundencia cómo los países se diferencian en sus capacidades energéticas, demostrando que la desigualdad energética es un fenómeno multidimensional y estrechamente ligado al desarrollo, y confirmando que el análisis no solo identifica los patrones entre países, sino que también esclarece los factores estructurales que los originan, cumpliendo plenamente con el propósito del estudio.

Este tipo de análisis no supervisado tiene múltiples aplicaciones en contextos sociales, políticos y económicos, especialmente cuando se estudian desigualdades energéticas entre países. Desde una perspectiva económica, permite identificar grupos de países con perfiles de consumo, eficiencia y capacidad de generación similares, facilitando el diseño de estrategias diferenciadas de inversión, modernización de infraestructura o diversificación de la matriz energética. En el ámbito social, estos métodos ayudan a reconocer territorios con condiciones críticas de acceso a la energía, lo que permite orientar programas de electrificación rural, subsidios focalizados y políticas que busquen reducir brechas en bienestar y calidad de vida asociadas al suministro energético. En términos políticos, la identificación de clusters energéticos ofrece información clave para priorizar alianzas internacionales, definir agendas de cooperación técnica, establecer compromisos realistas en materia de transición energética y diseñar marcos regulatorios acordes a la capacidad y necesidades específicas de cada grupo de países. En conjunto, el ACP y la clusterización constituyen herramientas poderosas para comprender la estructura global del sistema energético y respaldar la toma de decisiones basada en evidencia en todos los niveles de política pública.