Resumen

Los datos disponibles en la Agencia Internacional de Energía (IEA por sus siglas en inglés) son usados para realizar una segmentación a través del algoritmo de \(k\)-medias tras realizar un análisis de componentes principales. Esto con el objetivo de encontrar patrones, semjanzas o relaciones entre países y sus características y entender cómo se configuran las diferentes formas de generación energética según sus porcentajes de generación, así como un análisis del impacto ambiental que tiene cada tipo de generación de energía.

Introducción

En Colombia la generación energética está conformada principalmente por hidroeléctricas (62%) seguida por gas (23%), carbón (9%) y un restante residual de (6%) entre petróleo y biocombustibles (Ref IEA). La IEA también presenta información referente a 141 países alrededor del mundo respecto a la forma como generan la energía al interior de sus territorios. La IEA da cuenta de 12 formas de generación de energía:

Esta información sirve como insumo para realizar un análisis no supervisado (análisis de componentes principales) sobre los porcentajes de participación para cada forma de generación. Sobre los porcentajes de generación se realizó un análisis de componentes principales (ACP).

Reducción de Dimensionalidad: ACP

A continuación se muestra el procedimiento mediante el cual se llevó a cabo el ACP, junto con los resultados relevantes para análisis y que servirán de base para realizar la segmentación:

La estructura de correlación de los porcentajes de generación de energía puede ser apreciada en el siguiente correlograma:

Los tipos de energía que presentan mayores niveles de correlación son eólica con bagazo y con biocombustibles, bagazo con biocombustibles y mareas con energía nuclear. Correlaciones negativas pueden ser observadas entre la generación energética vía gas y la generación a través de hidroeléctricas; esta última a su vez presenta correlaciones negativas importantes con petróleo y carbón. Gas y petróleo también presentan correlaciones negativas.

Ante este panorama de correlaciones entre diferentes tipos de generación energética realizamos la ejecución del ACP para estas variables encontrando los siguientes resultados:

El ACP arrojó que los 3 primeros ejes acumulan el 91% de la varianza total explicada. Para el análisis de conglomerados se tendrán en cuenta estas 3 variables sintéticas.

\(K\)-Medias

Se observó el cambio en el WCSS para poder tomar una decisión frente a la cantidad de grupos generados iterando desde 1 hasta 10 grupos, el resultado fue:

El cambio en la reducción de WCSS se observa importante al pasar de 4 a 5 grupos. Por esta razón se toma la decisión de armar 4 grupos para el análisis.

Las proporciones de los grupos de países formados son los siguientes:

Llevando esta agrupación a un gráfico mundial de países, las agrupaciones resultantes son las siguientes: