El departamento del Cauca se erige como un territorio de gran riqueza en recursos naturales y una significativa diversidad étnica y cultural. Sin embargo, su geografía accidentada, marcada por las Cordilleras Central y Occidental, ha generado una fragmentación económica y cultural en su población. A pesar de su extensión, su contribución al Producto Interno Bruto (PIB) nacional es modesta, representando solo el 1.8% del total del país. Además, en 2023, el departamento experimentó una contracción del 0.5% en su PIB, un fenómeno particularmente asociado al problema del conflicto armado y la ocupación de zonas por grupos armados ilegales tras el Acuerdo de Paz.
En este complejo contexto, se plantea la siguiente pregunta de investigación para el análisis:
¿CÓMO PROPONER AL GOBIERNO DEPARTAMENTAL UNA ORGANIZACIÓN DE LA INVERSIÓN QUE TENGA EN CUENTA LAS DIFERENCIAS QUE EXISTEN EN LOS TERRITORIOS Y POBLACIONES DEL CAUCA?
Para tales efectos se considera pertinente el siguiente objetivo del análisis:
EXPLICAR A TRAVÉS DE UNA VISUALIZACIÓN DE DATOS LAS DIFERENCIAS EN LAS POBLACIONES Y TERRITORIOS DEL DEPARTAMENTO CAUCA, PARA QUE LA GOBERNACIÓN TENGA MEJORES ELEMENTOS DE ANÁLISIS EN LA FOCALIZACIÓN DEL GASTO ESTATAL
Para abordar esta pregunta, se aplicó la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining). Para las etapas de comprensión del problema y los datos, fueron aplicados procedimiento de visualización de datos con diagramas de caja y análisis espacial con datos coropléticos. Para la preparación de los datos, se efectuó una reducción de dimensionalidad a partir de la técnica de Análisis de Componentes Principales. En la etapa de modelamiento y evaluación, fueron desplegados dos algoritmos de aglomeración, K- Medias y el Jerárquico (ver siguiente imagen)
Los datos fueron recolectados de fuentes oficiales e institucionales, asegurando la fiabilidad del análisis. Se incluyó información del Censo Nacional de Población y Vivienda del DANE (2018), el Tercer Censo Nacional Agropecuario del DANE (2013), el Conteo de Unidades Económicas del DANE (2021), los Ingresos Fiscales Municipales de la Dirección Nacional de Planeación (2023), y datos climáticos del IDEAM (1974-2023). Es importante destacar que estos datos cubren los 42 municipios que conforman el departamento del Cauca (ver siguiente imagen).
Población del Cauca:
Economía del Cauca:
Territorio y ambiente del Cauca:
Finanzas Institucionales:
Un aspecto crucial de nuestro análisis exploratorio fue entender cómo se asocian las variables socioeconómicas, institucionales y territoriales. Para ello, se realizó un análisis de correlación tanto incluyendo a Popayán como excluyéndolo, debido a su particular influencia.
Este componente se caracteriza por variables como unidades de sectores (comercios, industrias, servicios) e ingresos tributarios y no tributarios (coeficientes negativos). En contraste (coeficientes positivos), se encuentran variables como alta proporción de bosques, transferencias nacionales y precipitación.
El componente 2, en la parte positiva, se asocian municipios con alto porcentaje de población afrodescendiente, áreas de bosques, áreas agropecuarias y otros usos, así como transferencias nacionales y precipitaciones. En la parte negativa, encontramos municipios con una mayor proporción de población en edad productiva y porcentaje no étnico.
El componente 3, refleja el contraste entre población afrodescendiente e indígena. Los municipios positivos tienen un alto porcentaje de población afrodescendiente, altos ingresos tributarios y una temperatura promedio alta. Los negativos tienen una alta población indígena, una alta área agropecuaria y no agropecuaria, y una proporción similar de hombres y mujeres.
Los positivos en este componente están relacionados con el porcentaje de población indígena e ingresos tributarios. Los negativos se asocian con altas regalías, un porcentaje no étnico y temperaturas promedio altas.
Cantidad de unidades económicas de industria y servicios: El hecho de que las regalías municipales sean un rubro importante, es una señal que en estos territorios se adelantan economías extractivas (mineras o petroleras). Destacan municipios de tradición aurífera como Suárez, Patía, López de Micay y Caloto.
En el componente 5 se destacan los municipios con unidades de sector transporte importantes y áreas no agropecuarias (parte negativa). En la parte positiva, se encuentran municipios con altos niveles de regalías o transferencias nacionales, y áreas agropecuarias.
Corresponde a los municipios donde el área no agropecuaria es importante, con un nodo de transportes y logística fuerte, en esta categoría hay valores altos para territorios como Puerto Tejada, Piendamó o Piamonte que son bisagras entre departamentos, como en el caso de Puerto Tejada con el Valle, o de Piamonte con el Putumayo. Piendamó es un nodo que interconecta el norte del departamento del Cauca con el resto de regiones, particularmente el centro oriente.
Para agrupar los municipios del Cauca en distintos grupos en virtud de sus diferencias y similitudes, conviene emplear las técnicas de clustering. Entre las dos más utilizadas, se encuentran el clustering jerárquico y K-Medias. Cada una tiene su “filosofía”, de la cual resultan contrastes entre la forma de agrupar. El agrupamiento jerárquico se basa en el principio que los objetos más cercanos guardan mayor relación entre sí, que aquellos distantes. Este algoritmo conecta los objetos en grupos basados en su distancia, que está definida por la máxima distancia requerida para conectar el objeto con el resto de componentes del grupo. Para facilitar la representación de los grupos, empleamos el dendograma, que muestra gráficamente los grupos que se forman diferenciándolos por distintas distancias que hay entre objetos. Los grupos ganan tamaño en la medida que se forman familias, que son el resultado de la unión de 2 o más puntos que están cerca los unos de los otros.
Por otra parte, la agrupación en clústeres mediante K-Medias es un proceso iterativo que minimiza la suma de las distancias entre los puntos de datos y sus centroides. El algoritmo de agrupación en clústeres mediante K-Medias categoriza los puntos de datos en clústeres mediante una medida matemática de distancia, generalmente euclidiana, desde el centro del clúster. El objetivo es minimizar la suma de las distancias entre los puntos de datos y sus clústeres asignados. Los puntos de datos más cercanos a un centroide se agrupan dentro de la misma categoría. Un valor k mayor, o el número de clústeres, indica clústeres más pequeños con mayor detalle, mientras que un valor k menor resulta en clústeres más grandes con menor detalle.
Comparativamente, se podrían entender las diferencias entre los dos métodos del siguiente modo: El algoritmo K-Medias es como una comunidad, en la que cada grupo de familias establece sus viviendas alrededor de la casa de un líder; dependiendo de la distancia de las viviendas con la casa del líder, se puede decir que esa familia pertenece a un clan o a otro. K-Medias busca que la distancia entre las viviendas de las familias del clan y su líder sean las menores. Por su parte, el clustering jerárquico inicia el agrupamiento con la cantidad total de las familias de la comunidad, y cuando percibe que sus viviendas están cerca, las comienza a identificar como un clan particular, las une, y repite este proceso sucesivamente, creando una especie de árbol, donde cada rama corresponde a las viviendas de familias que están cerca entre sí. El analista es el que le dice al algoritmo cuántas ramas permitir a la hora de agrupar.
Esta introducción es importante, debido a que utilizamos las dos técnicas para analizar la información socioeconómica, institucional y territorial de los municipios del Cauca. Empleando el número 7 para podar el árbol, en el caso del algoritmo de clustering jerárquico obtuvimos una representación muy interesante de la realidad social del departamento. Identificó dos municipios que son outliers: Popayán y Santander de Quilichao. Ambos tienen la particularidad de ser centros de la economía departamental. La capital, representada en color verde oliva, tiene un sector servicios que es voluminoso y contiene muchas unidades económicas dedicadas a esta actividad. El municipio de Santander de Quilichao, representado en púrpura, tiene a su favor la cantidad de unidades industriales, muchas de ellas por las exenciones fiscales que generó la Ley Páez en el departamento a mediados de la década de los noventas, que atrajo empresas manufactureras.
El clustering jerárquico agrupa bastante bien a los municipios con alto
volumen de población indígena. Esta zona es representada en color
magenta, con Morales, Caldono, Inzá, Totoró, Toribio, Páez y Jámbalo
como epicentros de la cultura del pueblo Nasa, así como Silvia lo es
para el pueblo Misak (Guambiano) y Puracé para los indígenas Coconucos.
Los municipios del litoral Pacífico quedan diferenciados por sus
importantes extensiones de bosques naturales y población afrocolombiana,
que se representan en color naranja. El siguiente diagrama de burbujas
nos permite apreciar el volumen de las tres dimensiones de
instituciones-población-economía en los distintos grupos generados por
el algoritmo. A continuación se muestra la agrupación realizada
distribuidos en el mapa del Cauca.
Los municipios del norte del Cauca, representados en verde oscuro,
comparten las características de tener una amplia población
afrodescendiente, importante cantidad de unidades económicas
(industriales, comerciales y de transporte), así como instituciones de
gobierno con un recaudo fiscal robusto. Finalmente, el departamento en
su zona centro sur, representada en amarillo, y de Bota Caucana,
representada en café, tienden a ser municipios cuya economía e
instituciones son de menor tamaño.
Para tener un acercamiento a esta dinámica de los municipios de la zona
sur y de la Bota Caucana, conviene dirigirse a los siguientes
treemaps:
La economía de Popayán pesa bastante en cuanto a las unidades
económicas, mientras que el grupo 1 y 2, que son la zona de la Bota
Caucana, y la zona centro sur, respectivamente, tienen un peso inferior.
Lo anterior es especialmente cierto en los municipios del clúster 1,
como lo son La Vega, La Sierra, Rosas, Almaguer, Piamonte, San
Sebastián, Sotará, Florencia, Sucre y Santa Rosa. El clúster 6,
compuesto por Santander de Quilichao es una muestra del potencial
económicas de este municipio, conocido como la capital del norte del
Cauca. En términos de unidades económicas, los municipios del grupo 5,
de la zona Pacífica, tienen una actividad incipiente, siendo marginales
en el conteo de establecimientos productivos.
Los ingresos de los municipios y sus dinámicas económicas van muy de la
mano. Los municipios cuyo recaudo fiscal es más alto, se debe al cobro
de tasas a las empresas y las familias, por concepto de impuestos de
industria y comercio, como también por valorización predial. No
sorprende entonces que, nuevamente Popayán y Santander de Quilichao
hagan aparición en el treemap como bastiones de los ingresos
municipales. Sin embargo, resalta el hecho que los municipios de la zona
norte también arrojan una perspectiva robusta en esta dimensión. Hay que
recordar que los beneficiarios de la Ley Páez, que flexibilizó el
régimen fiscal para las empresas, fueron también municipios como Caloto,
Miranda, Villa Rica o Buenos Aires, donde economías asociadas a los
sectores agroindustriales, particularmente el azucarero, echaron raíces
al aprovechar las ventajas comparativas de los territorios, tales como
zonas planas para cultivos mecanizados, y riego proveniente del poderoso
río Cauca. De este modo, con vastas áreas con cultivos productivos,
mejores recaudos fiscales. Adicionalmente, algunos títulos mineros en la
zona, de metales preciosos como el oro, han sido tomados por empresas de
pequeña escala, que extraen en las modalidades de aluvión (en ríos) y en
socavón (en tiros bajo tierra).
El último treemap muestra la realidad étnico cultural del departamento.
Vemos que el clúster 4, correspondiente al color magenta, se erige por
la distinción de su población étnica, especialmente indígena. Sin lugar
a dudas, tienen el mayor peso demográficos de los pueblos originarios.
Algo parecido ocurre, pero con los miembros de las comunidades Negras,
Afrodescendientes, Raizales y Palenqueras (NARP) en el clúster 5, de la
zona Pacífica. El territorio sobre las márgenes de ríos y costas
marítimas en estos municipios se caracteriza por ser tierras colectivas
de comunidades negras, una figura establecida en la ley colombiana (Ley
70 de 1993) para proteger a las familias de origen africano, cuya
identidad es diferenciada del resto del país y aportan ampliamente a la
protección ambiental. Los municipios del norte del Cauca también una
nada despreciable participación en dicho ámbito, por ser interétnicos y
multiculturales. No es raro encontrar territorios de comunidades
indígenas y de comunidades NARP en las zonas de alta montaña de Caloto,
Miranda, Buenos Aires y Suárez, así como familias de ambos grupos
étnicos en las zonas planas.
El segundo método de análisis fue el clustering, utilizando el
algoritmo de K-medias (K-means). Si bien los métodos del codo y el
coeficiente de siluetas sugirieron dos clústeres óptimos, se considera
que dos o tres clústeres no reflejaban adecuadamente la diversidad y la
realidad del departamento. Por ello, optamos por visualizar los datos
utilizando siete clústeres para una representación más fiel de la
realidad.
Nuestro ejercicio de análisis de datos demuestra que el Cauca es un departamento donde la diversidad de variables es susceptible de ser analizada eficazmente a través de técnicas de analítica de datos como el ACP y el clustering.
Las principales conclusiones y recomendaciones son: