1. Introducción y pregunta de investigación

El departamento del Cauca se erige como un territorio de gran riqueza en recursos naturales y una significativa diversidad étnica y cultural. Sin embargo, su geografía accidentada, marcada por las Cordilleras Central y Occidental, ha generado una fragmentación económica y cultural en su población. A pesar de su extensión, su contribución al Producto Interno Bruto (PIB) nacional es modesta, representando solo el 1.8% del total del país. Además, en 2023, el departamento experimentó una contracción del 0.5% en su PIB, un fenómeno particularmente asociado al problema del conflicto armado y la ocupación de zonas por grupos armados ilegales tras el Acuerdo de Paz.

En este complejo contexto, se plantea la siguiente pregunta de investigación para el análisis:

¿CÓMO PROPONER AL GOBIERNO DEPARTAMENTAL UNA ORGANIZACIÓN DE LA INVERSIÓN QUE TENGA EN CUENTA LAS DIFERENCIAS QUE EXISTEN EN LOS TERRITORIOS Y POBLACIONES DEL CAUCA?

Para tales efectos se considera pertinente el siguiente objetivo del análisis:

EXPLICAR A TRAVÉS DE UNA VISUALIZACIÓN DE DATOS LAS DIFERENCIAS EN LAS POBLACIONES Y TERRITORIOS DEL DEPARTAMENTO CAUCA, PARA QUE LA GOBERNACIÓN TENGA MEJORES ELEMENTOS DE ANÁLISIS EN LA FOCALIZACIÓN DEL GASTO ESTATAL

Para abordar esta pregunta, se aplicó la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining). Para las etapas de comprensión del problema y los datos, fueron aplicados procedimiento de visualización de datos con diagramas de caja y análisis espacial con datos coropléticos. Para la preparación de los datos, se efectuó una reducción de dimensionalidad a partir de la técnica de Análisis de Componentes Principales. En la etapa de modelamiento y evaluación, fueron desplegados dos algoritmos de aglomeración, K- Medias y el Jerárquico (ver siguiente imagen)

Los datos fueron recolectados de fuentes oficiales e institucionales, asegurando la fiabilidad del análisis. Se incluyó información del Censo Nacional de Población y Vivienda del DANE (2018), el Tercer Censo Nacional Agropecuario del DANE (2013), el Conteo de Unidades Económicas del DANE (2021), los Ingresos Fiscales Municipales de la Dirección Nacional de Planeación (2023), y datos climáticos del IDEAM (1974-2023). Es importante destacar que estos datos cubren los 42 municipios que conforman el departamento del Cauca (ver siguiente imagen).

2. Estadísticas descriptivas

2.1. Análisis de las variables demográficas por municipio

Población del Cauca:

  • Los nodos de Popayán y Santander de Quilichao también concentran una gran parte de la población.
  • La población en edad productiva (15-64 años) se encuentra bien distribuida en los distintos municipios.
  • La población afrodescendiente se concentra fuertemente en los municipios del Pacífico, el norte y el Valle del Río Patía.
  • La población indígena se localiza principalmente en la región del Centro-Oriente Caucano y el Norte.
  • La población no étnica o blanco-mestiza (campesinado) se concentra en la zona centro y sur del departamento.

2.2. Análisis de las variables económicas por municipio

Economía del Cauca:

  • Popayán y Santander de Quilichao se destacan como polos importantes en el desarrollo industrial y económico del Cauca.
  • Municipios del Pacífico y la Bota Caucana muestran un predominio de bosque (alta montaña y húmedo tropical) y una alta concentración de unidades agropecuarias, funcionando como despensas alimenticias del departamento.
  • Se identificaron usos no agropecuarios, como la minería, con mayor preeminencia en el sur del Cauca.

2.3. Análisis de las variables territoriales por municipio

Territorio y ambiente del Cauca:

  • El Pacífico y la Bota Caucana son las zonas donde hay un predominio del bosque, tanto de alta montaña como húmedo tropical.
  • El municipio de El Tambo, el más extenso, junto con la región del macizo y los municipios de Páez y Santa Rosa tienen una importante concentración de unidades agropecuarias, convirtiéndolos en despensas alimenticias del departamento.
  • Los usos no agropecuarios, por ejemplo, como la minería, tienen mayor preminencia en la región de la bota caucana, siendo el municipio de Piamonte uno de los que más concentra este tipo de explotaciones.
  • Los usos de otras áreas: Están referidos a zonas de protección ambiental y sobre todo de reserva hídrica para el departamento,
  • Como las zonas de páramos y lagos que están en la zona del macizo, Páez y el Pacífico.

2.4. Análisis de las variables institucionales por municipio

Finanzas Institucionales:

  • Popayán y Santander de Quilichao son los municipios con mayor capacidad económica y mayores ingresos tributarios y no tributarios.
  • El resto de los municipios dependen de las transferencias de la nación por conceptos como educación, salud y saneamiento.
  • Las regalías, son un proxy de la explotación de recursos naturales, ya que es el valor que las empresas pagan por extraer dichas reservas. Estas son significativas en municipios del norte, el Pacífico y algunos del macizo colombiano, principalmente por explotación aurífera.

2.5. Análisis de correlaciones

Un aspecto crucial de nuestro análisis exploratorio fue entender cómo se asocian las variables socioeconómicas, institucionales y territoriales. Para ello, se realizó un análisis de correlación tanto incluyendo a Popayán como excluyéndolo, debido a su particular influencia.

Con Popayán:

  • La presencia de Popayán incrementa las asociaciones positivas entre las unidades económicas (especialmente industriales, comerciales y de servicios).
  • Popayán actúa como un nodo de movilidad y conectividad departamental, activando asociaciones entre otros tipos de actividades económicas y el sector transporte.
  • La edad productiva muestra una dinámica positiva con las unidades económicas del conjunto de datos.
  • Los ingresos tributarios y no tributarios muestran una fuerte correlación con las unidades industriales, comerciales, de servicios y de transporte, así como con la población en edad productiva.

Sin Popayán:

  • La población en edad productiva está inversamente relacionada con las áreas boscosas y la precipitación, indicando la naturaleza más agropecuaria y rural de estas zonas.
  • A mayor recaudo tributario, mayor es la presencia de unidades económicas (industriales, comerciales y de servicios).
  • Se observa una interesante relación entre la temperatura y la población afrodescendiente (mayor temperatura, mayor población afrodescendiente) y una relación inversa con la población indígena (menor temperatura, mayor población indígena).
  • Los municipios con mayor área de bosques naturales también reciben mayores recursos por transferencias de la nación y están positivamente asociados con áreas de otros usos, como cuerpos de agua o ecosistemas protegidos.

3. Análisis

3.1. Análisis de componentes principales

3.1.1. Componente 1: Municipios desde la perspectiva económica y rural.

Este componente se caracteriza por variables como unidades de sectores (comercios, industrias, servicios) e ingresos tributarios y no tributarios (coeficientes negativos). En contraste (coeficientes positivos), se encuentran variables como alta proporción de bosques, transferencias nacionales y precipitación.

  • Características ambientales/geográficas específicas: Mayor temperatura promedio y mayor área de bosques.
  • Economías fuertes: Popayán, Santander de Quilichao, Puerto Tejada, Caloto, Guachené
  • Extensa ruralidad: Argelia, Balboa, Almaguer, La Sierra, Mercaderes

3.1.2. Componente 2: Municipios en perspectiva territorial y demográfica

El componente 2, en la parte positiva, se asocian municipios con alto porcentaje de población afrodescendiente, áreas de bosques, áreas agropecuarias y otros usos, así como transferencias nacionales y precipitaciones. En la parte negativa, encontramos municipios con una mayor proporción de población en edad productiva y porcentaje no étnico.

  • Menores niveles de lluvia y áreas de bosque.
  • Territorio étnico del Pacífico: López de Micay, Timbiquí y Guapi
  • Territorio andino: Suarez, Argelia, Balboa, San Sebastián, Almaguer
  • Mayor proporción de población NARP.
Título de la foto: Jóvenes en el río Guapi - Locación: Guapi - Créditos: Miguel Varona - Fotógrafo
Título de la foto: Jóvenes en el río Guapi - Locación: Guapi - Créditos: Miguel Varona - Fotógrafo

3.1.3. Componente 3: Municipios en contraste étnico

El componente 3, refleja el contraste entre población afrodescendiente e indígena. Los municipios positivos tienen un alto porcentaje de población afrodescendiente, altos ingresos tributarios y una temperatura promedio alta. Los negativos tienen una alta población indígena, una alta área agropecuaria y no agropecuaria, y una proporción similar de hombres y mujeres.

  • Están asociados a aquellas zonas dominadas por el pueblo indígena Nasa, con algunos municipios con más del 90% de comunidades indígenas como Toribio, e igualmente, municipios con un importante volumen poblacional nativo como Páez, Inzá, Caldono y Totoró.
  • Estos municipios tienen una tendencia en la parte positiva a ser más cálidas, con mayor precipitación y población joven en edad productiva.
  • En los municipios para el coeficiente negativo observamos que tienen amplias zonas en usos agropecuarios, siendo predominantemente rural.

3.1.4. Componente 4: Municipios de dominio indígena y con economías extractivas

Los positivos en este componente están relacionados con el porcentaje de población indígena e ingresos tributarios. Los negativos se asocian con altas regalías, un porcentaje no étnico y temperaturas promedio altas.

Cantidad de unidades económicas de industria y servicios: El hecho de que las regalías municipales sean un rubro importante, es una señal que en estos territorios se adelantan economías extractivas (mineras o petroleras). Destacan municipios de tradición aurífera como Suárez, Patía, López de Micay y Caloto.

3.1.5. Componente 5: Municipios con nodos de conectividad, logística y extracción de recursos naturales

En el componente 5 se destacan los municipios con unidades de sector transporte importantes y áreas no agropecuarias (parte negativa). En la parte positiva, se encuentran municipios con altos niveles de regalías o transferencias nacionales, y áreas agropecuarias.

Corresponde a los municipios donde el área no agropecuaria es importante, con un nodo de transportes y logística fuerte, en esta categoría hay valores altos para territorios como Puerto Tejada, Piendamó o Piamonte que son bisagras entre departamentos, como en el caso de Puerto Tejada con el Valle, o de Piamonte con el Putumayo. Piendamó es un nodo que interconecta el norte del departamento del Cauca con el resto de regiones, particularmente el centro oriente.

3.2. Análisis de Clustering

Para agrupar los municipios del Cauca en distintos grupos en virtud de sus diferencias y similitudes, conviene emplear las técnicas de clustering. Entre las dos más utilizadas, se encuentran el clustering jerárquico y K-Medias. Cada una tiene su “filosofía”, de la cual resultan contrastes entre la forma de agrupar. El agrupamiento jerárquico se basa en el principio que los objetos más cercanos guardan mayor relación entre sí, que aquellos distantes. Este algoritmo conecta los objetos en grupos basados en su distancia, que está definida por la máxima distancia requerida para conectar el objeto con el resto de componentes del grupo. Para facilitar la representación de los grupos, empleamos el dendograma, que muestra gráficamente los grupos que se forman diferenciándolos por distintas distancias que hay entre objetos. Los grupos ganan tamaño en la medida que se forman familias, que son el resultado de la unión de 2 o más puntos que están cerca los unos de los otros.

Por otra parte, la agrupación en clústeres mediante K-Medias es un proceso iterativo que minimiza la suma de las distancias entre los puntos de datos y sus centroides. El algoritmo de agrupación en clústeres mediante K-Medias categoriza los puntos de datos en clústeres mediante una medida matemática de distancia, generalmente euclidiana, desde el centro del clúster. El objetivo es minimizar la suma de las distancias entre los puntos de datos y sus clústeres asignados. Los puntos de datos más cercanos a un centroide se agrupan dentro de la misma categoría. Un valor k mayor, o el número de clústeres, indica clústeres más pequeños con mayor detalle, mientras que un valor k menor resulta en clústeres más grandes con menor detalle.

Comparativamente, se podrían entender las diferencias entre los dos métodos del siguiente modo: El algoritmo K-Medias es como una comunidad, en la que cada grupo de familias establece sus viviendas alrededor de la casa de un líder; dependiendo de la distancia de las viviendas con la casa del líder, se puede decir que esa familia pertenece a un clan o a otro. K-Medias busca que la distancia entre las viviendas de las familias del clan y su líder sean las menores. Por su parte, el clustering jerárquico inicia el agrupamiento con la cantidad total de las familias de la comunidad, y cuando percibe que sus viviendas están cerca, las comienza a identificar como un clan particular, las une, y repite este proceso sucesivamente, creando una especie de árbol, donde cada rama corresponde a las viviendas de familias que están cerca entre sí. El analista es el que le dice al algoritmo cuántas ramas permitir a la hora de agrupar.

Esta introducción es importante, debido a que utilizamos las dos técnicas para analizar la información socioeconómica, institucional y territorial de los municipios del Cauca. Empleando el número 7 para podar el árbol, en el caso del algoritmo de clustering jerárquico obtuvimos una representación muy interesante de la realidad social del departamento. Identificó dos municipios que son outliers: Popayán y Santander de Quilichao. Ambos tienen la particularidad de ser centros de la economía departamental. La capital, representada en color verde oliva, tiene un sector servicios que es voluminoso y contiene muchas unidades económicas dedicadas a esta actividad. El municipio de Santander de Quilichao, representado en púrpura, tiene a su favor la cantidad de unidades industriales, muchas de ellas por las exenciones fiscales que generó la Ley Páez en el departamento a mediados de la década de los noventas, que atrajo empresas manufactureras.

3.2. Aplicación de clúster jerárquico

El clustering jerárquico agrupa bastante bien a los municipios con alto volumen de población indígena. Esta zona es representada en color magenta, con Morales, Caldono, Inzá, Totoró, Toribio, Páez y Jámbalo como epicentros de la cultura del pueblo Nasa, así como Silvia lo es para el pueblo Misak (Guambiano) y Puracé para los indígenas Coconucos. Los municipios del litoral Pacífico quedan diferenciados por sus importantes extensiones de bosques naturales y población afrocolombiana, que se representan en color naranja. El siguiente diagrama de burbujas nos permite apreciar el volumen de las tres dimensiones de instituciones-población-economía en los distintos grupos generados por el algoritmo. A continuación se muestra la agrupación realizada distribuidos en el mapa del Cauca.

Título de la foto: Galería de Silvia - Locación: Silvia, Cauca - Créditos: Miguel Varona - Fotógrafo
Título de la foto: Galería de Silvia - Locación: Silvia, Cauca - Créditos: Miguel Varona - Fotógrafo

Los municipios del norte del Cauca, representados en verde oscuro, comparten las características de tener una amplia población afrodescendiente, importante cantidad de unidades económicas (industriales, comerciales y de transporte), así como instituciones de gobierno con un recaudo fiscal robusto. Finalmente, el departamento en su zona centro sur, representada en amarillo, y de Bota Caucana, representada en café, tienden a ser municipios cuya economía e instituciones son de menor tamaño.

Para tener un acercamiento a esta dinámica de los municipios de la zona sur y de la Bota Caucana, conviene dirigirse a los siguientes treemaps:

La economía de Popayán pesa bastante en cuanto a las unidades económicas, mientras que el grupo 1 y 2, que son la zona de la Bota Caucana, y la zona centro sur, respectivamente, tienen un peso inferior. Lo anterior es especialmente cierto en los municipios del clúster 1, como lo son La Vega, La Sierra, Rosas, Almaguer, Piamonte, San Sebastián, Sotará, Florencia, Sucre y Santa Rosa. El clúster 6, compuesto por Santander de Quilichao es una muestra del potencial económicas de este municipio, conocido como la capital del norte del Cauca. En términos de unidades económicas, los municipios del grupo 5, de la zona Pacífica, tienen una actividad incipiente, siendo marginales en el conteo de establecimientos productivos.

Título de la foto: Chirimía en Semana Santa en Popayán - Locación: Centro Histórico de Popayán - Créditos: Miguel Varona - Fotógrafo
Título de la foto: Chirimía en Semana Santa en Popayán - Locación: Centro Histórico de Popayán - Créditos: Miguel Varona - Fotógrafo

Los ingresos de los municipios y sus dinámicas económicas van muy de la mano. Los municipios cuyo recaudo fiscal es más alto, se debe al cobro de tasas a las empresas y las familias, por concepto de impuestos de industria y comercio, como también por valorización predial. No sorprende entonces que, nuevamente Popayán y Santander de Quilichao hagan aparición en el treemap como bastiones de los ingresos municipales. Sin embargo, resalta el hecho que los municipios de la zona norte también arrojan una perspectiva robusta en esta dimensión. Hay que recordar que los beneficiarios de la Ley Páez, que flexibilizó el régimen fiscal para las empresas, fueron también municipios como Caloto, Miranda, Villa Rica o Buenos Aires, donde economías asociadas a los sectores agroindustriales, particularmente el azucarero, echaron raíces al aprovechar las ventajas comparativas de los territorios, tales como zonas planas para cultivos mecanizados, y riego proveniente del poderoso río Cauca. De este modo, con vastas áreas con cultivos productivos, mejores recaudos fiscales. Adicionalmente, algunos títulos mineros en la zona, de metales preciosos como el oro, han sido tomados por empresas de pequeña escala, que extraen en las modalidades de aluvión (en ríos) y en socavón (en tiros bajo tierra).

El último treemap muestra la realidad étnico cultural del departamento. Vemos que el clúster 4, correspondiente al color magenta, se erige por la distinción de su población étnica, especialmente indígena. Sin lugar a dudas, tienen el mayor peso demográficos de los pueblos originarios. Algo parecido ocurre, pero con los miembros de las comunidades Negras, Afrodescendientes, Raizales y Palenqueras (NARP) en el clúster 5, de la zona Pacífica. El territorio sobre las márgenes de ríos y costas marítimas en estos municipios se caracteriza por ser tierras colectivas de comunidades negras, una figura establecida en la ley colombiana (Ley 70 de 1993) para proteger a las familias de origen africano, cuya identidad es diferenciada del resto del país y aportan ampliamente a la protección ambiental. Los municipios del norte del Cauca también una nada despreciable participación en dicho ámbito, por ser interétnicos y multiculturales. No es raro encontrar territorios de comunidades indígenas y de comunidades NARP en las zonas de alta montaña de Caloto, Miranda, Buenos Aires y Suárez, así como familias de ambos grupos étnicos en las zonas planas.

4.3. Aplicación de clúster con KMeans

El segundo método de análisis fue el clustering, utilizando el algoritmo de K-medias (K-means). Si bien los métodos del codo y el coeficiente de siluetas sugirieron dos clústeres óptimos, se considera que dos o tres clústeres no reflejaban adecuadamente la diversidad y la realidad del departamento. Por ello, optamos por visualizar los datos utilizando siete clústeres para una representación más fiel de la realidad.

  1. Municipios del Norte (Verde oliva): Se distinguen por ingresos excepcionalmente altos por regalías, incluyendo explotaciones auríferas.
  2. Popayán (Verde osucro): La capital departamental, con una economía basada en servicios y un perfil propio y particular.
  3. Núcleo Indígena (Magenta): Municipios con un altísimo porcentaje de población indígena en zonas de alta montaña.
  4. Litoral del Pacífico (Púrpura): Caracterizado por lluvias extremas, una vasta área boscosa, una población afrodescendiente voluminosa y una marcada dependencia de las transferencias de la nación.
  5. Polo Económico del Norte (Naranja): Representado por Santander de Quilichao, caracterizado por su dinamismo económico y alta población afrodescendiente.
  6. Cauca Rural y Agrícola (Café): Predominio de la población no étnica blanca-mestiza y una vocación predominantemente agrícola y pecuaria de zona caliente.
  7. Caura Rural y Agrícola (Amarillo): “Cauca agrícola de zona fría” (hacia la zona de la Bota Caucana de Santa Rosa).

5. Conclusiones

El ejercicio de análisis de datos demuestra que el Cauca es un departamento donde la diversidad de variables es susceptible de ser analizada eficazmente a través de técnicas de analítica de datos como el ACP y el clustering.

Las principales conclusiones y recomendaciones son: