Introducción

El portal SER Pacifico es una solución web planteada por la Universidad Autónoma de Occidente (UAO), la Facultad de Comunicación y Ciencias Sociales y el Grupo de Investigación Economía y Desarrollo (GIED); el nombre de esta iniciativa es: ‘Servicios Estadísticos Regionales del Pacífico’, abreviado en: SER Pacífico. Su propósito es fomentar el desarrollo económico local y la competitividad territorial de la región Pacifico de Colombia.

El portal clasifica la información territorial obtenida en cuatro dimensiones de desarrollo:

  • Económica
  • Socio-cultural
  • Ambiental
  • Institucional

Por la consideración de que estas cuatro dimensiones componen el sistema dinámico y complejo de la sostenibilidad con la finalidad de mejorar la planificación, ejecución y evaluación de estrategias municipales y fortalecer la identidad de la Región Pacífico de Colombia.

El estudio realizado a continuación tiene como objetivo el explorar, analizar y descubrir patrones o relaciones ocultas de información proveniente de una base de datos creada a partir de la información territorial de la plataforma SER Pacifico tomada de diferentes variables, centradas en el año 2015 y el departamento del Valle del Cauca. Las variables a analizar serán presentadas posteriormente, y se seleccionaron con el objetivo de tener un equilibrio en cuestión a las dimensiones de desarrollo a la que pertenece cada una.

Es fundamental destacar que el realizar una exploración sobre las relaciones ocultas entre este tipo de indicadores de desarrollo, tiene un gran impacto en un mejor análisis sobre los aspectos generales en los cuales se destaca cada municipio, y que tipo de herramientas pueden ser utilizadas para mejorar su comportamiento en los indicadores que no se están cumpliendo de forma efectiva de cada municipio.

Metodología

Con el objetivo de obtener información lo suficientemente sólida para hallar relaciones ocultas entre diferentes tipos de variables presentes en el sector del Valle del Cauca, las cuales influyen de forma directa en su sistema dinámico y complejo de sostenibilidad, se planteó el presente estudio de aprendizaje no supervisado utilizando datos obtenidos de la plataforma SER Pacifico, de la cual se seleccionaron 20 indicadores pertenecientes a las dimensiones de desarrollo de cada municipio los cuales serán expuestos de forma explícita posteriormente.

Con la selección de estas variables se creó una base de datos para realizar los respectivos procedimientos del estudio. Se tomó en cuenta la variabilidad y presencia de indicadores de todas las 4 dimensiones presentes en la plataforma. Las relaciones ocultas entre estas variables, son una herramienta clave para mejorar diferentes aspectos de los indicadores pertenecientes a las dimensiones de desarrollo de cada municipio.

Al llevar a cabo este modelo, inicialmente se hizo una correspondiente preparación de datos realizando una limpieza (Manejar los valores faltantes, eliminar duplicados y corregir errores en los datos). Posteriormente se realizó una selección del número de factores por medio del análisis de componente principales (ACP), esto con el objetivo de reducir la dimensionalidad y captar la mayor parte de la variación con unos pocos componentes principales; se seleccionaron 5 factores los cuales explican el 82% de la variabilidad de los datos. Luego de esta selección se utilizó la técnica de clusterización de ward, la cual minimiza la varianza dentro de cada cluster; se escogieron 5 clusters debido a la similitud hallada entre los municipios de la base de datos.

Teniendo esto, la base de datos obtenida estará más compacta debido a la reducción de dimensionalidad que se le realizó, por ende facilita el análisis de las variables presentes aún en la base de datos. Después de realizar este estudio se llevó a cabo un análisis de los resultados obtenidos.

Resultados descriptivos

Variables Seleccionadas

En este caso se escogieron 20 variables las cuales se consideraron en este modelo como apropiadas; se puede observar el comportamiento de estas mismas por medio de gráficas donde se podrá notar sus análisis estadísticos y se realizó una explicación general de cada una de ellas.

PRECIP

Esta variable hace referencia a la cantidad total de lluvia registrada durante el año 2015 en la región del Valle del Cauca. Esta medida se expresa en centímetros cúbicos y proporciona un valor total que refleja la suma de todas las precipitaciones registradas a lo largo de ese año. El rango de esta variable varía desde 468 mm perteneciente a Yumbo hasta 4987.821 mm perteneciente a Buenaventura.

VAL_AG_PERCAP

Esta variable mide el valor agregado per cápita en el Valle del Cauca durante el año 2015, expresado en pesos colombianos (COP). Representa el valor total de los bienes y servicios producidos dividido por la población total, proporcionando una medida per cápita. El valor mínimo registrado es 8,054,722.313 COP correspondiente a Florida y el valor máximo es 60,455,227.06 COP correspondiente a Yumbo.

TPTE_TERR

Esta variable se refiere al valor de la producción de transporte por vía terrestre en el departamento del Valle del Cauca en el año 2015. Representa el valor total de los bienes y servicios relacionados con el transporte terrestre, incluyendo el transporte de pasajeros y mercancías por carretera, ferrocarril y otros medios. Esta variable oscila entre municipios de Ulloa con el valor menor de 2.37 hasta 1243.56 miles de millones de pesos perteneciente a la capital Cali.

IND_MANUF

Esta variable se refiere al valor de la producción de la industria manufacturera en el departamento del Valle del Cauca durante el año 2015. Representa el valor total de los bienes producidos por la industria manufacturera en la región, abarcando una amplia gama de actividades productivas, como la producción de alimentos, textiles, productos químicos, maquinaria, entre otros. Se mide en miles de millones de pesos, con un valor mínimo registrado de 1.09 para el municipio de Ulloa y un valor máximo de 4.028 miles de millones de pesos para Yumbo.

INMOB

Esta variable hace referencia al valor de la producción de actividades inmobiliarias y alquiler de vivienda en el departamento del Valle del Cauca durante el año 2015. Representa el valor total de los bienes y servicios relacionados con la actividad inmobiliaria y el alquiler de viviendas en la región. Se mide en miles de millones de pesos, con un valor mínimo de 1.19 correspondiente a La Victoria y un valor máximo de 5706.18 miles de millones de pesos para Cali.

HTL_RSTRNT

Esta variable se refiere al valor de la producción de hoteles, restaurantes, bares y similares en el departamento del Valle del Cauca durante el año 2015. Representa el valor total de los bienes y servicios generados por estas actividades económicas, incluyendo la hospedería, la restauración y el entretenimiento. Se mide en miles de millones de pesos. El valor oscila entre 1.33 miles de millones perteneciente al municipio de Argelia (Valle) y 1149.88 miles de millones de pesos correspondiente a Cali.

AGRIC

Esta variable se refiere al valor de la producción del cultivo de otros productos agrícolas en el departamento del Valle del Cauca durante el año 2015. Representa el valor total de los bienes producidos por actividades agrícolas que no se incluyen en categorías específicas como cultivos tradicionales (por ejemplo, café, caña de azúcar). Se mide en miles de millones de pesos, oscilando entre 1.06 para Candelaria y 128.56 miles de millones de pesos para Caicedonia.

PEC_CAZ

Esta variable se refiere al valor de la producción de la producción pecuaria y caza, incluyendo las actividades veterinarias, en el departamento del Valle del Cauca durante el año 2015. Representa el valor total de los bienes y servicios generados por estas actividades económicas, que incluyen la cría de animales, la caza y las actividades veterinarias relacionadas. Se mide en miles de millones de pesos. El valor oscila entre 0.4 miles de millones para Buenaventura y 223.52 miles de millones de pesos para Candelaria.

DIST_ELECT

Esta variable se refiere al valor de la producción de generación, captación y distribución de energía eléctrica en el departamento del Valle del Cauca. Representa el valor total de los bienes y servicios generados por estas actividades económicas, que incluyen la producción de energía eléctrica, su captación (por ejemplo, mediante paneles solares o plantas hidroeléctricas) y su distribución a los usuarios finales. Se mide en miles de millones de pesos. El valor de esta variable el mínimo es de 0.62 miles de millones para Restrepo y el máximo 295.13 miles de millones de pesos perteneciente a Buenaventura.

SEG_SOC

Esta variable corresponde al valor de la producción relacionada con la administración pública, defensa y seguridad social de afiliación obligatoria en el departamento del Valle del Cauca. Representa el valor total de los bienes y servicios generados por estas actividades, que incluyen la gestión gubernamental, la defensa nacional y la prestación de seguridad social obligatoria. Se mide en miles de millones de pesos. El valor de esta variable oscila entre 2.74 miles de millones para Ulloa y 2043.84 miles de millones de pesos para la capital del Valle del Cauca.

COB_ED_MED

Esta variable representa la cobertura de educación media en el departamento del Valle del Cauca. Indica el porcentaje de la población en edad correspondiente a la educación media que está matriculada en instituciones educativas, ya sea públicas o privadas. Esta medida es crucial para evaluar el acceso y la participación en la educación secundaria en la región. El rango en el que se encuentra esta variable oscila entre el 45.16% correspondiente al Cairo y el 137.33% para Ginebra.

COB_ED_SUP

Esta variable indica la cobertura de educación superior en el departamento del Valle del Cauca. Representa el porcentaje de la población en edad correspondiente a la educación superior que está matriculada en instituciones de educación superior, ya sean universidades, institutos técnicos o tecnológicos, públicos o privados. Esta medida es esencial para evaluar el acceso y la participación en la educación terciaria en la región. El rango de esta variable abarca desde el 0% para 4 municipios (la Cumbre, el Aguila, Ulloa, el Cairo) hasta el 0.35% para Guadalajara de Buga.

COB_ACUED

Esta variable se refiere a la cobertura de acueducto total en el departamento del Valle del Cauca. Indica el porcentaje de la población que tiene acceso a servicios de abastecimiento de agua potable a través de sistemas de acueducto, ya sea mediante conexiones domiciliarias, redes públicas o sistemas comunitarios. Esta medida es fundamental para evaluar el acceso a un recurso vital como el agua potable en la región. El rango en el que se encuentra esta variable oscila entre el 8.47% para Buenaventura y el 99.84% correspondiente a Florida.

REG_CONTRIB

Esta variable representa la tasa de afiliación según el régimen contributivo en el departamento del Valle del Cauca. Indica el porcentaje de la población que está afiliada al sistema de seguridad social en salud a través del régimen contributivo. Este régimen está diseñado para aquellas personas que tienen la capacidad de contribuir económicamente al sistema de salud, ya sea a través de su empleador o de manera independiente. El rango de esta variable abarca desde el 5.24% para el municipio de el Águila hasta el 65.46% para Guadalajara de Buga.

DENS_POB

Esta variable describe la densidad de población en el departamento del Valle del Cauca. Representa el número promedio de personas por unidad de área, generalmente expresado en habitantes por kilómetro cuadrado (hab/km²). La densidad de población proporciona información sobre la concentración de personas en una determinada área geográfica. El rango de densidad de población abarca desde 15.62 hab/km² para Versalles hasta 4293.15 hab/km² para la Capital de Valle del Cauca.

IDH

El Índice de Desarrollo Humano (IDH) es una medida compuesta que evalúa el nivel de desarrollo humano en el departamento del Valle del Cauca. Incorpora indicadores clave en tres dimensiones principales: salud, educación e ingreso. Se mide en una escala que va desde 0 hasta 1, donde valores más altos indican un mayor nivel de desarrollo humano. En este caso la variable oscila entre 0.585313507 como dato menor correspondiente a Buenaventura y 0.762893544. como dato mayor correspondiente a Yumbo.

POB

Esta variable representa la población total en cada municipio del departamento del Valle del Cauca durante el año 2015. Es una medida fundamental que indica el número total de habitantes en cada área municipal. Esta variable oscila entre 5,455 para Ulloa hasta 2,369,821 habitantes para Cali.

TASA_MORT

Esta variable representa la tasa de mortalidad en el departamento del Valle del Cauca durante el año 2015. Indica la cantidad de fallecimientos ocurridos en ese año por cada mil habitantes. La tasa de mortalidad en el periodo oscila entre 2.9 perteneciente al Cairo y 8.83 fallecimientos por cada mil habitantes para el municipio de Victoria.

TASA_NAT

Esta variable representa la tasa de natalidad en el departamento del Valle del Cauca durante el año 2015. Indica la cantidad de nacimientos ocurridos en ese año por cada mil habitantes. La tasa de natalidad en este periodo oscila aproximadamente entre 0.3688 para Yotoco y 18.6837 nacimientos por cada mil habitantes para Guadalajara de Buga.

EDF_ED_MED

Esta variable hace referencia al número total de establecimientos de educación secundaria y media en el departamento del Valle del Cauca. Representa la cantidad total de instituciones educativas dedicadas tanto a la enseñanza de educación secundaria como de educación media en la región. El rango de esta variable oscila desde 4 para el municipio de Argelia (Valle) hasta 962 establecimientos correspondiente a la capital del Valle del Cauca.

Análisis de resultados estadísticos

Data summary
Name BaseDatos1
Number of rows 39
Number of columns 21
_______________________
Column type frequency:
character 1
numeric 20
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
Municipio 0 1 4 19 0 39 0

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
PRECIP 0 1 995.11 719.12 468.00 703.95 877.79 1074.68 4987.82 ▇▁▁▁▁
VAL_AG_PERCAP 0 1 15866244.86 8661408.60 8054722.31 11933170.71 13603106.23 17746215.20 60455227.06 ▇▂▁▁▁
TPTE_TERR 0 1 63.76 199.25 2.37 5.86 16.51 32.16 1243.56 ▇▁▁▁▁
IND_MANUF 0 1 297.66 840.00 1.09 5.64 17.74 182.54 4028.00 ▇▁▁▁▁
INMOB 0 1 235.77 917.82 1.19 8.17 20.82 45.57 5706.18 ▇▁▁▁▁
HTL_RSTRNT 0 1 65.03 184.91 1.33 6.52 16.86 39.61 1149.88 ▇▁▁▁▁
AGRIC 0 1 38.30 38.76 1.06 12.39 23.70 51.27 128.56 ▇▂▁▁▂
PEC_CAZ 0 1 25.26 38.99 0.40 6.20 12.69 26.45 223.52 ▇▁▁▁▁
DIST_ELECT 0 1 41.49 80.44 0.62 2.68 8.02 21.06 295.13 ▇▁▁▁▁
SEG_SOC 0 1 111.08 338.77 2.74 8.13 15.39 29.69 2043.84 ▇▁▁▁▁
COB_ED_MED 0 1 80.87 20.95 45.16 64.10 81.42 93.40 137.33 ▆▆▇▂▁
COB_ED_SUP 0 1 0.05 0.10 0.00 0.00 0.00 0.03 0.35 ▇▁▁▁▁
COB_ACUED 0 1 69.15 22.39 8.47 58.22 71.70 86.47 99.84 ▂▂▃▇▇
REG_CONTRIB 0 1 29.58 16.54 5.24 16.92 24.85 42.71 65.46 ▆▇▃▅▂
DENS_POB 0 1 235.08 676.95 15.62 48.51 84.49 168.82 4293.15 ▇▁▁▁▁
IDH 0 1 0.69 0.04 0.59 0.66 0.68 0.72 0.76 ▁▃▇▃▃
POB 0 1 116793.38 379429.89 5455.00 14102.50 21171.00 57796.50 2369821.00 ▇▁▁▁▁
TASA_MORT 0 1 5.65 1.24 2.90 4.96 5.43 6.58 8.83 ▁▇▅▅▂
TASA_NAT 0 1 4.32 5.00 0.37 1.15 2.17 5.14 18.68 ▇▁▁▁▁
EDF_ED_MED 0 1 58.31 157.93 4.00 11.50 15.00 35.50 962.00 ▇▁▁▁▁

Como se puede observar, de primera mano se obtiene una información en general de la base de datos con la cantidad de datos y de variables. Como segunda parte se contempla los análisis estadísticos de cada variable, donde se empieza mostrando el porcentaje que tienen en su totalidad las celdas de cada variable, se observa que todas las variables arrojan el 100%, lo que significa que las variables del modelo si tienen todos sus datos con valores.

Se analiza los promedios de cada variable, sus desviaciones estándar, los cuartiles y por último un pequeño histograma que ayuda a contemplar un poco en qué parte se acumula la cantidad de valores.

Resultados principales

Definición de los factores

Habiendo establecido la base de datos con los 39 municipios que se van a analizar y las 20 variables sobre las cuales van a ser estudiados, el primer paso es definir los 20 factores por componentes principales que van a agrupar esta información:

Por el tamaño de la gráfica, únicamente se observan los primeros 10 factores junto a su porcentaje de variabilidad explicada. Así pues, se observa que el primer factor alcanza a explicar más de un 40% de la varianza de los datos, el segundo factor explica más de un 15% y así sucesivamente. Sin embargo, como suele ocurrir con los métodos gráficos, no es suficiente para determinar los porcentajes exactos, por lo que es necesario determinar la siguiente información:

##          eigenvalue variance.percent cumulative.variance.percent
## Dim.1  8.958526e+00     4.479263e+01                    44.79263
## Dim.2  3.257140e+00     1.628570e+01                    61.07833
## Dim.3  1.890895e+00     9.454477e+00                    70.53281
## Dim.4  1.541747e+00     7.708735e+00                    78.24154
## Dim.5  1.102922e+00     5.514612e+00                    83.75616
## Dim.6  8.789184e-01     4.394592e+00                    88.15075
## Dim.7  7.756876e-01     3.878438e+00                    92.02919
## Dim.8  5.981385e-01     2.990692e+00                    95.01988
## Dim.9  4.226158e-01     2.113079e+00                    97.13296
## Dim.10 2.159837e-01     1.079919e+00                    98.21288
## Dim.11 1.436807e-01     7.184033e-01                    98.93128
## Dim.12 1.282728e-01     6.413640e-01                    99.57264
## Dim.13 3.411346e-02     1.705673e-01                    99.74321
## Dim.14 3.167678e-02     1.583839e-01                    99.90159
## Dim.15 1.114405e-02     5.572025e-02                    99.95731
## Dim.16 4.002036e-03     2.001018e-02                    99.97732
## Dim.17 2.506175e-03     1.253088e-02                    99.98986
## Dim.18 1.257441e-03     6.287205e-03                    99.99614
## Dim.19 7.168745e-04     3.584373e-03                    99.99973
## Dim.20 5.458864e-05     2.729432e-04                   100.00000

Los valores eigenvalue son un número que dan una idea de la magnitud de explicación que ese único factor está reteniendo, teniendo por norma general que un eigenvalue mayor a 1 indica que dicho factor explica más de lo que lo haría una de las variables originales (haciéndolo un buen candidato a seleccionar).

Por otra parte, la segunda columna muestra el porcentaje exacto de varianza explicada por cada factor, mientras que la tercera muestra el acumulado de dichos porcentajes (lo que se comprueba al observar que entre los 20 factores logran explicar el 100%). Guiándose únicamente por esta información, se observa que los primeros cinco factores son candidatos potenciales para ser quienes definan la clusterización, pero sin embargo, esta información no es suficiente.

Para tomar dicha decisión no sólo importa el porcentaje de varianza explicada por los factores seleccionados (que entre los cinco primeros alcanza un favorable 83.76%), sino que también es necesario poder interpretar el significado real de estos factores sobre los municipios. Para ello, primero se va a revisar la contribución de cada una de las variables en la construcción de los primeros cinco factores:

##                     Dim.1       Dim.2        Dim.3        Dim.4        Dim.5
## PRECIP         0.14963009 11.91673277  0.006831151 25.676625744 1.589799e-03
## VAL_AG_PERCAP  0.13965299  1.54096729 41.871939642  0.234114222 6.440801e+00
## TPTE_TERR     10.20595607  1.08872161  0.485266718  1.765843984 3.747409e-01
## IND_MANUF      6.38189386  0.36334991 15.829983976  1.614011441 1.907289e+00
## INMOB         10.15244734  1.02445875  0.167330421  3.004798706 2.710425e-03
## HTL_RSTRNT    10.54415830  0.53643793  0.629169874  1.130042880 5.291446e-02
## AGRIC          0.47292239  0.02282315  2.703954636  0.548824767 4.964756e+01
## PEC_CAZ        0.87802162  5.11927627  0.050845077  1.337233296 2.779678e+01
## DIST_ELECT     4.90215740  0.42961266 11.311930884 11.336001030 1.121533e-01
## SEG_SOC       10.36337478  1.77041919  0.233658044  0.115918351 7.319108e-02
## COB_ED_MED     0.05976002 13.21301062  0.121872456  1.496715089 7.164531e-01
## COB_ED_SUP     5.72366902  3.95938152  2.516349169 11.172768009 3.603018e+00
## COB_ACUED      0.36833969 12.75252422  1.694437750  6.968934300 3.354756e-05
## REG_CONTRIB    4.26995341 10.86322420  0.061113296  4.338094377 1.149416e+00
## DENS_POB       9.63449582  0.51325878  0.263535584  6.331451633 1.164048e-02
## IDH            1.19691152 19.86542766  4.510783421  0.001037033 6.705450e-02
## POB           10.21573186  1.32857711  0.543464345  1.674152574 1.086621e-02
## TASA_MORT      0.09055089 10.50080280 11.904506316  0.696874243 2.845975e+00
## TASA_NAT       4.09262210  1.06138943  4.730519658 20.413211512 5.174769e+00
## EDF_ED_MED    10.15775083  2.12960413  0.362507583  0.143346809 1.103889e-02

Así pues, se observa que las principales variables que definieron estos factores y sus respectivos porcentajes de contribución son:

Factor 1:

  • Valor de la producción asociada a Hoteles, restaurantes, bares y similares (10.54%).
  • Millones de pesos destinados a Administración pública, defensa, y seguridad social de afiliación obligatoria (10.36%).
  • Población por zona (10.22%).
  • Valor de la producción asociada al Transporte por vía terrestre (10.21%).
  • Establecimientos educativos de básica secundaria y media (10.16%).
  • Valor de la producción asociada a las Actividades inmobiliarias y al alquiler de vivienda (10.15%).

Factor 2:

  • Índice de Desarrollo Humano (19.87%).
  • Porcentaje de cobertura de la educación media (13.21%).
  • Porcentaje de cobertura del servicio de acueducto (12.75%).
  • Acumulado anual de precipitación (11.92%).
  • Tasa de afiliación al Régimen Contributivo de Salud (10.86%).
  • Tasa de mortalidad (10.50%).

También es posible visualizar estas contribuciones de manera gráfica:

El gráfico concuerda en que las variables mencionadas son las más significativas para ambos factores, además de mostrar que:

  • Para el caso del factor 1, las 6 variables van en la misma dirección. Esto significa que son tomadas en cuenta de forma que los valores en todas 6 sean considerablemente altos, o considerablemente bajos.
  • Para el factor 2, el acumulado anual de precipitación va en el sentido opuesto a las otras 5 variables que más influyen en él. Por ende, los municipios mejor representados por él serán aquellos que tengan un valor de precipitación elevado y valores bajos en las demás variables, o viceversa.
    Para ambos casos, aún es necesario definir si el sentido visto es positivo o negativo, lo cual se hará más adelante.

Factor 3:

  • Valor agregado per cápita (41.87%).
  • Valor de la producción asociada a la Industria manufacturera (15.83%).
  • Tasa de mortalidad (11.90%).
  • Valor de la producción asociada a la Generación, captación y distribución de la energía eléctrica (11.32%).

Factor 4:

  • Acumulado anual de precipitación (25.68%).
  • Tasa de natalidad (20.41%).
  • Valor de la producción asociada a la Generación, captación y distribución de la energía eléctrica (11.34%).
  • Porcentaje de cobertura de la educación superior (11.17%).

Al igual que con los factores 1 y 2, es posible visualizar estas contribuciones de manera gráfica:

Nuevamente, la información del gráfico concuerda con las variables significativas ya definidas para ambos factores, además de mostrar que:

  • En el caso del factor 3, la tasa de mortalidad va en dirección opuesta a las otras 3 variables significativamente influyentes.

  • Para el factor 4 se observa que todas sus variables significativas están definidas en el mismo sentido.

Factor 5:

  • Valor de la producción asociada al Cultivo de productos agrícolas (49.65%).
  • Valor de la producción asociada a la Producción pecuaria y caza, incluyendo actividades veterinarias (27.80%).

Para poder visualizar gráficamente este factor, se compara junto al factor 1 (ya que deben visualizarse dos factores a la vez):

El gráfico permite observar que ambas producciones se tomaron en sentido contrario (es decir, que los municipios mejor representados por este factor tendrán un valor en una de las dos considerablemente alto, mientras que en la otra será considerablemente bajo, respecto al resto de municipios).

Así pues, se observa que entre estos 5 factores se llegan a considerar como variables influyentes a 19 de las 20 variables originales, únicamente excluyendo la densidad poblacional. Sin embargo, dicha variable tiene una relevancia moderada en el factor 1.

Se destaca el hecho de que el factor 4 es el que más repite variables significativas con otros, pues comparte el acumulado anual de precipitación con el factor 2, y la producción asociada a la energía eléctrica con el factor 3. Aún así, continúa considerándose relevante por no ser mayoritariamente parecido a ningún otro factor, además de ser el antecesor de un factor con un significado claramente establecido como lo es el factor 5.

Así pues, teniendo en cuenta las principales variables que componen su estructura, se determinó escoger a los 5 factores para la construcción del modelo, y se interpretaron los siguientes significados para cada uno:

  • Factor 1: Infraestructura y actividad económica municipal

  • Factor 2: Desarrollo humano y calidad de vida

  • Factor 3: Productividad industrial y energética

  • Factor 4: Impacto climático, demográfico y educativo

  • Factor 5: Producción agrícola y pecuaria

Habiendo definido las identidades de los factores que se van a utilizar para el análisis, también es posible visualizar cuáles son los municipios que se encuentran mejor representados por cada uno de ellos, al visualizar la contribución que tienen respecto a cada factor:

##                            Dim.1       Dim.2        Dim.3        Dim.4
## ARGELIA (Valle)     4.042691e-01  0.70113204  0.289934118 5.837024e-02
## BOLIVAR (Valle)     5.727226e-01  0.18984160  0.332581547 1.987427e+00
## BUENAVENTURA        1.454645e+00 29.38402138  0.361310977 4.136544e+01
## BUGALAGRANDE        1.252079e-01  0.68991130  2.412211227 8.272562e-03
## CAICEDONIA          2.005305e-01  0.23516227  1.479766365 5.712696e-01
## CALI                7.616023e+01  4.18164568  1.341535167 1.086082e+01
## CALIMA              7.751658e-02  0.03827869  7.870255055 8.416304e-01
## CANDELARIA          8.694926e-02  2.83230022  0.392156234 1.492533e-01
## CARTAGO             2.992146e-01  1.55739912  0.607894058 1.221925e+00
## DAGUA               3.066630e-01  0.24534815  0.029900339 1.497420e-01
## EL AGUILA           8.625926e-01  7.08066695  0.103671561 2.013251e-01
## EL CAIRO            1.042424e+00  7.53489724  1.082147801 5.606679e-02
## EL CERRITO          7.945500e-02  0.53372030  0.074106980 5.094310e-01
## EL DOVIO            5.320062e-01  1.08154193  0.520438985 2.683837e-01
## FLORIDA             8.067790e-02  0.03296423  0.824823925 8.613893e-04
## GINEBRA             1.419734e-01  2.12067394  0.008421483 1.034547e-02
## GUACARI             1.848471e-01  0.24767224  0.085970766 5.766571e-02
## GUADALAJARA DE BUGA 1.841424e+00 12.03503850  0.952072521 1.236940e+01
## JAMUNDI             2.585367e-03  0.12586691  0.423460621 1.268766e-01
## LA CUMBRE           4.028931e-01  0.59163302  0.900818389 1.192412e+00
## LA UNION (Valle)    2.752616e-01  0.15995429  0.455947938 9.140001e-01
## LA VICTORIA         3.339101e-01  0.28062029  2.204823506 1.082075e+00
## OBANDO              5.809828e-01  1.53480333  0.092841400 5.215862e-01
## PALMIRA             3.982163e+00  6.52683093  0.040386778 6.623751e+00
## PRADERA             9.911777e-02  0.11869395  0.004375032 9.211669e-01
## RESTREPO            2.229770e-01  0.33758243  0.009266413 3.012632e-01
## RIOFRIO             4.166227e-01  0.62453231  0.100859853 8.634777e-01
## ROLDANILLO          3.009394e-03  4.70954905  2.432283227 5.982929e-01
## SAN PEDRO           4.259071e-01  0.68184242  0.005297529 6.967829e-01
## SEVILLA             2.602520e-01  0.35618384  1.721808346 3.444216e-02
## TORO                5.451836e-01  0.78692860  0.508612332 9.935272e-01
## TRUJILLO            6.314077e-01  0.19657481  0.004674048 1.697337e+00
## TULUA               1.130364e+00  3.91469408  3.832420565 4.990612e+00
## ULLOA               5.834896e-01  1.93434001  0.010453715 3.734571e-01
## VERSALLES           4.854571e-01  0.25252412  0.006647443 3.683198e-02
## VIJES               4.817305e-01  0.10768888  0.010112151 2.110983e-01
## YOTOCO              4.289794e-01  0.19059637  0.148802378 1.126629e+00
## YUMBO               1.689814e+00  2.98837174 65.333981798 1.049082e+00
## ZARZAL              4.404046e-04  0.29387028  0.418824866 2.393578e+00
##                            Dim.5
## ARGELIA (Valle)     2.706362e-02
## BOLIVAR (Valle)     2.626539e-01
## BUENAVENTURA        1.956677e-01
## BUGALAGRANDE        3.037524e-02
## CAICEDONIA          9.204853e+00
## CALI                2.919594e-02
## CALIMA              1.383692e-01
## CANDELARIA          3.279753e+01
## CARTAGO             3.919123e-01
## DAGUA               8.600937e-02
## EL AGUILA           2.164904e-01
## EL CAIRO            5.277723e+00
## EL CERRITO          1.175559e-01
## EL DOVIO            1.532529e-05
## FLORIDA             5.629586e-01
## GINEBRA             2.350465e+00
## GUACARI             2.512797e+00
## GUADALAJARA DE BUGA 7.133300e-01
## JAMUNDI             1.186875e+00
## LA CUMBRE           4.796713e-01
## LA UNION (Valle)    2.853239e-01
## LA VICTORIA         8.624484e-01
## OBANDO              5.389829e-01
## PALMIRA             4.261690e-01
## PRADERA             2.609857e+00
## RESTREPO            3.514570e+00
## RIOFRIO             9.354864e+00
## ROLDANILLO          3.136332e+00
## SAN PEDRO           5.406730e-01
## SEVILLA             3.409967e+00
## TORO                3.230186e-01
## TRUJILLO            5.384362e+00
## TULUA               5.520413e+00
## ULLOA               1.316193e-01
## VERSALLES           1.511102e-01
## VIJES               9.420559e-01
## YOTOCO              9.725170e-03
## YUMBO               3.640999e+00
## ZARZAL              7.189802e-02

Así pues, los municipios mejor representados por cada factor son:

  • Infraestructura y actividad económica municipal: Cali (76.16%)

  • Desarrollo humano y calidad de vida: Buenaventura (29.38%), Guadalajara de Buga (12.04%), El cairo (7.53%) y El Aguila (7.08%).

  • Productividad industrial y energética: Yumbo (65.44%) y Calima (7.87%).

  • Impacto climático, demográfico y educativo: Buenaventura (41.37%), Guadalajara de Buga (12.37%), Cali (10.86%) y Palmira (6.62%).

  • Producción agrícola y pecuaria: Candelaria (32.80%), Riofrío (9.35%) y Caicedonia (9.20%).

Es importante tener en cuenta que el hecho de que un municipio esté bien representado por un factor sólo señala que destaca de los demás en el significado del mismo, pero esto puede indicar que es mucho mejor o mucho peor que el resto en dicho contexto.
Una manera de identificar cuál de los dos escenarios está ocurriendo es observando la gráfica de contribución de los municipios para cada factor, ya que al comparar la dirección en el gráfico de estos municipios con sus valores en la base de datos se puede determinar si destacan positiva o negativamente:

  • Infraestructura y actividad económica municipal: Cali es el municipio con mayores valores en las 6 variables más representativas de este factor, por lo que su posición en la gráfica (izquierda) indica el sentido de aquellos municipios con mejor infraestructura y actividad económica municipal.

  • Desarrollo humano y calidad de vida: Buenaventura tiene el menor IDH y la menor cobertura de acueducto de todos los municipios, además de una cobertura de educación media y de afiliación al régimen contributivo considerablemente bajas. Por otra parte, tiene un acumulado de precipitación anual abundante y una tasa de mortalidad baja. El Cairo y El Aguila comparten estas características, mientras que Guadalajara de Buga es lo opuesto en ellas. Por ende, la posición de Buenaventura en la gráfica (abajo) indica el sentido de aquellos municipios con un nivel de desarrollo humano y calidad de vida inferiores a la media departamental.

  • Productividad industrial y energética: Yumbo tiene los mejores números de producción en la industria manufacturera y de valor agregado per cápita a nivel departamental, además de uno de los mayores en cuanto a producción de la industria de energía eléctrica. Por esto, el sentido en el que se encuentra Yumbo en la gráfica (izquierda) indica la dirección en la que se encuentran los municipios con mejor productividad industrial y energética del Valle del Cauca. Así, aunque en menor proporción, se encuentra también a Calima.

  • Impacto climático, demográfico y educativo: Siendo el municipio con mayor representación por este factor, Buenaventura tiene el mayor nivel de precipitación anual y de producción de energía eléctrica a nivel departamental, además de ser parte de los municipios con mayor tasa de natalidad y de cobertura de educación superior. Por ello, su sentido en el gráfico (abajo) indica la dirección de los municipios con una combinación multifacética de impactos climático, demográfico y educativo positivos a nivel del Valle.

De nuevo, para visualizar la representación de individuos en el quinto factor (Producción agrícola y pecuaria) es necesario graficarlo junto a otro:

  • Producción agrícola y pecuaria: Fijándose en la ubicación vertical de los municipios, Candelaria (arriba) indica la dirección de aquellos con una mayor producción pecuaria y menor producción agrícola; mientras que abajo se encuentran aquellos que no destacan tanto en el aspecto pecuario, pero sí lo hacen con los productos agrícolas, como Caicedonia y Riofrío.

Definición de los clústers

Una vez que se redujo la dimensionalidad de las 20 variables originales hasta definir 5 factores por componentes principales, el siguiente paso es reducir la de los 39 municipios del Valle del Cauca por medio de una agrupación en clústers, la cual se va a realizar teniendo en consideración los factores previamente definidos y escogidos.

Así pues, al especificarle al modelo que se desean seleccionar los cinco primero factores para la definición de los clústers, aparece el siguiente dendograma:

La lectura de este gráfico se realiza partiendo desde la parte superior hacia abajo. Cada división que se presenta en sus “ramas” indica cómo se definirá la creación de un nuevo clúster, en caso de pedirse. Por ejemplo, si se le solicitara al modelo que únicamente dividiera los municipios entre 2 clústers, uno de ellos sería Cali y el otro sería el resto de los municipios, ya que es la primera división que aparece arriba.

En este caso se optó por separarlos en 5 clústers, decisión que surge del contexto de los municipios que pertenecerían a cada uno. Esto se debe a que se observó que, en caso de escoger 3 clústers, se obtendrían dos grupos de municipios y uno con Cali como único individuo; pero un cuarto y un quinto clúster estarían formados individualmente por Buenaventura y por Yumbo, respectivamente. Estos últimos clústers se consideraron igual de importantes por el significado particular de estas ciudades respecto a las demás, ya que así como Cali es la ciudad capital; Buenaventura es el principal puerto (no solo a nivel de departamento, sino también nacional) y Yumbo es la zona con mayor concentración industrial del departamento.

Así pues, al especificarle al modelo que seleccione cinco clústers, muestra el siguiente dendograma:

Se observa que los clústers definidos son los mismos que ya se había mencionado anteriormente.

Así pues, el modelo le asigna a cada uno de los municipios de la base de datos un número correspondiente a su respectivo clúster, lo que permite analizarlos a partir de esta nueva agrupación y ya no de manera individual:

Clúster 1:

El primer clúster corresponde a aquel que agrupó a la mayoría de municipios (30), y se puede observar a primera vista que son aquellos que no destacaron positivamente en ningún factor.

Económicamente, sus municipios tienen un menor desempeño que la media departamental en los sectores: Inmobiliario, de transporte terrestre, turístico, pecuario, industrial y de energía eléctrica. Demográficamente, tienen una densidad poblacional, tasa de natalidad y, en general, una población considerablemente menores a las del resto del departamento. Socialmente, se observa que también tienen resultados menores que la media departamental en cuanto a la seguridad social, afiliación contributiva al servicio de salud, cobertura de la educación media y superior. y en su IDH.

Clúster 2:

El segundo clúster agrupa únicamente a Buenaventura. Climáticamente se observa que la zona se caracteriza por tener un nivel de precipitación acumulada considerablemente mayor a la media observada en el resto del departamento; económicamente se destaca positivamente por su generación y distribución de energía eléctrica; y socialmente resaltó por tener un índice de Desarrollo Humano y una cobertura de acueducto mucho menores a los del resto del departamento.

Clúster 3:

El tercer clúster agrupa a Cali, la capital del departamento. Por tener dicha posición preferencial, es evidente que resaltara positivamente en muchos aspectos respecto a la media de todos los demás municipios del departamento. Así, respecto a dicha media, demográficamente se observa que tiene mucha mayor población, densidad poblacional y tasa de natalidad; socialmente presenta mejores coberturas en salud, seguridad social, educación media y educación superior; y económicamente se destaca en el sector inmobiliario, turístico, de industrias manufactureras, y de generación y distribución de energía eléctrica.

Clúster 4:

El cuarto clúster agrupa una pequeña selección de municipios en particular: Candelaria, Cartago, Guadalajara de Buga, Palmira, Roldanillo y Tulúa. Se puede observar que dicha selección se realizó principalmente por los factores socio-demográficos, ya que este conjunto de municipios destaca de la media departamental por presentar una mayor tasa de natalidad, tasa de afiliación al régimen contributivo de salud, IDH, cobertura del servicio de acueducto y de educación superior; aunque también tiene una tasa de mortalidad superior. Se observa que económicamente el clúster se destaca por el sector pecuario, aunque esto se da principalmente porque Candelaria, Palmira y Buga son los principales municipios del departamento en este aspecto.

Clúster 5:

El quinto y último clúster incluye el municipio de Yumbo. Como era de esperarse de la principal zona industrial del departamento, destaca de la media departamental principalmente y en gran proporción por su valor agregado per cápita, producción por parte de la industria manufacturera y por parte de la generación y distribución de energía eléctrica. Además, también destaca positivamente por su IDH.

Habiendo definido los clústers y observado las características especiales que presentan en cuanto a sus variables respecto a la media departamental, también es posible graficar la representación que tienen por parte de los cinco factores definidos previamente, así como se realizó individualmente con los municipios:

Respecto al factor de Infraestructura y actividad económica municipal, al igual que antes, se observa que Cali (el clúster 3) destaca positivamente en gran medida. Por otra parte los clústers 4 y 5 (Yumbo) también tienen una implicación positiva, pero mucho más ligera; mientras que el resto de municipios del clúster 1 presentan un desempeño ligeramente negativo.

En cuanto al factor de Desarrollo humano y calidad de vida, Buenaventura (clúster 2) es considerablemente negativo, mientras que los clústers 4 y 5 son medianamente positivos. El clúster 1 tiene un desempeño neutro, con algunos municipios teniendo un mejor factor humano que la media, y otros uno peor.

En cuanto al factor conjunto de la productividad industrial y energética, se observa que el clúster 5 (Yumbo) destaca positivamente con una gran magnitud, y el clúster 2 (Buenaventura) lo hace de forma tenue. El clúster 1 no destaca en ninguna forma, y los clúster 3 (Cali) y 4 destacan un poco negativamente.

Respecto al factor de impacto climático, demográfico y educativo; se observa que el clúster 2 (Buenaventura) tiene un gran impacto negativo en términos generales, mientras que el clúster 3 (Cali) es ligeramente positivo.

El factor horizontal se ignora porque es el 1, y ya se analizó. El factor vertical, correspondiente a la producción agricola y pecuaria, nos muestra que la mayoría de clusters no destaca de ninguna forma aquí, lo cual tiene sentido porque los municipios que más destacan aquí están dentro del cluster 1, por lo que sus valores se ven considerablemente reducidos por todos los otros municipios de allí. Yumbo (clúster 5), sin embargo, muestra un desempeño relativamente negativo en este factor.

Conclusiones

  • En resumen, realizar un análisis exhaustivo de los diferentes aspectos económicos, culturales, demográficos y ambientales de los municipios del Valle del Cauca (o cualquier departamento en general) puede proporcionar información de utilidad, de la cual se obtienen múltiples beneficios y propósitos como identificar las prioridades, detectar las necesidades específicas de cada municipio, ya sea para la educación, salud o servicios públicos, o también para determinar sus fortalezas e incentivarlas aún más. Así, es posible trazar planes de acción que contengan elementos como fomentar el turismo, mejorar la calidad de vida, promover el uso responsable de los recursos naturales o aumentar la seguridad y bienestar de los ciudadanos. En resúmen, realizar un análisis detallado de estos aspectos proporciona una base sólida y de fácil identificación para la toma de decisiones estratégicas, fomentando la sostenibilidad y desarrollo de la región.

  • Como se pudo observar en los resultados del modelo, la capital del Valle del cauca (Cali) fue la que más resaltó en la mayoría de las variables estudiadas. La razón de esta misma se debe a que al ser la ciudad principal también cuenta con una ventaja en términos de recursos de todo tipo, ya que esta cuenta con la mayor población (lo que implica que cuenta con una mayor mano de obra para cualquier tipo de proyecto y trabajo, así como también con un mayor mercado que permita circular la economía local); y por contar con una concentración tan significativa de personas es que también se le destinan mayores recursos económicos por parte del presupuesto nacional, lo que sustenta muchos más proyectos de calidad de vida. Por ello, tiene la oportunidad de destacar en conceptos como infraestructura, actividades económicas y culturales, negocios de atención al cliente, centros educativos, entre otras de las variables en las que más destacó.

  • La reducción de dimensionalidad es una herramienta de mucha utilidad en el análisis de bases de datos, ya que al reducir la cantidad de variables y la cantidad de individuos en un número de factores y de clústers mucho más pequeño, la información se vuelve mucho más manejable y la observación de patrones y similitudes es más evidente. Esto se relaciona con la primera conclusión ya que por ejemplo, siguiendo lo observado durante este trabajo, se denotó un grupo de 30 municipios cuyos habitantes pueden llegar a sentirse “olvidados” por la gobernación debido a la poca inversión que se ha realizado en sus localidades, lo que se refleja en los resultados considerablemente bajos que mostraron en aspectos determinantes de su estilo de vida, social y económicamente.

  • Siguiendo con la idea anterior, también es posible identificar municipios clave para el desarrollo de la región de una forma objetiva y medible (Cali, Buenaventura y Yumbo), de forma que se puedan identificar claramente cuáles son sus fortalezas (y debilidades, en caso de haberlas) para concentrar el presupuesto e inversión en dichos sectores, potenciando el desarrollo de toda la región. Así mismo, se encontró un grupo de 6 municipios que, aunque no están al mismo nivel que los ya mencionados, también evidenciaron sus propios factores de desarrollo que los han puesto en una vía de desarrollo que los puede llegar a posicionar como puntos clave para el departamento, si se acondiciona la gestión de recursos adecuadamente sobre dichos factores.

Bibliografía