Introducción

En este informe se analiza el PIB per cápita de los departamentos de Colombia para el año 2018, utilizando técnicas de Análisis de Componentes Principales (ACP) y agrupamiento (Cluster). Este análisis permite identificar las principales fuentes de riqueza del país, destacando los sectores económicos más relevantes y su contribución al desarrollo nacional.

Sectores Económicos de Colombia

Sector Primario (Extractivo) Agricultura, ganadería, caza, silvicultura y pesca (AGCSP): Este sector incluye actividades como la producción de café, flores, banano y otros cultivos, así como la ganadería y la explotación de recursos forestales y pesqueros. Estas actividades son fundamentales para la economía rural y el comercio exterior.

Explotación de minas y canteras (EMC): Incluye la extracción de minerales como oro, carbón, esmeraldas y níquel, los cuales han sido históricamente una fuente importante de ingresos para Colombia.

Pesca: Las extensas costas del Pacífico y el Caribe, junto con numerosos ríos interiores, ofrecen un considerable potencial pesquero.

Explotación forestal: Los extensos bosques colombianos proporcionan madera y otros productos forestales, contribuyendo a la economía del país.

Sector Secundario (Industrial)

Industrias manufactureras (IM): Este sector está compuesto por la transformación de materias primas en productos terminados, como alimentos, textiles, productos químicos y metalúrgicos. Es clave para el empleo y la industrialización del país.

Suministro de electricidad, gas, vapor y aire acondicionado; distribución de agua; evacuación y tratamiento de aguas residuales, gestión de desechos y actividades de saneamiento ambiental (SEGD): Las actividades en este sector son cruciales para el desarrollo sostenible y la calidad de vida, proporcionando los servicios básicos para la vida moderna.

Construcción (CONS): Este sector incluye la edificación de infraestructuras como viviendas, caminos y edificios comerciales, jugando un papel clave en el crecimiento de la economía.

Sector Terciario (Servicios)

Comercio, transporte, almacenamiento, alojamiento y servicios de comida (CMA): Este sector dinamiza la economía al facilitar la distribución de bienes y servicios, así como el comercio interno y externo.

Información y comunicaciones (INFOCOM: Representa el desarrollo de tecnologías y servicios digitales, cruciales en la economía moderna, con una creciente relevancia en todos los sectores productivos.

Actividades financieras y de seguros (AFS): Proveen financiamiento y servicios clave para las demás actividades económicas, incluyendo préstamos, seguros y otros productos financieros.

Actividades profesionales, científicas, técnicas y de apoyo (APSTA): Estas actividades, junto con los servicios administrativos, fortalecen el entorno empresarial y público, apoyando la innovación y el desarrollo económico.

Administración pública, educación y salud (APD): Contribuyen al desarrollo social, garantizando el bienestar y la gobernanza, además de proporcionar servicios básicos a la población.

Actividades artísticas, recreativas y servicios personales (AER): Incluyen entretenimiento, cultura y servicios de apoyo, esenciales para la calidad de vida y el turismo, representando una parte significativa del sector terciario.

Exploración de Datos

Carga de Datos

pib_data <- read_excel("C:/Users/moran/OneDrive/Escritorio/Univalle/METODOS CUANTITATIVOS/Taller 3/PIBpc.xlsx")
pib_data<-as.data.frame(pib_data)
summary(pib_data)
##  Departamento       Abreviatura            AGCSP                EMC           
##  Length:33          Length:33          Min.   :1.765e-06   Min.   :1.473e-05  
##  Class :character   Class :character   1st Qu.:7.835e-04   1st Qu.:4.160e-05  
##  Mode  :character   Mode  :character   Median :1.226e-03   Median :1.454e-04  
##                                        Mean   :1.347e-03   Mean   :1.594e-03  
##                                        3rd Qu.:1.923e-03   3rd Qu.:7.585e-04  
##                                        Max.   :3.666e-03   Max.   :1.469e-02  
##        IM                 SEGD                CONS          
##  Min.   :9.823e-06   Min.   :1.427e-05   Min.   :0.0003409  
##  1st Qu.:2.221e-04   1st Qu.:1.256e-04   1st Qu.:0.0006911  
##  Median :6.365e-04   Median :2.926e-04   Median :0.0009486  
##  Mean   :1.171e-03   Mean   :3.580e-04   Mean   :0.0009957  
##  3rd Qu.:1.974e-03   3rd Qu.:5.256e-04   3rd Qu.:0.0011514  
##  Max.   :4.516e-03   Max.   :1.080e-03   Max.   :0.0022547  
##       CMA               INFOCOM               AFS           
##  Min.   :0.0005394   Min.   :5.420e-06   Min.   :6.479e-05  
##  1st Qu.:0.0014976   1st Qu.:1.191e-04   1st Qu.:1.842e-04  
##  Median :0.0021030   Median :2.068e-04   Median :2.381e-04  
##  Mean   :0.0025949   Mean   :2.703e-04   Mean   :3.996e-04  
##  3rd Qu.:0.0029135   3rd Qu.:3.552e-04   3rd Qu.:4.321e-04  
##  Max.   :0.0130943   Max.   :1.321e-03   Max.   :2.616e-03  
##        AI                APSTA                APD                AER           
##  Min.   :0.0001378   Min.   :6.620e-06   Min.   :0.001793   Min.   :4.282e-05  
##  1st Qu.:0.0004307   1st Qu.:1.384e-04   1st Qu.:0.002152   1st Qu.:1.209e-04  
##  Median :0.0007258   Median :5.452e-04   Median :0.002332   Median :1.881e-04  
##  Mean   :0.0008818   Mean   :6.272e-04   Mean   :0.002433   Mean   :2.373e-04  
##  3rd Qu.:0.0010445   3rd Qu.:9.783e-04   3rd Qu.:0.002547   3rd Qu.:3.111e-04  
##  Max.   :0.0040235   Max.   :2.642e-03   Max.   :0.004482   Max.   :1.219e-03  
##       IMP           
##  Min.   :0.0001378  
##  1st Qu.:0.0003962  
##  Median :0.0006899  
##  Mean   :0.0009852  
##  3rd Qu.:0.0013203  
##  Max.   :0.0044431

Variabilidad dentro de los sectores

##              AGCSP    EMC     IM    SEGD    CONS    CMA INFOCOM     AFS      AI
## Promedio   0.00135 0.0016 0.0012 0.00036 0.00100 0.0026 0.00027 0.00040 0.00088
## Desviación 0.00088 0.0035 0.0012 0.00029 0.00044 0.0022 0.00025 0.00045 0.00076
##              APSTA     APD     AER
## Promedio   0.00063 0.00243 0.00024
## Desviación 0.00060 0.00047 0.00021


Actividades como EMC (Explotación de minas y canteras) y CMA (Comercio, transporte, alojamiento y servicios de comida) presentan mayor cantidad de valores atípicos, indicando alta variabilidad en sus contribuciones relativas al PIB en comparación con otras actividades económicas.Actividades como APD (administración pública) y AER (actividades artísticas) tienen distribuciones más concentradas, reflejando menor dispersión entre los departamentos. Esto sugiere que actividades extractivas y comerciales presentan disparidades económicas regionales marcadas, mientras que actividades administrativos y culturales son más homogéneos, destacando la necesidad de políticas diferenciadas por sector.

Los histogramas muestran que la mayoría de los sectores económicos tienen distribuciones asimétricas con valores concentrados cerca de cero, indicando baja participación en el PIB en la mayoría de los departamentos, salvo excepciones notables. Actividades como EMC (minas y canteras) y CMA (comercio, transporte y servicios) presentan colas largas a la derecha, reflejando su relevancia en regiones específicas. INFOCOM, AER y IMP destacan por su participación limitada en la mayoría de los departamentos. Por otro lado, APD (administración pública, educación y salud) muestra mayor dispersión, lo que podría estar asociado con una distribución desigual de estos servicios.

CORRELACIÓN

Se observan patrones de correlación positiva en algunos casos, como entre INFOCOM (información y comunicaciones) y AFS (actividades financieras), indicando que departamentos con altos valores en un sector tienden a destacarse en el otro. Por otro lado, sectores como AGCSP (agricultura) y EMC (minería) no presentan relaciones claras con otros sectores, reflejando su independencia relativa. Este análisis ayuda a identificar interdependencias sectoriales que pueden influir en el diseño de políticas económicas integradas.

Análisis de Componentes Principales (PCA)

El análisis de componentes principales (PCA) identifica que los primeros dos componentes explican aproximadamente el 80,14% de la varianza acumulada de los datos, como se observa en la gráfica de la derecha. La gráfica de valores propios (izquierda) muestra que solo los componentes con valores superiores a 1 (línea roja) son significativos, destacando una reducción eficiente de la dimensionalidad al capturar la mayor parte de la información relevante en pocos componentes. Esto sugiere que los datos originales pueden representarse adecuadamente con estas dos variables sin perder mucha información.

Análisis de coeficientes estimados

##           PC1    PC2    PC3
## IM      -0.29 -0.415 -0.035
## SEGD    -0.25 -0.411  0.209
## CONS    -0.26 -0.369  0.070
## CMA     -0.18  0.229  0.832
## INFOCOM -0.36  0.065 -0.146
## AFS     -0.34  0.287 -0.131
## AI      -0.36  0.134 -0.123
## APSTA   -0.35 -0.030 -0.118
## APD     -0.20  0.547  0.130
## AER     -0.33  0.195 -0.365
## IMP     -0.33 -0.165  0.201

Los gráficos muestran los coeficientes de las variables en las dos primeras componentes principales (PC1 y PC2). En PC1, todas las variables tienen coeficientes negativos similares, lo que indica que esta componente representa un desempeño general equilibrado de todos los sectores. En PC2, actividades como APD (administración pública), AFS (actividades financieras y de seguros), CMD (comercio, transporte, almacenamiento, alojamiento y servicios de comida) y AER (actividades artísticas y recreativas) tienen coeficientes positivos significativos, mientras que IM (industria manufacturera), SEGD y CONS (construcción) tienen coeficientes negativos. Esto sugiere que PC2 diferencia entre departamentos con economías centradas en sectores terciarios frente a aquellos dependientes de sectores primarios y secundarios.

Análisis de departamentos en componentes principales

Estos gráficos comparan los departamentos según las dos primeras componentes principales. En el gráfico de PC1 (desempeño general), departamentos como Bogotá y Antioquia destacan negativamente, indicando un desempeño diferenciado respecto al resto, mientras que departamentos como Vichada y Guainía muestran valores positivos, reflejando un desempeño económico más homogéneo en sectores clave. En PC2 (contraste sectorial), los valores positivos representan una orientación hacia sectores terciarios (administración pública, servicios), destacando departamentos como Vichada, mientras que los negativos reflejan dependencia en sectores primarios y secundarios, como en Bogotá y Antioquia. Esto permite identificar regiones con estructuras económicas balanceadas frente a otras más especializadas.

El gráfico muestra el contraste entre el desempeño general (PC1) y el balance entre sectores primarios, secundarios y terciarios (PC2) para los departamentos colombianos. Bogotá se posiciona como un caso extremo, destacándose por su fortaleza en sectores terciarios. Los departamentos cercanos al origen tienen un desempeño más equilibrado entre los sectores, mientras que otros, como San Andrés, presentan una orientación más específica. Este análisis permite identificar departamentos con economías diversificadas y otros con dependencias sectoriales marcadas.

# Asegurarse de que las abreviaturas sean los nombres de las filas
rownames(pib_data) <- pib_data$Abreviatura

# Generar el biplot básico sin etiquetas automáticas
biplot(PCA, 
       col = c("grey", "blue"), # Color para vectores (variables) y observaciones
       cex = 0.8,              # Tamaño del texto
       xlim = c(-0.4, 0.4),    # Límites del eje X
       ylim = c(-0.4, 0.4),    # Límites del eje Y
       xlabs = rep("", nrow(pib_data))) # Evitar etiquetas automáticas de números

# Agregar manualmente etiquetas de las observaciones (departamentos)
text(PCA$x[, 1], PCA$x[, 2], 
     labels = rownames(pib_data), # Abreviaturas como etiquetas
     pos = 3,                     # Posición de las etiquetas (arriba)
     cex = 0.8,                   # Tamaño del texto
     col = "gray40")              # Color de las etiquetas

El gráfico PCA muestra cómo los departamentos colombianos se distribuyen según las contribuciones de los sectores económicos al PIB. Las flechas representan sectores como administración pública (APD), construcción (CONS) e industrias manufactureras (IM), siendo APD y CONS las de mayor influencia en la separación de los departamentos. Bogotá se destaca por su alta actividad en sectores terciarios, mientras que otros departamentos más agrupados presentan economías similares centradas en sectores primarios y secundarios.

Clusterización

El dendrograma muestra la clusterización jerárquica de los departamentos colombianos en función de su PIB sectorial (sectores primarios, secundarios y terciarios). Cada rama representa las similitudes entre los departamentos, y su altura indica la distancia o diferencia entre los grupos.

Se identifican cuatro grupos principales, representados en cajas azules. Bogotá aparece aislada, destacándose por su estructura económica única, dominada por sectores terciarios (financieros e inmobiliarios). Otros grupos reúnen departamentos con economías similares, como aquellos altamente dependientes de sectores primarios (agricultura y minería) o secundarios (manufactura y construcción).

Los grupos más compactos (ramas más cortas) tienen características económicas más homogéneas. Las ramas más largas, como la que separa a Bogotá del resto, indican una mayor disparidad económica respecto a los otros departamentos. Este dendrograma es clave para comprender patrones económicos regionales y puede guiar la formulación de políticas adaptadas a las características económicas de cada clúster.

El gráfico representa una clusterización jerárquica basada en un análisis de componentes principales (PCA), donde cada punto representa un departamento colombiano y los colores y formas diferencian los clústeres identificados.

La agrupación refleja similitudes en los valores del PIB generados por sectores económicos primarios (como agricultura y minería), secundarios (manufactura y construcción) y terciarios (comercio, servicios financieros, inmobiliarios, entre otros). Los clústeres muestran que algunos departamentos tienen patrones similares de contribución económica por sector, mientras que otros son más únicos como Bogotá, que se encuentra aislada debido a su alta actividad en sectores terciarios (como servicios financieros e inmobiliarios). Este análisis es útil para identificar características económicas compartidas entre regiones y diseñar políticas adaptadas a las necesidades específicas de cada grupo.

Conclusiones

Este análisis resalta patrones subyacentes en los datos económicos del PIB per cápita. El PCA redujo la dimensionalidad mientras que la clusterización identificó grupos de departamentos similares según las características principales.