1. Tener en cuenta:

Departamentos Los nombres de los departamentos se establecieron de la siguiente forma:

Sectores Los sectores a trabajar (con su respectiva abreviatura) son:

2. Análisis exploratorio

2.1. Identificación de datos faltantes

Con base en el gráfico anterior, no se tienen datos faltantes en el dataset de salarios

2.2. Análisis univariado de los sectores

Resumen estadístico

Promedio Mediana Desviación
Agricultura.pesca 0.0013469 0.0012259 0.0008834
Minería 0.0015945 0.0001454 0.0035367
Manufactura 0.0011713 0.0006365 0.0012374
Energía.saneamiento 0.0003580 0.0002926 0.0002938
Construcción 0.0009957 0.0009486 0.0004403
Comercio.transporte 0.0025949 0.0021030 0.0022128
Información.comunicaciones 0.0002703 0.0002068 0.0002503
Finanzas.seguros 0.0003996 0.0002381 0.0004475
Inmobiliarias 0.0008818 0.0007258 0.0007583
Servicios.profesionales 0.0006272 0.0005452 0.0006044
Administración.pública 0.0024325 0.0023315 0.0004701
Entretenimiento 0.0002373 0.0001881 0.0002120
Impuestos 0.0009852 0.0006899 0.0009070

Distribución de los sectores

Outliers

Minería Impuestos Información y comunicaciones Entretenimiento Comercio y transporte
Cesa Bogo Bogo Bogo Bogo
LaGu Sant Casa
Meta SanA
Arau
Casa
Putu

Con base en el resumen estadístico, la distribución de los sectores reflejados en los gráficos de cajas y bigotes y un pequeño resumen de outliers, se puede decir que:

  • El sector minero es una actividad económica que no destaca entre los departamentos, excepto en seis departamentos: Cesar, La Guajira, Meta, Arauca, Casanare y Putumayo
  • En la mayoría de los sectores tenemos al menos un outlier, y este viene dado por Bogotá. Por lo tanto, se excluirá del análisis.

2.3. Análisis bivariado de los sectores

Con base en los diagramas de dispersión y la matriz de correlaciones, se puede ver reflejadas unas asociaciones entre los sectores primarios por sí solos y los sectores secundarios-terciarios por sí solos. Además, los Impuestos tiene correlaciones importantes con la mayoría de los sectores secundarios y terciarios de la economía (producción y servicios), excepto con los sectores de Agricultura, Minería y actividades del estado (administración pública). Por último, el PIB provenientes por actividades del estado (administración pública) no parece estar relacionado con ningún sector, excepto con las actividades de comercio y transporte (moderado).

3. Análisis de componentes principales

3.1. Cálculo de los ACP

Con base en los gráficos anteriores, el número de componentes a tener en cuenta van a ser tres componente, cuya varianza acumulada es del 79.48%.

3.2. Explicación de cada componente

3.2.1. Componente 1: sectores secundario y terciario

Para el componente principal 1, los coeficientes positivos son principalmente pertenecientes, al sector secundario y terciario, incluyendo impuestos. Los coeficientes negativos, no son tan influyentes, pero vienen dados por actividades del estado y minería.

3.2.2. Componente 2: sector primario

Para el componente principal 2 los coeficientes negativos (y que predominan) principalmente son los pertenecientes al sector primario de la economía, junto con actividades comercio, transporte y administración pública. Por su parte, los coeficientes positivos más sobresalientes son servicios profesionales, entretenimiento y manufactura.

3.2.3. Componente 3: estado y comercio

Por último, el componente principal 3 viene dado principalmente por administraciónm pública (estado) y comercio y transporte (coeficientes negativos). Lo Coeficientes positivos se dan especialmente en el sector primario y secundario.

3.3. Representación de los departamentos en las componentes principales

Representación de los departamentos

Representación de los departamentos en cada uno de los planos de los componentes principales

Representación simultánea de departamentos y variables

Con base en las representaciones anteriores, la caracterización de los siguientes departamentos son:

  • Casanare: su PIB per cápita está ligado a sectores primario, especialmente la minería.
  • Arauca: su PIB per cápita está ligado a actividades del estado, y en menor medida a minería y agrícultura-pesca
  • Bogotá: su PIB per cápita está ligado fuertemente a sectores secundario y terciario, y actividades del estado o comercio.
  • San Andrés: su PIB per cápita ligado principalmente a comercio y transporte y agricultura-pesca.
  • Valle del Cauca: su PIB per cápita ligado a sectores secundario y terciario, muy fuerte en entretenimiento
  • Antioquia: similar al Valle, su PIB per cápita está ligado al sector secundario y terciario, muy fuerte entretenimiento
  • Chocó: muy en contra de la dirección de los sectores, además de que muy bajo puntaje en los tres componentes, pero su PIB per cápita está un poco ligado a sector primario.
  • Vaupés: similar a Chocó, sin embargo su PIB per cápita está un poco ligado a actividades del estado.

4. Agrupamientos

4.1. Evaluación del número adecuado de clúster

Con base en el gráfico anterior, y teniendo en cuenta el método del codo, el número óptimo de clústeres está entre 3 y 6 clústeres. Se realizará el análisis del coeficiente de silhouette para escoger la mejor agrupación.

Con base en el coeficiente de silhouette, se escogerán cuatro grupos.

4.2. Aplicación de los clúster y representaciones

Con base en las representaciones anteriores, se puede concluir que:

  • Clúster 1: se encuentran los departamentos cuyo PIB per cápita está ligado al sector primario, actividades del estado y comercio.
  • Clúster 2: aquí se encuentran departamentos que tienen un equilibrio. Sin embargo, se destacan Valle, Antioquia y Santander ya que sus actividades económicas enlazadas con los sectores secundarias y terciarias (componente 1) son más fuertes que los demás.
  • Clúster 3: se encuentra Bogotá, que su PIB per cápita está muy por encima de los demás departamentos, especialmente en actividades del sector secundario, terciario, estado y comercio-transporte.
  • Clúster 4: por último, este grupo está ligado a departamentos que aportan poco en el PIB y que tienen poca actividad en el sector secundario y terciario.

5. Conclusiones

  1. El análisis de componentes principales es una buena herramienta poderosa para hacer agrupaciones entre variables y reducción de dimensionalidad, sin perder información importante para el análisis.
  2. Se evidencia la centralización en cuánto a economía se refiere por parte de Bogotá, ya que esta ciudad aporta en grandes cantidades al PIB de Colombia en casi todos los sectores de la economía.
  3. Antioquia, Valle y Santander son otros departamentos que destacan en sus niveles económicos, muy ligados a servicios o producción.
  4. Es de destacar Meta, Casanare y San Andrés, los dos primeros por su fuerte actividad agrícola o minera, y San Andrés por el comercio.