1. Tener en cuenta:
Departamentos Los nombres de los departamentos se
establecieron de la siguiente forma:
- Antioquia: Anti
- Atlantico: Atla
- Bogota D.C.: Bogo
- Bolivar: Boli
- Boyaca: Boya
- Caldas: Cald
- Caqueta: Caqu
- Cauca: Cauc
- Cesar: Cesa
- Cordoba: Cord
- Cundinamarca: Cund
- Choco: Choc
- Huila: Huil
- La Guajira: LaGu
- Magdalena: Magd
- Meta: Meta
- Nariño: Nari
- Norte de Santander: NorS
- Quindio: Quin
- Risaralda: Risa
- Santander: Sant
- Sucre: Sucr
- Tolima: Toli
- Valle del Cauca: Vall
- Arauca: Arau
- Casanare: Casa
- Putumayo: Putu
- San Andrés, Providencia y Santa Catalina (Archipiélago): SanA
- Amazonas: Amaz
- Guainía: Guai
- Guaviare: Guav
- Vaupés: Vaup
- Vichada: Vich
Sectores Los sectores a trabajar (con su respectiva
abreviatura) son:
- Agricultura, ganadería, caza, silvicultura y pesca: Agricultura
pesca
- Explotación de minas y canteras: Minería
- Industrias manufactureras: Manufactura
- Suministro de electricidad, gas, vapor y aire acondicionado;
distribución de agua; evacuación y tratamiento de aguas residuales,
gestión de desechos y actividades de saneamiento ambiental: Energía
saneamiento
- Construcción: Construcción
- Comercio al por mayor y al por menor; reparación de vehículos
automotores y motocicletas; transporte y almacenamiento; alojamiento y
servicios de comida: Comercio transporte
- Información y comunicaciones: Información comunicaciones
- Actividades financieras y de seguros: Finanzas seguros
- Actividades inmobiliarias: Inmobiliarias
- Actividades profesionales, científicas y técnicas; actividades de
servicios administrativos y de apoyo: Servicios profesionales
- Administración pública y defensa; planes de seguridad social de
afiliación obligatoria; educación; actividades de atención de la salud
humana y de servicios sociales: Administración pública
- Actividades artísticas, de entretenimiento y recreación y otras
actividades de servicios; actividades de los hogares individuales en
calidad de empleadores; actividades no diferenciadas de los hogares
individuales como productores de bienes y servicios para uso propio:
Entretenimiento
- Impuestos: Impuestos
2. Análisis exploratorio
2.1. Identificación de datos faltantes

Con base en el gráfico anterior, no se tienen datos faltantes en el
dataset de salarios
2.2. Análisis univariado de los sectores
Resumen estadístico
| Agricultura.pesca |
0.0013469 |
0.0012259 |
0.0008834 |
| Minería |
0.0015945 |
0.0001454 |
0.0035367 |
| Manufactura |
0.0011713 |
0.0006365 |
0.0012374 |
| Energía.saneamiento |
0.0003580 |
0.0002926 |
0.0002938 |
| Construcción |
0.0009957 |
0.0009486 |
0.0004403 |
| Comercio.transporte |
0.0025949 |
0.0021030 |
0.0022128 |
| Información.comunicaciones |
0.0002703 |
0.0002068 |
0.0002503 |
| Finanzas.seguros |
0.0003996 |
0.0002381 |
0.0004475 |
| Inmobiliarias |
0.0008818 |
0.0007258 |
0.0007583 |
| Servicios.profesionales |
0.0006272 |
0.0005452 |
0.0006044 |
| Administración.pública |
0.0024325 |
0.0023315 |
0.0004701 |
| Entretenimiento |
0.0002373 |
0.0001881 |
0.0002120 |
| Impuestos |
0.0009852 |
0.0006899 |
0.0009070 |
Distribución de los sectores

Outliers
| Cesa |
Bogo |
Bogo |
Bogo |
Bogo |
| LaGu |
Sant |
|
|
Casa |
| Meta |
|
|
|
SanA |
| Arau |
|
|
|
|
| Casa |
|
|
|
|
| Putu |
|
|
|
|
Con base en el resumen estadístico, la distribución de los sectores
reflejados en los gráficos de cajas y bigotes y un pequeño resumen de
outliers, se puede decir que:
- El sector minero es una actividad económica que no destaca entre los
departamentos, excepto en seis departamentos: Cesar, La Guajira, Meta,
Arauca, Casanare y Putumayo
- En la mayoría de los sectores tenemos al menos un outlier, y este
viene dado por Bogotá. Por lo tanto, se excluirá del análisis.
2.3. Análisis bivariado de los sectores


Con base en los diagramas de dispersión y la matriz de correlaciones,
se puede ver reflejadas unas asociaciones entre los sectores primarios
por sí solos y los sectores secundarios-terciarios por sí solos. Además,
los Impuestos tiene correlaciones importantes con la mayoría de los
sectores secundarios y terciarios de la economía (producción y
servicios), excepto con los sectores de Agricultura, Minería y
actividades del estado (administración pública). Por último, el PIB
provenientes por actividades del estado (administración pública) no
parece estar relacionado con ningún sector, excepto con las actividades
de comercio y transporte (moderado).
3. Análisis de componentes principales
3.1. Cálculo de los ACP

Con base en los gráficos anteriores, el número de componentes a tener
en cuenta van a ser tres componente, cuya varianza acumulada es del
79.48%.
3.2. Explicación de cada componente
3.2.1. Componente 1: sectores secundario y
terciario

Para el componente principal 1, los coeficientes positivos son
principalmente pertenecientes, al sector secundario y terciario,
incluyendo impuestos. Los coeficientes negativos, no son tan
influyentes, pero vienen dados por actividades del estado y minería.
3.2.2. Componente 2: sector primario

Para el componente principal 2 los coeficientes negativos (y que
predominan) principalmente son los pertenecientes al sector primario de
la economía, junto con actividades comercio, transporte y administración
pública. Por su parte, los coeficientes positivos más sobresalientes son
servicios profesionales, entretenimiento y manufactura.
3.2.3. Componente 3: estado y comercio

Por último, el componente principal 3 viene dado principalmente por
administraciónm pública (estado) y comercio y transporte (coeficientes
negativos). Lo Coeficientes positivos se dan especialmente en el sector
primario y secundario.
3.3. Representación de los departamentos en las componentes
principales
Representación de los departamentos

Representación de los departamentos en cada uno de los planos
de los componentes principales

Representación simultánea de departamentos y
variables

Con base en las representaciones anteriores, la caracterización de
los siguientes departamentos son:
- Casanare: su PIB per cápita está ligado a sectores primario,
especialmente la minería.
- Arauca: su PIB per cápita está ligado a actividades del estado, y en
menor medida a minería y agrícultura-pesca
- Bogotá: su PIB per cápita está ligado fuertemente a sectores
secundario y terciario, y actividades del estado o comercio.
- San Andrés: su PIB per cápita ligado principalmente a comercio y
transporte y agricultura-pesca.
- Valle del Cauca: su PIB per cápita ligado a sectores secundario y
terciario, muy fuerte en entretenimiento
- Antioquia: similar al Valle, su PIB per cápita está ligado al sector
secundario y terciario, muy fuerte entretenimiento
- Chocó: muy en contra de la dirección de los sectores, además de que
muy bajo puntaje en los tres componentes, pero su PIB per cápita está un
poco ligado a sector primario.
- Vaupés: similar a Chocó, sin embargo su PIB per cápita está un poco
ligado a actividades del estado.
4. Agrupamientos
4.1. Evaluación del número adecuado de clúster

Con base en el gráfico anterior, y teniendo en cuenta el método del
codo, el número óptimo de clústeres está entre 3 y 6 clústeres. Se
realizará el análisis del coeficiente de silhouette para escoger la
mejor agrupación.

Con base en el coeficiente de silhouette, se escogerán cuatro
grupos.
4.2. Aplicación de los clúster y
representaciones


Con base en las representaciones anteriores, se puede concluir
que:
- Clúster 1: se encuentran los departamentos cuyo PIB per cápita está
ligado al sector primario, actividades del estado y comercio.
- Clúster 2: aquí se encuentran departamentos que tienen un
equilibrio. Sin embargo, se destacan Valle, Antioquia y Santander ya que
sus actividades económicas enlazadas con los sectores secundarias y
terciarias (componente 1) son más fuertes que los demás.
- Clúster 3: se encuentra Bogotá, que su PIB per cápita está muy por
encima de los demás departamentos, especialmente en actividades del
sector secundario, terciario, estado y comercio-transporte.
- Clúster 4: por último, este grupo está ligado a departamentos que
aportan poco en el PIB y que tienen poca actividad en el sector
secundario y terciario.
5. Conclusiones
- El análisis de componentes principales es una buena herramienta
poderosa para hacer agrupaciones entre variables y reducción de
dimensionalidad, sin perder información importante para el
análisis.
- Se evidencia la centralización en cuánto a economía se refiere por
parte de Bogotá, ya que esta ciudad aporta en grandes cantidades al PIB
de Colombia en casi todos los sectores de la economía.
- Antioquia, Valle y Santander son otros departamentos que destacan en
sus niveles económicos, muy ligados a servicios o producción.
- Es de destacar Meta, Casanare y San Andrés, los dos primeros por su
fuerte actividad agrícola o minera, y San Andrés por el comercio.