El Producto Interno Bruto (PIB) es una magnitud macroeconómica que expresa el valor monetario del acumulado de producción de bienes y servicios de demanda final en una población durante un período determinado de tiempo, regularmente un año o periodo fiscal. En Colombia, la medición del PIB es realizada por el Departamento Administrativo Nacional de Estadística (DANE), quien considera 12 grandes agrupaciones para las ramas de la actividad económica en el país + el rubro de generación de impuestos (13 agrupaciones en total).
La hoja de datos PIBpc.xlsx contiene, para el año 2018, la medición del PIB percapita (Cociente entre el PIB y el número de habitantes), medido en miles de millones de pesos, para las 33 unidades administrativas en que se divide Colombia el año 2018: 32 departamentos y el distrito capital, Bogotá. Las diferencias en la ubicación geográfica, la variedad de los recursos naturales, aspectos culturales y de tamaño de población, pueden generar heterogeneidad en las fortalezas productivas de los departamentos.
A través del Análisis de Componentes Principales, y siguiendo la metodología estudiada en clase, se espera que usted:
Análisis Exploratorio de Datos
Análisis de Componentes Principales
Identifique, seleccione e interprete las estructuras latentes (Componentes Prinicipales) que caracterizan las capacidades de generación de riqueza de los departamentos en Colombia. (Recuerde manejar adecuadamente los puntos influyentes)
Proyecte la productividad de los departamentos en el espacio de las componentes principales y genere un ranking de los departamentos en función de su capacidad productiva en cada una de las componentes.
Utilizando los resultados de la proyección de departamentos y variables en el espacio de las componentes (biplot), genere una caracterización de la estructura del PIB de los siguientes departamentos: Casanare, Arauca, Bogota, San Andrés, Valle del Cauca, Antioquia,Choco, Vaupes.
Cluster
Utilice las puntuaciones de las componentes prinicipales para sugerir al gobierno nacional una agrupación de departamentos con similaridad en su estructura de generación en valor agregado.
Utilice herramientas de visualización para describir de forma sintetica las caracteristicas globales de los grupos de departamentos sugeridos.
Presente sus resultados en un informe sintetico (no más de 10 paginas), desarrollado en Rmarkdown. Este informe debe ser publicado en su cuenta personal del espacio Rpubs.
En el campus virtual ud debe subir dos archivos:
Archivo .txt que contiene un enlace web a su informe escrito, públicamente expuesto en Rpubs.
Script Rmarkdown con el código desarrollado para generar el informe.
## Agropecuario Mineria Manufactura Electricidad_gas_agua Construccion
## Mediana 1.23 0.15 0.64 0.29 0.95
## Desviación 0.88 3.54 1.24 0.29 0.44
## CV 0.72 24.33 1.94 1.00 0.46
## Comercio Inform_y_Comunic Financ_y_Seg Inmobiliaria Serv_Pers
## Mediana 2.1 0.21 0.24 0.73 0.55
## Desviación 2.2 0.25 0.45 0.76 0.60
## CV 1.1 1.21 1.88 1.04 1.11
## Serv_Gno Serv_Domest Impuestos
## Mediana 2.33 0.19 0.69
## Desviación 0.47 0.21 0.91
## CV 0.20 1.13 1.31
Nota: Se presentan las cifras en Millones de pesos por habitante [M$/hab].
Se utiliza la mediana como indicador de tendencia central, dado que los datos no tienen un comportamiento de distribución normal para usar el promedio.
Al referir a Bogotá dentro del listado de departamentos se reconoce su caracter especial como Distrito Capital.
## El dato 'atipico' entre 33 departamentos es en:
## Agropecuario : Casanare con 3.6660482 M$/hab
## Mineria : Casanare con 14.6897248 M$/hab y Meta con 13.4330475 M$/hab
## Construcción : Santander con 2.2546777 M$/hab y Boyaca con 2.1208911 M$/hab
## Comercio : San Andrés, Providencia y Santa Catalina (Archipiélago) con 13.0942635 M$/hab, Bogota D.C. con 5.765305 M$/hab y Casanare con 5.508334 M$/hab
## Información y Comunicaciones : Bogota D.C. con 1.3214438 M$/hab
## Financiera y Seguros : Bogota D.C. con 2.6159909 M$/hab y Antioquia con 0.9697706 M$/hab
## Inmobiliaria : Bogota D.C. con 4.0235238 M$/hab y Valle del Cauca con 2.4232393 M$/hab
## Servicios Personales : Bogota D.C. con 2.6416938 M$/hab
## Servicios del Gobierno : Bogota D.C. con 4.4816857 M$/hab
## Servicios Domésticos : Bogota D.C. con 1.2188566 M$/hab
## Impuestos : Santander con 4.4430858 M$/hab y Bogota D.C. con 3.058367 M$/hab
Bogotá se manifiesta como dato ‘atípico’ en 8 de las 13 variables, pero en todas ellas como un registro de desempeño superior.
NO se incluye la columna de Impuestos, por su correlación entendida con las demás variables.
En una primera aproximación, no se aprecia algún tipo de correlación entre los sectores económicos agropecuario y minería con los demás sectores.
Es manifiesta la ausencia de correlación entre el Comercio y los Servicios de Gobierno frente a las Actividades Económicas asociadas a los Sectores Primario (Agropecuario y Minería) y Secundario (Manufactura, Energía y Construcción) de la economía.
Nota: El sector terciario de la economía lo componen fundamentalmente el Comercio, los Servicios y las Comunicaciones.
Resulta conveniente mantener a Bogotá, porque su ausencia afecta el análisis asociado entre algunas Actividades Económicas, como el caso de Servicios del Gobierno.
Bogotá actúa como una unidad que hala diversas Actividades Económicas que dinamizan la economía del país.
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 2.5230 1.4165 1.2119 0.89469 0.70365 0.57067 0.48054
## Proportion of Variance 0.5305 0.1672 0.1224 0.06671 0.04126 0.02714 0.01924
## Cumulative Proportion 0.5305 0.6977 0.8200 0.88675 0.92801 0.95515 0.97440
## PC8 PC9 PC10 PC11 PC12
## Standard deviation 0.38907 0.25392 0.22066 0.15250 0.13950
## Proportion of Variance 0.01261 0.00537 0.00406 0.00194 0.00162
## Cumulative Proportion 0.98701 0.99238 0.99644 0.99838 1.00000
Se utilizan las técnicas de valor propio >1 y varianza acumulada como criterios de selección de componentes.
Se seleccionan 3 componentes que recogen el 82% de la Varianza Explicada.
## PC1 PC2 PC3
## Agropecuario 0.0702 -0.53803 -0.3474
## Mineria 0.0491 -0.36634 -0.6083
## Manufactura -0.2962 -0.31313 0.3124
## Electricidad_gas_agua -0.2516 -0.36725 0.1961
## Construccion -0.2528 -0.37699 0.0993
## Comercio -0.1882 0.06223 -0.4100
## Inform_y_Comunic -0.3850 0.00717 -0.0172
## Financ_y_Seg -0.3658 0.16984 -0.1735
## Inmobiliaria -0.3766 0.04854 -0.0860
## Serv_Pers -0.3767 -0.02598 0.0961
## Serv_Gno -0.2186 0.37324 -0.3846
## Serv_Domest -0.3587 0.16178 0.0177
PC1 = Coeficientes positivos halan las actividades del sector primario de la economía, con una fuerte carga negativa para los sectores secundario y terciario.
Representa el contraste entre el agregado de los sectores secundario y terciario (-) vs el sector primario (+)
Esta componente por su gran peso (Valor propio) entre todas demás representa el principal motor de la economía.
PC2 = Coeficientes positivos halan las actividades del sector terciario de la economía, con una carga negativa para los sectores primario y secundario.
Representa el contraste entre el agregado de los sectores primario y secundario (-) vs el sector terciario (+).
PC3 = Coeficientes positivos halan las actividades del sector secundario de la economía y los negativos para los sectores primario y terciario (en su mayoría).
Representa el contraste entre el agregado de los sectores primario y terciario (-) vs el sector secundario (+).
Nota: Cada Componente Principal por su naturaleza no tiene correlación con las otros dos y de manera sucesiva cada una representa menos fuerza explicativa a la luz de los Valores Propios.
Frente a PC1:
Los Departamentos cuya economía está centrada en actividades asociadas a los sectores secundario y terciario como su principal motor son en su orden: Bogotá, Antioquia, Santander, Valle del Cauca y Atlántico.
De manera análoga pero asociada al sector primario de la economía están: Vichada, Chocó, Vaupés, Guainía, Putumayo, Amazonas, Arauca, Guaviare y La Guajira. Salvo Chocó y la Guajira que su impulso obedece a la minería, los demás departamentos de la orinoquía y amazonía centran su producción en la actividad agropecuaria.
Frente a PC2:
Los Departamentos que centran su economía en el sector terciario son Bogotá y San Andrés, mientras que los que tienen un mejor desempeño en el agregado primario y secundario son Casanare, Cundinamarca, Boyacá y Meta
Frente a PC3:
Los Departamentos que centran su economía en el sector secundario son Atlántico, Cundinamarca, Antioquia y Cauca, mientras que los que tienen un mejor desempeño en el agregado primario y terciario son Casanare, Meta, San Andrés, Arauca y Bogotá, siendo los departamentos de la orinoquía los movidos por la minería, mientras que los restantes lo son en las actividades del sector terciario fundamentalmente.
Los Departamentos de Bogotá D.C., San Andrés, Valle del Cauca, Antioquia, Casanare, Arauca, Chocó y Vaupés son por parejas, en su orden, algunos representantes de los cuatro cuadrantes del mapa PC1 vs PC2, que se numerarán I, II, III y IV, partiendo de la esquina superior izquierda y asignados en sentido antihorario.
Es decir Bogotá D.C.y San Andrés (Cuadrante I) centran su economía en actividades del sector terciario de la economía aunque Bogotá le supera de lejos a todos los departamentos en el agregado secundario + terciario. Son movidos por los tensores de Servicios y Comercio.
En este cuadrante también se ubica el departamento de Risaralda.
En el Cuadrante II se ubica como representante Antioquia por su agregado secundario + terciario vs su agregado primario + secundario, apalancado fundamentalmente por su sector secundario, pero en balance con los otros dos. Mientras Valle del Cauca, en PC2 está relativamente neutro (Balance entre el agregado primario y secundario vs el sector terciario) y representa el cuarto mejor desempeño en el Agregado secundario + terciario de la economía. Son movidos por los tensores Manufactura, Utilities y Construcción.
En este cuadrante también se ubican Santander, Boyacá, Cundinamarca, Caldas, Atlántico y Bolivar
En el Cuadrante III se ubican como representantes Casanare y Arauca, movidos por su sector primario y un buen desempeño en el agregado primario + secundario. Son movidos por los tensores Agropecuario y Minería.
En este cuadrante también se ubica el departamento del Meta.
En el Cuadrante IV se ubican como representantes Chocó y Vaupés, caracterizados por su desarrollo claro alrededor del sector primario fundamentado en la actividad agropecuaria y un desempeño relativo importante en actividades del sector terciario de la economía. Deben apalancar su desarrollo en la ventaja comparativa que poseen en las actividades Agropecuaria, Comercio y Servicios del Gobierno.
En este cuadrante también se ubica la mayoría del resto de departamentos.
En el cuadrante I se señalan los departamentos con fortalezas en su sector secundario de la economía, direccionados por los vectores Manufactura, Utilities y Construción.
En el cuadrante II se ubica Bogotá, que como se explicó anteriormente potencia sus resultados en los agregados de los sectores secundario y terciario y San Andrés por el sector Comercio principalmente.
En el cuadrante III se ubican los departamentos asociados al sector primario de la economía con gran desarrollo minero y agropecuario, en la dirección de sus tensores correspondientes.
En el cuadrante IV se ubican los departamentos que requieren dirigir sus esfuerzos en la dirección de los tensores que halen sus economías hacia los sectores secundario y terciario.
En el cuadrante I se ubican los departamentos con fortalezas en su sector secundario de la economía, dirigidos por los tensores Manufactura, Utilities y Construción.
En el cuadrante II se ubican los departamentos asociados al sector primario de la economía con gran desarrollo minero y agropecuario, en la dirección de sus vectores asociados.
En el cuadrante III se ubican Bogotá y San Andrés, que determinasn su posición por los vectores de Servicios del Gobierno y Comercio y el primero con la adición del resto de Servicios.
En el cuadrante IV se ubican los departamentos que requieren dirigir sus esfuerzos en la dirección de los tensores que halen sus economías hacia los sectores secundario y terciario.
## Se puede establecer que la Componente Principal PC1 es un buen estimador de los impuestos de los departamentos, excepto para Santander con PC1= -3.42 e impuestos = 4.4430858 M$/hab y Bogota D.C. con PC1= -10.05 e impuestos = 3.058367 M$/hab
## Mediante la relacion: Impuestos = -0.298487039354716 * PC1 + 0.985172593939394
El average silhouette width (ancho promedio de silhouette) es una medida que indica cuán bien se ha agrupado cada punto de datos. Permite evaluar la cohesión y separación de los clusters. Un promedio alto y consistente indica una buena estructura de clustering.
SSE significa “Sum of Squared Errors” o suma de errores al cuadrado. En el análisis de agrupamiento (Clustering), SSE es una medida de la dispersión dentro de los clusters. Es la suma de las distancias cuadradas de cada punto de datos dentro de su cluster correspondiente al centroide de ese cluster.
Se escogen cuatro agrupaciones (Clusters) para los departamentos, dado que recogen el mejor promedio de los gráficos Silhouette (0.49), valor que también corresponde en la gráfica de sedimentación al “codo” en la curva, que suele indicar el número óptimo de clusters.
El cluster 1 lo conforman los departamentos de Antioquia, Valle, Santander, Cundinamarca, Boyacá, Caldas, Risaralda, Bolivar y Atlántico,
El cluster 2 lo conforman los departamentos de Arauca, Meta y Casanare.
El cluster 4 lo conforma Bogotá
El cluster 3 lo conforma el resto de los departamentos de Colombia.
Esta representa una buena forma de agrupación de los departamentos por su similitud en su estructura de generación de valor agregado a la economía.
El cluster 1 conformado por Antioquia, Valle, Santander, Cundinamarca, Boyacá, Caldas, Risaralda, Bolivar y Atlántico, destaca como polo de desarrollo en Actividades de manufactura, utilities, construcción.
Le siguen las actividades de Información y comunicaciones, finanzas y seguros, inmobiliarias, servicios personales, servicios del gobierno y servicios domésticos, después de Bogotá y agropecuarias, después del cluster 2 y 3.
Realiza un gran aporte en impuestos después de Santander y Bogotá.
El cluster 2 conformado por Arauca, Meta y Casanare destaca como polo de desarrollo asociado a las actividades agropecuarias y de minería.
Le siguen los Servicios del Gobierno después de Bogotá, las actividades de Comercio, después de San Andrés y Bogotá y las actividades de Utilities, Construcción, Información y Comunicaciones, Finanzas y Seguros, Inmobiliara, Servicios Personales, después de Bogotá y el cluster 1.
El cluster 3 tiene su desarrollo alrededor de la actividad Agropecuaria después del cluster 2 y el más bajo desempeño en las demás actividades de la economía frente a los otros clusters.
Este cluster realiza a su vez el menor aporte de impuestos dentro de la economía.
El cluster 4 conformado por Bogotá, destaca como polo de desarrollo en todas las Actividades del sector terciario de la economía solo siendo superado en la actividad Comercio por San Andrés.
Lidera el sector secundario de la economía en las actividades de Manufactura y Construcción y sigue al cluster 1 en Utilities
Realiza el segundo mayor aporte en impuestos después del departamento de Santander.
En esta agrupación el cluster 1 representa los polos de desarrollo de la Región Andina, Valle y la Costa Atlántica, el cluster 2 el polo de desarrollo minero asociado a explotación de hidrocarburos y agropecuario en la Orinoquía, el cluster 4 conformado por Bogotá que centraliza buena parte de las Actividades de los sectores secundario y terciario de la economía, y el cluster 3 que basa su desarrollo alrededor de la actividad Agropecuaria, el Comercio y los Servicios del Gobierno.
En el análisis exploratorio de los datos se caracterizaron las actividades económicas y se identificaron los principales actores en ellas. Se encontró a Bogotá como generador de datos ‘atípicos’ para el análisis en cuanto muestra registros de desempeño superior. Se consideró pertinente mantenerla luego del análisis de correlaciones y del análisis de su impacto en la estructura de las Componentes Principales. Se identificaron los mejores actores en las diferentes Actividades Económicas.
Las estructuras latentes halladas (Componentes Principales) revelaron 3 componentes que recogen el 82% de la varianza y que representan en su orden, de mayor a menor, la fuerza explicativa en cuanto a la capacidad de generación de riqueza de los departamentos, manifestados a través de sus coeficientes:
PC1: el contraste entre el agregado de los sectores secundario y terciario (-) vs el sector primario (+).
PC2: el contraste entre el agregado de los sectores primario y secundario (-) vs el sector terciario (+).
PC3: el contraste entre el agregado de los sectores primario y terciario (-) vs el sector secundario (+).
Se presenta el ranking de los departamentos asociados a las Componentes Principales halladas, evidenciándose cuales apalancan su desarrollo frente a cada uno de los sectores primario, terciario y secundario de la economía y los diferentes agregados entre estos.
En los mapas de Componentes Principales, se caracterizan los departamentos solicitados en cuanto a su estructura del PIB per cápita ubicando los principales tensores asociados que halan su economía, siendo valiosos en cuanto representan la ventaja para quienes han ganado una posición de privilegio en el mapa (en cuanto a desarrollo), pero a su vez una oportunidad para los departamentos con menor desempeño para establecer planes de acción asociados al fortalecimiento de sus líneas de interés hacia el futuro.
Se encuentra que el componente principal PC1 es un buen estimador de los impuestos de los departamentos, exceptuando Santander y Bogotá.
Se establecen cuatro agrupaciones (clusters) con similitud en cuanto a su estructura de generación de valor agregado a la economía, conformando uno de ellos los departamentos de Antioquia, Valle, Santander, Cundinamarca, Boyacá, Caldas, Risaralda, Bolivar y Atlántico, otro los departamentos de Arauca, Meta y Casanare, otro Bogotá y el último el resto de departamentos del país.
Se presentan las características asociadas de cada cluster que permiten, dada su similitud en cuanto a su estructura de generación de valor, promover el desarrollo de las fortalezas encontradas como polos de desarrollo y establecer planes frente a las oportunidades de mejora para cada grupo de departamentos.