El Producto Interno Bruto (PIB) es una magnitud macroeconómica que expresa el valor monetario del acumulado de producción de bienes y servicios de demanda final en una población durante un período determinado de tiempo, regularmente un año o periodo fiscal. En Colombia, la medición del PIB es realizada por el Departamento Administrativo Nacional de Estadística (DANE), quien considera 12 grandes agrupaciones para las ramas de la actividad económica en el país + el rubro de generación de impuestos (13 agrupaciones en total). La hoja de datos PIBpc.xlsx contiene, para el año 2018, la medición del PIB percapita (Cociente entre el PIB y el número de habitantes), medido en miles de millones de pesos, para las 33 unidades administrativas en que se divide Colombia el año 2018: 32 departamentos y el distrito capital, Bogotá. Las diferencias en la ubicación geográfica, la variedad de los recursos naturales, aspectos culturales y de tamaño de población, pueden generar heterogeneidad en las fortalezas productivas de los departamentos. A través del Análisis de Componentes Principales, y siguiendo la metodología estudiada en clase, se espera que usted:

Análisis Exploratorio de Datos. a. Realice un análisis exploratorio previo de los datos disponible, haciendo énfasis en la estructura de correlación entre las variables de productividad económica.

Análisis de Componentes Principales b. Identifique, seleccione e interprete las estructuras latentes (Componentes Prinicipales) que caracterizan las capacidades de generación de riqueza de los departamentos en Colombia. (Recuerde manejar adecuadamente los puntos influyentes) c. Proyecte la productividad de los departamentos en el espacio de las componentes principales y genere un ranking de los departamentos en función de su capacidad productiva en cada una de las componentes.

  1. Utilizando los resultados de la proyección de departamentos y variables en el espacio de las componentes (biplot), genere una caracterización de la estrutura del PIB de los siguientes departamentos: Casanare, Arauca, Bogota, San Andrés, Valle del Cauca, Antioquia,Choco, Vaupes.

Cluster e. Utilice las puntuaciones de las componentes prinicipales para sugerir al gobierno nacional una agrupación de departamentos con similaridad en su estructura de generación en valor agregado. f. Utilice herramientas de visualización para describir de forma sintetica las caracteristicas globales de los grupos de departamentos sugeridos. Presente sus resultados en un informe sintetico (no más de 10 paginas), desarrollado en Rmarkdown. Este informe debe ser publicado en su cuenta personal del espacio Rpubs.

En el campus virtual ud debe subir dos archivos: i. Archivo .txt que contiene un enlace web a su informe escrito, públicamente expuesto en Rpubs.

  1. Script Rmarkdown con el código desarrollado para generar el informe.

Analisis exploratorio de datos

Resumen variables consideradas en PIB per capita en miles de pesos
Agro Mineria Manuf. Ener_Amb Const CioTranHot Comuni Banca Inmob SerTecAdmon Def_Sal_Soc Art_Ent Impuestos
Promedio 1346.9318 1594.480 1171.266 357.9634 995.7049 2594.859 270.2870 399.6166 881.7689 627.2299 2432.517 237.3464 985.1726
Desviación 883.3721 3536.736 1237.353 293.8338 440.3262 2212.833 250.3212 447.5017 758.3465 604.3944 470.116 211.9631 906.9910

Se puede observar que hay puntos influyentes y se procede a identificarlos:

Valores Maximos y departamentos en cada variable
Valores Maximos Departamento
Agro 3666.05 Casanare
Mineria 14689.72 Casanare
Manuf. 4515.76 Santander
Ener_Amb 1080.11 Boyaca
Const 2254.68 Santander
CioTranHot 13094.26 San Andres
Comuni 1321.44 Bogota D.C.
Banca 2615.99 Bogota D.C.
Inmob 4023.52 Bogota D.C.
SerTecAdmon 2641.69 Bogota D.C.
Def_Sal_Soc 4481.69 Bogota D.C.
Art_Ent 1218.86 Bogota D.C.
Impuestos 4443.09 Santander

Se puede observar que Bogota es un punto influyente ya que su ausencia afecta las correlaciones de algunas de las variables de manera importante. Se procede a eliminar ahora las observaciones correspondientes a los departamentos que se identifican como influyentes tambien.

Nuevamente se observa que hay un punto que tiene una fuerte influencia en los datos en la segunda variable (Mineria) que corresponde al Meta, y el punto de alta influencia en Comercio y Hoteleria es San Andres. Sin embargo estos dos puntos no se eliminan con el fin de poder dejar representantes importantes de este tipo de sectores en el conjunto de datos para identificar mejor las estructuras latentes y tener una cantidad de datos representativa.

Se puede evidenciar que el comportamiento de la matriz al eliminar el distrito capital, Santander y Casanare, genera un cambio importante en las correlaciones. Este grafico muestra los coeficientes de correlacion con un nivel de significancia de 0.05. Al ser puntos atipicos en algunos casos disminuye la variacion explicada y en el caso de que sean puntos influyentes pueden generar bajas correlaciones. Esto ocurre por ejemplo en Casanare en el caso de la explotacion minera, Santander en el tema de impuestos, Bogota en las variables asociadas a servicio y gobierno. Esta claro que el Casanare por la explotacion petrolera y la baja poblacion el indice PIB per capita en estos departamentos muestran un comportamiento muy distinto al de los demas. En el caso de santander habria que revisar un poco mas a fondo la causa de que este departamento este teniendo impuestos mayores al igual que la industria manufacturera, que podria deberse a las refinerias en Barrancabermeja.Todas estas hipotesis deben verificarse con la disponibilidad de datos complementarios. Se observa que la variable administracion publica no esta correlacionada con las demas, al igual que las variables de Agricultura y Mineria, despues de realizar las depuraciones y trabajar con el nivel de significancia de 0.05.

Analisis de Componentes principales

Ranking departamentos en cada estructura latente
Departamento PC1 PC2 PC3
Amaz 28 5 11
Anti 3 15 21
Arau 26 30 3
Atla 5 8 33
Bogo 1 1 6
Boli 10 9 15
Boya 7 28 7
Cald 9 22 28
Caqu 23 10 13
Casa 16 32 1
Cauc 17 26 27
Cesa 20 25 10
Choc 32 16 23
Cord 19 17 32
Cund 6 31 14
Guai 30 7 17
Guav 29 4 8
Huil 15 27 12
La G 25 23 20
Magd 21 14 22
Meta 14 33 2
Nari 24 18 26
Nort 18 19 31
Putu 27 13 18
Quin 13 21 16
Risa 8 11 29
San 11 2 4
Sant 2 20 5
Sucr 22 12 25
Toli 12 24 9
Vall 4 6 24
Vaup 33 3 19
Vich 31 29 30
Componentes Principales y variabilidad explicada
PC1 PC2 PC3
Agro 0.016 -0.484 0.459
Mineria -0.025 -0.327 0.577
Manuf. 0.331 -0.141 -0.126
Ener_Amb 0.311 -0.111 -0.015
Const 0.251 -0.226 0.209
CioTranHot 0.152 0.509 0.371
Comuni 0.359 -0.052 0.002
Banca 0.336 0.166 0.068
Inmob 0.331 0.066 0.032
SerTecAdmon 0.363 0.018 -0.078
Def_Sal_Soc -0.056 0.519 0.415
Art_Ent 0.312 -0.043 -0.249
Impuestos 0.352 0.105 0.114
Variabilidad_Expl (%) 54.202 68.041 79.568
TOP 5 departamentos por estructura latente
Top_PC1 Top_PC2 Top_PC3
Bogo Bogo Casa
Sant San Meta
Anti Vaup Arau
Vall Guav San
Atla Amaz Sant

Se construye el modelo de componentes principales dejando solo tres estructuras latentes, ya que con estas se explica el 79,58% de la variabilidad. Estas estructuras latentes se pueden describir de la siguiente manera:

El primer componente se puede interpretar como el aporte de las sectores secundarios y terciarios al PIB per capita. Esto incluye tambien impuestos. Las actividades primarias prcaticamente no tienen aporte en este componente. El segundo componente se puede muestra el contraste de las actividades terciarias, y servicios asociados al estado (Salud, seguridad, sociales) contra las actividades primarias (Agro y mineria), las demas variables no tienen una influencia importante en este componente. El tercer componente muestra el aporte de las actividades primarias y algunas secundarias y terciarias que pueden estar asociadas a estas actividades. Por ejemplo el transporte, o la construccion que puede ser importante en la mineria. Adicionalmente estan tambien los servicios del estado de salud, seguridad, y sociales, ya que usualmente en los departamentos donde la actividad principal es primaria estos tienen muchos apoyos estatales.

Al revisar los cinco primeros deparatmentos en cada componenete se puede evidenciar como los departamentos del Atlantico, Valle, Antioquia santander y Bogota sobresalen en el primer componente, que es el asociado a actividades secundarias y terciarias. En el segundo componente aparecen departamentos con un fuerte componente terciario pero ademas con aportes del estado debido a sus actividades de seguridad, salud, y servicios sociales. En este caso sobresale Bogota, por tener un fuerte componente terciariuo, pero ademas un fuerte componente estatal, al ser la capital del pais, y tener la mayor inversion por consiguiente en seguridad, social, y fuerte componente en impuestos. Por otro lado aparece tambien SanANdres por el turismo y aportes estatales por ser un importante empleador, al igual que en Amazonas, Vaupes y Guaviare. Por ultimo vemos en el tercer componente como departamentos como Casanare, Meta y Arauca estan presentes en las primeras posiciones por su aporte por la mineria y agro.

Agrupacion de departamentos

Departamento 4-Clusters 5-Clusters
Anti 1 1
Atla 1 3
Boli 1 3
Boya 1 3
Cald 1 3
Caqu 3 5
Cauc 3 5
Cesa 3 5
Cord 3 5
Cund 1 3
Choc 3 5
Huil 3 3
La G 3 5
Magd 3 5
Meta 4 4
Nari 3 5
Nort 3 5
Quin 1 3
Risa 1 3
Sucr 3 5
Toli 1 3
Vall 1 1
Arau 4 4
Putu 3 5
San 1 3
Amaz 3 5
Guai 3 5
Guav 3 5
Vaup 3 5
Vich 3 5
Bogo 2 2
Casa 4 4
Sant 1 1
Desempeno departamentos de interes en componentes principales
Departamento PC1 PC2 PC3
Anti 3 15 21
Arau 26 30 3
Bogo 1 1 6
Casa 16 32 1
Choc 32 16 23
San 11 2 4
Vall 4 6 24
Vaup 33 3 19
Desempeno departamentos de interes en actividades
Departamento Agro Mineria Manuf. Ener_Amb Const CioTranHot Comuni Banca Inmob SerTecAdmon Def_Sal_Soc Art_Ent Impuestos
Anti 20 14 3 4 3 8 3 2 4 3 24 2 5
Bogo 33 23 5 7 5 2 1 1 1 1 1 1 2
Choc 17 10 31 28 33 32 27 31 33 33 21 30 32
Vall 21 27 4 6 19 7 4 3 2 2 15 4 3
Arau 2 3 19 25 25 19 25 20 21 26 8 29 20
Casa 1 1 14 10 14 3 20 10 13 19 14 26 11
San 31 31 23 13 27 1 13 6 8 11 2 25 6
Vaup 29 30 33 32 26 23 33 33 30 30 4 31 31

Al revisar el grafico de los clusters se evidencia que por el metodo del codo la mejor cantidad de clusters a usar es cuatro. Se usan dieferentes vistas de estos 4 clusters usando diferentes combinaciones entre las tres principales estructuras latentes. Se puede observar que Bogota tiene una fuerte diferencia en el PIB per capita, alejandose por mucho de los demas departamentos en el primer componente principal. El segundo cluster esta formado por departamentos con una mezcla de actividades secundarias y terciarias importantes. El tercer cluster esta formado con deparatemntos rezagados en las actividades secundarias, y terciarias, con presencia de actividades primarias y apoyo estatal. Y el utltimo cluster es los deparatmentos muy fuertes en actividades primarias. Es muy importante aclarar que estas conclusiones son asociadas al PIB percapita y no al PIB nominal. De manera final se puede concluir que:

En relacion con Bogota se puede concluir que esta muy enfocada en el sector terciario de la economia, donde es la primera en estos rubros, por otro lado tiene una posicion fuerte en el sector secundario y es de las ultimas en las actividades primarias. Esto va acorde con ser la numero uno en los componentes 1 y 2. En el tercer componente esta mas abajo y lo que la mantienes en un aposicion buenta en este componente es el hecho de los ingresos por impuestos, y seguridad, salud y social, esto se puede deber que al ser la capital muchos empresas tienen sus casa matriz en esta ciudad, y adicionalmente el estado hace inversiones importantes en salud, seguridad, y el aspecto social por estar muchos aspectos centralizaddos en la misma.

Por otro lado Casanare tiene una estructura en la que es muy fuerte en actividades primarias, tanto en mineria y agro. Esto se refleja al ser el primer departamento en el tercer componente, estando rezagado en el primer y segundo componente. Especificament en el tercero es casi el ultimo departamento. LO cual indica que esta en proceso de industrializacion incipiente, pero aun lejos de lograr actividades terciarias importantes.

En el caso de Arauca, presenta una situacion mjy parecida a la de Casanare, siendo muy fuertes en actividades primarias, tanto agro como mineria y estando rezagados en actividades secundarias y terciarias. En el caso de Arauca esta aun mas rezagado en industrializacion (Actividades ecundarias) que el meta.

Por otro lado Choco es un departamento que se soporta mucho tambien en actividades primarias, en donde no es tan fuerte como Arauca o Casanare. Es un deparatmento que se soporta mucho en actividades dependientes del estado.

Por otro lado San Andres, tiene una fuerte participacion de actividades terciarias, como Banca, turismo, entre otros. De igual manera tambien en actividades asociadas a inversion estatal. Es por esto que es de las primeras en el segundo componente, y tiene posiciones intermedias en el primero, al tener buen desempeno en las terciarias, y en el tercer componente debido a las actividades de aistencia estatal e impuestos.

En relacion con Valle y Antioquia se observa un comportamiento muy similar en los dos departamentos. Son departamentos muy industrializados, con actividades primarias y de servicios tambien. Su principal diferencia radica en que Antioquia tiene mas fortaleza en el sector construccion, y mineria. Y valle es mas fuerte en servicios. Estas caracteristicas las diferencian un poco en los componentes 2 y tres. En el primer componente son paracticamente iguales.

Por ultimo esta Vaupes, que de manera similar a Choco tiene un bajo desarrollo en los diferentes sectores economicos, muy dependientes de actividades impulsadas de manera estatal e incluso actividades primarias como agro y mineria que a diferencia de Choco esta muy pobremente desarrollada.