El Producto Interno Bruto (PIB) es una magnitud macroeconómica que expresa el valor monetario del acumulado de producción de bienes y servicios de demanda final en una población durante un perÃodo determinado de tiempo, regularmente un año o periodo fiscal. En Colombia, la medición del PIB es realizada por el Departamento Administrativo Nacional de EstadÃstica (DANE), quien considera 12 grandes agrupaciones para las ramas de la actividad económica en el paÃs + el rubro de generación de impuestos (13 agrupaciones en total). La hoja de datos PIBpc.xlsx contiene, para el año 2018, la medición del PIB percapita (Cociente entre el PIB y el número de habitantes), medido en miles de millones de pesos, para las 33 unidades administrativas en que se divide Colombia el año 2018: 32 departamentos y el distrito capital, Bogotá. Las diferencias en la ubicación geográfica, la variedad de los recursos naturales, aspectos culturales y de tamaño de población, pueden generar heterogeneidad en las fortalezas productivas de los departamentos. A través del Análisis de Componentes Principales, y siguiendo la metodologÃa estudiada en clase, se espera que usted:
Análisis Exploratorio de Datos. a. Realice un análisis exploratorio previo de los datos disponible, haciendo énfasis en la estructura de correlación entre las variables de productividad económica.
Análisis de Componentes Principales b. Identifique, seleccione e interprete las estructuras latentes (Componentes Prinicipales) que caracterizan las capacidades de generación de riqueza de los departamentos en Colombia. (Recuerde manejar adecuadamente los puntos influyentes) c. Proyecte la productividad de los departamentos en el espacio de las componentes principales y genere un ranking de los departamentos en función de su capacidad productiva en cada una de las componentes.
Cluster e. Utilice las puntuaciones de las componentes prinicipales para sugerir al gobierno nacional una agrupación de departamentos con similaridad en su estructura de generación en valor agregado. f. Utilice herramientas de visualización para describir de forma sintetica las caracteristicas globales de los grupos de departamentos sugeridos. Presente sus resultados en un informe sintetico (no más de 10 paginas), desarrollado en Rmarkdown. Este informe debe ser publicado en su cuenta personal del espacio Rpubs.
En el campus virtual ud debe subir dos archivos: i. Archivo .txt que contiene un enlace web a su informe escrito, públicamente expuesto en Rpubs.
| Agro | Mineria | Manuf. | Ener_Amb | Const | CioTranHot | Comuni | Banca | Inmob | SerTecAdmon | Def_Sal_Soc | Art_Ent | Impuestos | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Promedio | 1346.9318 | 1594.480 | 1171.266 | 357.9634 | 995.7049 | 2594.859 | 270.2870 | 399.6166 | 881.7689 | 627.2299 | 2432.517 | 237.3464 | 985.1726 |
| Desviación | 883.3721 | 3536.736 | 1237.353 | 293.8338 | 440.3262 | 2212.833 | 250.3212 | 447.5017 | 758.3465 | 604.3944 | 470.116 | 211.9631 | 906.9910 |
Se puede observar que hay puntos influyentes y se procede a identificarlos:
| Valores Maximos | Departamento | |
|---|---|---|
| Agro | 3666.05 | Casanare |
| Mineria | 14689.72 | Casanare |
| Manuf. | 4515.76 | Santander |
| Ener_Amb | 1080.11 | Boyaca |
| Const | 2254.68 | Santander |
| CioTranHot | 13094.26 | San Andres |
| Comuni | 1321.44 | Bogota D.C. |
| Banca | 2615.99 | Bogota D.C. |
| Inmob | 4023.52 | Bogota D.C. |
| SerTecAdmon | 2641.69 | Bogota D.C. |
| Def_Sal_Soc | 4481.69 | Bogota D.C. |
| Art_Ent | 1218.86 | Bogota D.C. |
| Impuestos | 4443.09 | Santander |
Se puede observar que Bogota es un punto influyente ya que su ausencia afecta las correlaciones de algunas de las variables de manera importante. Se procede a eliminar ahora las observaciones correspondientes a los departamentos que se identifican como influyentes tambien.
Nuevamente se observa que hay un punto que tiene una fuerte influencia en los datos en la segunda variable (Mineria) que corresponde al Meta, y el punto de alta influencia en Comercio y Hoteleria es San Andres. Sin embargo estos dos puntos no se eliminan con el fin de poder dejar representantes importantes de este tipo de sectores en el conjunto de datos para identificar mejor las estructuras latentes y tener una cantidad de datos representativa.
Se puede evidenciar que el comportamiento de la matriz al eliminar el distrito capital, Santander y Casanare, genera un cambio importante en las correlaciones. Este grafico muestra los coeficientes de correlacion con un nivel de significancia de 0.05. Al ser puntos atipicos en algunos casos disminuye la variacion explicada y en el caso de que sean puntos influyentes pueden generar bajas correlaciones. Esto ocurre por ejemplo en Casanare en el caso de la explotacion minera, Santander en el tema de impuestos, Bogota en las variables asociadas a servicio y gobierno. Esta claro que el Casanare por la explotacion petrolera y la baja poblacion el indice PIB per capita en estos departamentos muestran un comportamiento muy distinto al de los demas. En el caso de santander habria que revisar un poco mas a fondo la causa de que este departamento este teniendo impuestos mayores al igual que la industria manufacturera, que podria deberse a las refinerias en Barrancabermeja.Todas estas hipotesis deben verificarse con la disponibilidad de datos complementarios. Se observa que la variable administracion publica no esta correlacionada con las demas, al igual que las variables de Agricultura y Mineria, despues de realizar las depuraciones y trabajar con el nivel de significancia de 0.05.
| Departamento | PC1 | PC2 | PC3 |
|---|---|---|---|
| Amaz | 28 | 5 | 11 |
| Anti | 3 | 15 | 21 |
| Arau | 26 | 30 | 3 |
| Atla | 5 | 8 | 33 |
| Bogo | 1 | 1 | 6 |
| Boli | 10 | 9 | 15 |
| Boya | 7 | 28 | 7 |
| Cald | 9 | 22 | 28 |
| Caqu | 23 | 10 | 13 |
| Casa | 16 | 32 | 1 |
| Cauc | 17 | 26 | 27 |
| Cesa | 20 | 25 | 10 |
| Choc | 32 | 16 | 23 |
| Cord | 19 | 17 | 32 |
| Cund | 6 | 31 | 14 |
| Guai | 30 | 7 | 17 |
| Guav | 29 | 4 | 8 |
| Huil | 15 | 27 | 12 |
| La G | 25 | 23 | 20 |
| Magd | 21 | 14 | 22 |
| Meta | 14 | 33 | 2 |
| Nari | 24 | 18 | 26 |
| Nort | 18 | 19 | 31 |
| Putu | 27 | 13 | 18 |
| Quin | 13 | 21 | 16 |
| Risa | 8 | 11 | 29 |
| San | 11 | 2 | 4 |
| Sant | 2 | 20 | 5 |
| Sucr | 22 | 12 | 25 |
| Toli | 12 | 24 | 9 |
| Vall | 4 | 6 | 24 |
| Vaup | 33 | 3 | 19 |
| Vich | 31 | 29 | 30 |
| PC1 | PC2 | PC3 | |
|---|---|---|---|
| Agro | 0.016 | -0.484 | 0.459 |
| Mineria | -0.025 | -0.327 | 0.577 |
| Manuf. | 0.331 | -0.141 | -0.126 |
| Ener_Amb | 0.311 | -0.111 | -0.015 |
| Const | 0.251 | -0.226 | 0.209 |
| CioTranHot | 0.152 | 0.509 | 0.371 |
| Comuni | 0.359 | -0.052 | 0.002 |
| Banca | 0.336 | 0.166 | 0.068 |
| Inmob | 0.331 | 0.066 | 0.032 |
| SerTecAdmon | 0.363 | 0.018 | -0.078 |
| Def_Sal_Soc | -0.056 | 0.519 | 0.415 |
| Art_Ent | 0.312 | -0.043 | -0.249 |
| Impuestos | 0.352 | 0.105 | 0.114 |
| Variabilidad_Expl (%) | 54.202 | 68.041 | 79.568 |
| Top_PC1 | Top_PC2 | Top_PC3 |
|---|---|---|
| Bogo | Bogo | Casa |
| Sant | San | Meta |
| Anti | Vaup | Arau |
| Vall | Guav | San |
| Atla | Amaz | Sant |
Se construye el modelo de componentes principales dejando solo tres estructuras latentes, ya que con estas se explica el 79,58% de la variabilidad. Estas estructuras latentes se pueden describir de la siguiente manera:
El primer componente se puede interpretar como el aporte de las sectores secundarios y terciarios al PIB per capita. Esto incluye tambien impuestos. Las actividades primarias prcaticamente no tienen aporte en este componente. El segundo componente se puede muestra el contraste de las actividades terciarias, y servicios asociados al estado (Salud, seguridad, sociales) contra las actividades primarias (Agro y mineria), las demas variables no tienen una influencia importante en este componente. El tercer componente muestra el aporte de las actividades primarias y algunas secundarias y terciarias que pueden estar asociadas a estas actividades. Por ejemplo el transporte, o la construccion que puede ser importante en la mineria. Adicionalmente estan tambien los servicios del estado de salud, seguridad, y sociales, ya que usualmente en los departamentos donde la actividad principal es primaria estos tienen muchos apoyos estatales.
Al revisar los cinco primeros deparatmentos en cada componenete se puede evidenciar como los departamentos del Atlantico, Valle, Antioquia santander y Bogota sobresalen en el primer componente, que es el asociado a actividades secundarias y terciarias. En el segundo componente aparecen departamentos con un fuerte componente terciario pero ademas con aportes del estado debido a sus actividades de seguridad, salud, y servicios sociales. En este caso sobresale Bogota, por tener un fuerte componente terciariuo, pero ademas un fuerte componente estatal, al ser la capital del pais, y tener la mayor inversion por consiguiente en seguridad, social, y fuerte componente en impuestos. Por otro lado aparece tambien SanANdres por el turismo y aportes estatales por ser un importante empleador, al igual que en Amazonas, Vaupes y Guaviare. Por ultimo vemos en el tercer componente como departamentos como Casanare, Meta y Arauca estan presentes en las primeras posiciones por su aporte por la mineria y agro.
| Departamento | 4-Clusters | 5-Clusters |
|---|---|---|
| Anti | 1 | 1 |
| Atla | 1 | 3 |
| Boli | 1 | 3 |
| Boya | 1 | 3 |
| Cald | 1 | 3 |
| Caqu | 3 | 5 |
| Cauc | 3 | 5 |
| Cesa | 3 | 5 |
| Cord | 3 | 5 |
| Cund | 1 | 3 |
| Choc | 3 | 5 |
| Huil | 3 | 3 |
| La G | 3 | 5 |
| Magd | 3 | 5 |
| Meta | 4 | 4 |
| Nari | 3 | 5 |
| Nort | 3 | 5 |
| Quin | 1 | 3 |
| Risa | 1 | 3 |
| Sucr | 3 | 5 |
| Toli | 1 | 3 |
| Vall | 1 | 1 |
| Arau | 4 | 4 |
| Putu | 3 | 5 |
| San | 1 | 3 |
| Amaz | 3 | 5 |
| Guai | 3 | 5 |
| Guav | 3 | 5 |
| Vaup | 3 | 5 |
| Vich | 3 | 5 |
| Bogo | 2 | 2 |
| Casa | 4 | 4 |
| Sant | 1 | 1 |
| Departamento | PC1 | PC2 | PC3 |
|---|---|---|---|
| Anti | 3 | 15 | 21 |
| Arau | 26 | 30 | 3 |
| Bogo | 1 | 1 | 6 |
| Casa | 16 | 32 | 1 |
| Choc | 32 | 16 | 23 |
| San | 11 | 2 | 4 |
| Vall | 4 | 6 | 24 |
| Vaup | 33 | 3 | 19 |
| Departamento | Agro | Mineria | Manuf. | Ener_Amb | Const | CioTranHot | Comuni | Banca | Inmob | SerTecAdmon | Def_Sal_Soc | Art_Ent | Impuestos |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Anti | 20 | 14 | 3 | 4 | 3 | 8 | 3 | 2 | 4 | 3 | 24 | 2 | 5 |
| Bogo | 33 | 23 | 5 | 7 | 5 | 2 | 1 | 1 | 1 | 1 | 1 | 1 | 2 |
| Choc | 17 | 10 | 31 | 28 | 33 | 32 | 27 | 31 | 33 | 33 | 21 | 30 | 32 |
| Vall | 21 | 27 | 4 | 6 | 19 | 7 | 4 | 3 | 2 | 2 | 15 | 4 | 3 |
| Arau | 2 | 3 | 19 | 25 | 25 | 19 | 25 | 20 | 21 | 26 | 8 | 29 | 20 |
| Casa | 1 | 1 | 14 | 10 | 14 | 3 | 20 | 10 | 13 | 19 | 14 | 26 | 11 |
| San | 31 | 31 | 23 | 13 | 27 | 1 | 13 | 6 | 8 | 11 | 2 | 25 | 6 |
| Vaup | 29 | 30 | 33 | 32 | 26 | 23 | 33 | 33 | 30 | 30 | 4 | 31 | 31 |
Al revisar el grafico de los clusters se evidencia que por el metodo del
codo la mejor cantidad de clusters a usar es cuatro. Se usan dieferentes
vistas de estos 4 clusters usando diferentes combinaciones entre las
tres principales estructuras latentes. Se puede observar que Bogota
tiene una fuerte diferencia en el PIB per capita, alejandose por mucho
de los demas departamentos en el primer componente principal. El segundo
cluster esta formado por departamentos con una mezcla de actividades
secundarias y terciarias importantes. El tercer cluster esta formado con
deparatemntos rezagados en las actividades secundarias, y terciarias,
con presencia de actividades primarias y apoyo estatal. Y el utltimo
cluster es los deparatmentos muy fuertes en actividades primarias. Es
muy importante aclarar que estas conclusiones son asociadas al PIB
percapita y no al PIB nominal. De manera final se puede concluir
que:
En relacion con Bogota se puede concluir que esta muy enfocada en el sector terciario de la economia, donde es la primera en estos rubros, por otro lado tiene una posicion fuerte en el sector secundario y es de las ultimas en las actividades primarias. Esto va acorde con ser la numero uno en los componentes 1 y 2. En el tercer componente esta mas abajo y lo que la mantienes en un aposicion buenta en este componente es el hecho de los ingresos por impuestos, y seguridad, salud y social, esto se puede deber que al ser la capital muchos empresas tienen sus casa matriz en esta ciudad, y adicionalmente el estado hace inversiones importantes en salud, seguridad, y el aspecto social por estar muchos aspectos centralizaddos en la misma.
Por otro lado Casanare tiene una estructura en la que es muy fuerte en actividades primarias, tanto en mineria y agro. Esto se refleja al ser el primer departamento en el tercer componente, estando rezagado en el primer y segundo componente. Especificament en el tercero es casi el ultimo departamento. LO cual indica que esta en proceso de industrializacion incipiente, pero aun lejos de lograr actividades terciarias importantes.
En el caso de Arauca, presenta una situacion mjy parecida a la de Casanare, siendo muy fuertes en actividades primarias, tanto agro como mineria y estando rezagados en actividades secundarias y terciarias. En el caso de Arauca esta aun mas rezagado en industrializacion (Actividades ecundarias) que el meta.
Por otro lado Choco es un departamento que se soporta mucho tambien en actividades primarias, en donde no es tan fuerte como Arauca o Casanare. Es un deparatmento que se soporta mucho en actividades dependientes del estado.
Por otro lado San Andres, tiene una fuerte participacion de actividades terciarias, como Banca, turismo, entre otros. De igual manera tambien en actividades asociadas a inversion estatal. Es por esto que es de las primeras en el segundo componente, y tiene posiciones intermedias en el primero, al tener buen desempeno en las terciarias, y en el tercer componente debido a las actividades de aistencia estatal e impuestos.
En relacion con Valle y Antioquia se observa un comportamiento muy similar en los dos departamentos. Son departamentos muy industrializados, con actividades primarias y de servicios tambien. Su principal diferencia radica en que Antioquia tiene mas fortaleza en el sector construccion, y mineria. Y valle es mas fuerte en servicios. Estas caracteristicas las diferencian un poco en los componentes 2 y tres. En el primer componente son paracticamente iguales.
Por ultimo esta Vaupes, que de manera similar a Choco tiene un bajo desarrollo en los diferentes sectores economicos, muy dependientes de actividades impulsadas de manera estatal e incluso actividades primarias como agro y mineria que a diferencia de Choco esta muy pobremente desarrollada.